그는 성공 확률을 고려하지 말고 위험을 감수해야 한계까지 능력을 발휘할 수 있다고 덧붙였다.
송 회장은 연구 환경 조성과 인재 양성에 진심을 보이고 있으며, 기술 혁신을 지속하기 위해 도전할 수 있는 환경이 필수적이라고 밝혔다.
그는 2021년 8월 서울대학교 발전기금 기탁 당시 "젊은 인재들의 성공 창업의 꿈을 실현하는 데 마중물이 되길 바란다"고 언급하며 후학 양성에 대한 지원 의지를 밝혔다.
이동준 두나무 머신러닝팀장은 아랍에미리트(UAE) 아부다비의 ADNEC(Abu Dhabi National Exhibition Centre)에서 열린 올해 콜링 메인 콘퍼런스에서 두나무가 개발한 텍스트-SQL 변환 모델의 연구 성과를 직접 발표했다. 발표된 논문의 제목은 ‘MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법’으로, 해당 논문은 LLM(대규모 언어 모델) 기반의 텍스트-SQL 변환 성능을 향상시키는 방법을 제시했다.
기존 LLM은 질문 방식이나 문장 배치 순서 등에 따라 답변이 일관되지 않게 출력되는 한계를 갖고 있었다. 예를 들어 “A와 B는 같은 뜻인가요?”와 “B와 A는 같은 뜻인가요?”라는 문장이 사실상 동일한 질문임에도 불구하고 다른 답변을 내놓는 경우가 발생했다. 이러한 문제를 해결하기 위해 두나무 머신러닝팀은 다중 프롬프트 기법을 도입해 여러 SQL 후보를 생성한 뒤 최적의 SQL을 선택하는 방법을 제안했다. 이 기법은 기존 LLM의 정확도와 효율성을 동시에 향상시켰다는 연구 결과를 도출했으며, 2024년 1월 텍스트-SQL 변환 측정 벤치마크인 BIRD-SQL 글로벌 리더보드에서 1위를 기록하며 기술력을 인정받았다.
두나무 머신러닝팀은 2024년 11월 '콜링2025'에서 금융 허위정보 탐지 챌린지(FMD)에서 1위를 차지했다. FMD 챌린지는 금융 데이터에서 허위 정보를 탐지해 정확한 분석을 제공하는 기술력을 평가하는 과제로, 미디어를 통해 확산되는 금융 관련 허위 정보의 심각성을 해결하기 위해 마련되었다.
두나무 머신러닝팀은 대규모 언어 모델(LLM)을 활용해 허위 정보를 탐지하는 정확도인 F1을 비롯해 허위 정보 판별 근거를 평가하는 로그(ROUGE) 등 모든 지표에서 가장 우수한 성적을 거두어 리더보드 1위를 차지했다. 특히, 챗 GPT 등 상용화된 대규모 언어 모델을 사용하지 않고, 오픈소스 LLM을 직접 개조해 1위를 달성한 점이 주목할 만하다.
금융 시장에서 잘못된 정보가 확산될 경우 투자자의 판단을 흐릴 수 있어 이를 사전에 차단하는 능력은 중요한 연구 주제로 떠오르고 있다. 또한 AI가 잘못된 정보를 생성하는 할루시네이션(Hallucination) 문제와도 연결되어 FMD 챌린지는 최근 세계적으로 주목받는 연구 분야로 자리 잡고 있다.
[글로벌에픽 황성수 CP / hss@globalepic.co.kr]
<저작권자 ©GLOBALEPIC 무단 전재 및 재배포 금지>