본문 바로가기

    ADVERTISEMENT

    "LLM 비일관성 해결"…두나무, '콜링 2025'에서 기술우수성 증명

    • 공유
    • 댓글
    • 클린뷰
    • 프린트
    이동준 두나무 머신러닝팀장이 지난 21일(현지 시각) 아랍에미레이트(UAE) 아부다비 ADNEC에서 열린 ‘제31회 국제 전산언어 학술대회(COLING 2025)’ 메인 콘퍼런스에서 논문 발표를 하고 있다.  /사진=두나무
    이동준 두나무 머신러닝팀장이 지난 21일(현지 시각) 아랍에미레이트(UAE) 아부다비 ADNEC에서 열린 ‘제31회 국제 전산언어 학술대회(COLING 2025)’ 메인 콘퍼런스에서 논문 발표를 하고 있다. /사진=두나무
    블록체인 및 핀테크 전문기업 두나무는 세계 최고 수준 국제전산언어학술대회인 ‘콜링2025’ 콘퍼런스에서 본사 머신러닝(ML) 팀의 텍스트-SQL(구조화된 질의 언어) 변환 관련 연구 논문을 발표해 기술적 우수성을 입증했다고 23일 밝혔다.

    ‘콜링(COLING)’은 자연어 처리(NLP)와 전산언어학 분야에서 세계적으로 권위 있는 학회 중 하나다. 제출된 전체 논문의 30% 정도만 채택될 정도로 엄격한 기준을 자랑하는 곳이다.

    올해 콜링의 메인 콘퍼런스는 지난 1월 21일(현지 시각) 아랍에미리트(UAE) 아부다비 ADNEC(ABU Dhabi National Exhibition Centre)에서 열렸다. 이 자리에서 이동준 두나무 머신러닝 팀장은 두나무가 개발한 텍스트-SQL 변환 모델의 연구 성과를 직접 발표했다.

    이번 발표 논문의 제목은 ‘MCS-SQL:텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법(원문 논문명: MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL Generation)’이다. LLM(대규모 언어 모델) 기반의 텍스트-SQL 변환 성능을 향상하는 방법을 제안했다.

    질문 방식이나 문장 배치 순서 등에 따라 답변이 달라지는 기존 LLM의 한계를 극복했다는 분석이다. 일례로 기존 LLM은 “A와 B는 같은 뜻인가요?”와 “B와 A는 같은 뜻인가요?”라는 질문에 서로 다른 답변을 내놓는 경우가 많았다.

    두나무 머신러닝 팀은 이 문제를 해결하기 위해 다중 프롬프트 기법을 도입했다. 여러 SQL 후보를 생성한 뒤 최적의 SQL을 선택하는 방법을 제안했다. 이 방법은 기존 LLM의 정확도와 효율성을 동시에 향상할 수 있다는 연구 결과도 나왔다. 지난해 1월 텍스트-SQL 변환 측정 벤치마크인 BIRD-SQL 글로벌 리더보드에서 1위를 차지하는 등 우수성을 증명하기도 했다.

    이 팀장은 “생성형 AI와 함께 주목받는 텍스트-SQL 변환 분야에 대한 기술적 도전이 세계적으로 인정 받아 기쁘다”며 “이번 연구가 AI의 실질적 활용성을 넓히는 데 조금이나마 보탬이 됐으면 좋겠다”고 말했다.

    한편, 두나무는 업비트, 증권 플러스, 증권 플러스 비상장을 서비스하고 있다. 두나무 머신러닝 팀은 주식과 디지털 자산 시장에서 활용되는 AI 모델을 연구·개발 중이다. 지난해 11월 ‘콜링2025’에서 금융 허위 정보 탐지 챌린지(FMD) 1위를 차지하는 등 글로벌 연구 역량을 다방면으로 인정받고 있다.

    안정훈 기자 ajh6321@hankyung.com

    ADVERTISEMENT

    1. 1

      아마존, 오픈AI·엔비디아 정조준…AI 생태계 무한확장[송영찬의 실밸포커스]

      아마존이 새로운 멀티모달 인공지능(AI) 모델을 전격 공개했다. AI 챗봇에 특화된 경량형 모델부터 자사 최초의 영상 생성 AI 모델까지 제품군을 다양화한 게 특징이다. 여기에 신형 자체 AI 칩까...

    2. 2

      비상장 거래 플랫폼 특허 분쟁 전환점…"일부물량 거래, 새 기술 아냐"

      국내 비상장주식 거래 양대 플랫폼인 서울거래 비상장과 증권플러스 비상장 간 '서비스 베끼기' 논란이 전환점을 맞았다. 특허심판원이 서울거래 비상장의 특허를 무효로 판정해서다.  특허심...

    3. 3

      업스테이지, 신규 AI 문서처리 모델 공개…AWS, MS보다 5% 뛰어나

      업스테이지가 빠르게 문서를 분석해 대규모 언어 모델(LLM)로 처리가 가능한 차세대 OCR 모델을 공개했다고 17일 밝혔다. 업스테이지가 신규 공개한 OCR 모델 '도큐먼트 파스(Document Pa...

    ADVERTISEMENT

    ADVERTISEMENT