
말뭉치란 인터넷에서 검색 가능한 자료를 모아 놓은 집합체로 LLM(거대언어모델, Large Language Model)을 통해 사람처럼 설명할 수 있도록 훈련하는 데 사용된다. AI 개발은 말뭉치 수집·정제 과정 및 LLM 훈련 과정을 거친 후 사용자가 원하는 모델로 구현된다.
개발 초기 단계에서부터 활용되는 말뭉치가 최종 결과물에 큰 영향을 미치는 만큼 콘텐츠(말뭉치) 제공 기업과 개인 역량(데이터 수집 및 가공 등)에 대한 중요도도 높아지고 있다.
BC카드는 국내 금융사 중 최초로 기업정보조회업'을 획득한 것은 물론 '데이터 전문기관', '마이데이터', '개인사업자 신용평가', '가명정보 결합전문기관 지정' 등 정부 인가의 데이터 사업 5개 라이선스를 모두 보유하고 있다.
한편, 전 세계적으로 AI 패권 경쟁이 치열해지고 있는 가운데, 국내 AI 개발 경쟁력 강화에 대한 대응책 마련이 시급한 상황이다.
AI 모델 허브 플랫폼인 허깅페이스에 따르면 영어 기반의 말뭉치는 전체 비중에서 70%가량을 차지하고 있지만, 한글 말뭉치 비중은 미미한 수준인 것으로 확인됐다.
BC카드는 한글 기반의 말뭉치 규모를 확대시키기 위한 해결책으로 최근 공개된 말뭉치와 지난해 공개한 'K-금융 특화 AI' 모델을 적극 활용하는 방안을 내놨다.
BC카드 조명식 상무(BC.AI 본부장)는 "지급결제 전문 기업인 BC카드가 AI를 활용한 금융 서비스의 새로운 미래를 열기 위해 AI 업무를 전담해 수행하는 조직을 창설했다"면서, "이번에 공개한 금융특화 말뭉치를 계기로 금융권 전반은 물론 국내 AI 경쟁력이 한층 더 강화되길 바라며, 앞으로도 AI 기반의 차별화된 금융서비스를 지속적으로 선보이겠다"고 밝혔다.
유창규 글로벌에픽 기자 epic@globalepic.co.kr
<저작권자 ©GLOBALEPIC 무단 전재 및 재배포 금지>