LG AI연구원이 자체 개발한 AI(인공지능) 모델 'K-엑사원'을 공개했다.
11일 LG AI연구원은 K-엑사원이 정부의 독자 AI 파운데이션 모델 프로젝트 1차 평가 기준인 13개의 벤치마크 테스트에서 전체 평균 점수 72점을 기록해 5개 정예팀 중 1위를 차지했다고 밝혔다. K-엑사원은 13개 테스트 중 10개에서 1위를 차지했다.
K-엑사원은 LG AI연구원이 지난 5년간 AI 파운데이션 모델을 직접 개발해 쌓은 기술력을 집약해 만든 모델이다.
특히 K-엑사원은 글로벌 AI 성능 평가 기관인 '아티피셜 어낼리시스'의 인텔리전스 지수 평가에서 32점을 기록해 가중치를 공개하는 '오픈 웨이트 모델' 기준 세계 7위, 국내 1위에 올랐다.
현재 오픈 웨이트 모델 글로벌 '톱 10' 가운데 국내 모델은 K-엑사원이 유일하다. 오픈 웨이트 모델 톱 10 중 6개가 중국 모델이고 나머지 3개는 미국 모델이다.
K-엑사원은 공개 직후 글로벌 오픈소스 AI 플랫폼인 '허깅 페이스'의 글로벌 모델 트렌드 순위 2위에도 올랐다.
LG AI연구원은 '고효율 저비용' 설계를 통해 K-엑사원이 고가의 인프라가 아닌 엔비디아 A100급의 그래픽처리장치(GPU) 환경에서도 구동될 수 있도록 했다고 설명했다.
또 '하이브리드 어텐션'을 고도화해 메모리 요구량과 연산량을 엑사원 4.0 대비 70% 절감했다고 LG AI연구원은 덧붙였다.
K-엑사원의 학습 어휘는 15만 개로, AI가 이해하는 단위인 '토큰'으로 문장을 쪼개는 기술인 '토크나이저' 고도화를 통해 기존 모델보다 1.3배 더 긴 문서를 기억하고 처리할 수 있다. 추론 속도는 기존 모델 대비 150% 향상됐다.
국내 AI 모델 중 가장 긴 26만 토큰(A4 문서 기준 400장 이상)의 긴 문맥을 한 번에 이해하고 처리할 수 있는 것도 K-엑사원의 강점이다.
LG AI연구원은 자체 AI윤리위원회를 통해 K-엑사원의 안전성과 신뢰성을 검증했다고 강조했다.
현재 LG AI연구원은 저작권 문제가 있는 데이터는 사전에 식별하고 제외하는 등 모든 학습 데이터에 대한 데이터 컴플라이언스 평가를 진행 중이다.
최정규 LG AI연구원 에이전틱 AI 그룹장은 "K-엑사원은 자원의 한계 속에서 독자적인 기술 설계로 글로벌 거대 모델들과 대등하게 경쟁할 수 있음을 보여준 사례"라고 자평했다.
한편, LG AI연구원은 오는 28일까지 K-엑사원 API를 무료 제공한다.