업스테이지 "솔라, 특정 분야서 'GPT4' 넘을 수 있어"

[하이퍼오토메이션 컨퍼런스] 박찬준 수석연구원, '초거대 언어모델 생태계' 주제 발표

컴퓨팅입력 :2024/05/02 17:18

"특정 목적에 맞는 특정 분야에 있어서는 '솔라(Solar)'가 오픈AI의 'GPT4'를 넘는 것도 가능하다 생각합니다."

업스테이지 박찬준 수석 연구원이 업스테이지 LLM(거대 언어모델) 팀이 개발 중인 솔라를 소개하고, LLM 기술적 배경과 실제 기업 적용 사례에 대해 설명했다.

박찬준 연구원은 지디넷코리아가 2일 서울 양재 엘타워 그레이스 홀에서 개최한 '노코드·로우코드 하이퍼오토메이션 컨퍼런스'에서 '리얼-월드(Real-World) 관점에서 바라본 초거대 언어모델 생태계'에 대해 발표했다.

업스테이지 LLM팀 박찬준 수석 연구원

업스테이지는 지난 2020년 10월 창업한 신생 기업으로 자체 LLM 솔라를 개발했다. 솔라는 지난해 12월 허깅페이스 '오픈 LLM 리더보드'에서 알리바바, 미스트랄AI 등 빅테크 모델을 제치고 1위를 차지한 SLM(경량형 언어모델)이다. 작지만 강력한 성능과 GPT-3.5 대비 2.5배 이상 빠른 속도가 특징으로, 프롬프트 당 최대 4천 토큰(어절)을 입력할 수 있다.

업스테이지는 솔라를 앞세워 미국 시장에 진출하기 위해 지난 2월 말 실리콘밸리에 현지 법인 '업스테이지AI'를 설립했다. 최근 업스테이지는 복수의 미국 업체들과 협업을 논의 중이다.

박 연구원은 "과거에는 기계 번역기나 문서 요약기나 어떤 QA 챗봇을 만들기 위해서는 각각의 테스크에 맞는 각각의 모델을 개발을 했다. 즉 이 테스크와 모델의 관계가 어떻게 보면 1 대 1의 관계였다"며 "보통 검색에 특화된 회사라든가 챗봇에 특화된 행사라든가 자연어 처리에 수많은 어떤 분야들이 있는데 각각 특화된 행사들이 있었다"고 말했다.

이어 "하지만 LLM이 나오면서 모델 한 개가 여러 개의 테스크를 처리할 수 있게 됐다. 즉 모델과 테스크의 관계가 어떻게 보면 1 대 n으로 변했다고 볼 수 있다"며 "기업 입장에서는 모델 하나만 잘 개발하면 여러 도전을 해볼 수가 있게 됐다. 업스테이지도 초고대 언어 모델을 퍼스트 무버 해야겠다라고 해서 이 사업에 뛰어들게 됐다"고 설명했다.

박 연구원은 솔라에 대한 생태계를 만들어 나가는 과정에 대해서 소개했다. 그는 "데이터에서 중요한 것 중 하나가 저작권 이슈 개인정보 이슈다. 업스테이지는 책임감 있는 LLM을 개발하기 위해서 저작권 단계부터 해결하기 위해 노력하고 있다"며 "아울러 데이터 공유 생태계를 만들기 위한 노력과 한국형 LLM의 평가 생태계를 만들기 위해 힘쓰고 있다"고 강조했다.

업스테이지는 솔라를 앞세워 금융, 법률, 온디바이스 AI 등 다양한 분야에서 성과를 내고 있다. 동남아 통신사와 기술이전 계약을 맺고 특화 LLM 구축에 나서는 등 글로벌 기업들과도 협력 사례를 만들고 있다. 여기에 국내 보험사와 협업해 문서 처리 자동화를 실현한 다큐먼트 AI 솔루션을 결합하면 해외 시장에서도 충분히 승산이 있다고 보고 있다.

관련기사

또 업스테이지는 해외 시장 개척을 위해 최근 미국 법인을 설립한 데 이어 다음달부터 '솔라'의 일본어 버전을 출시해 일본 시장 공략에도 본격 나선다. 더불어 주요 대학을 돌아다니며 현지 AI 인력 채용도 시작할 예정이다. 일본 사무소 설립도 검토를 했으나, 현재는 논의를 중단한 것으로 알려졌다.

박 연구원은 "현재 업스테이지는 솔라 기반의 B2B 생태계를 구축하고 있다"며 "충분히 튜닝을 잘 한다면 특정 분야에 있어서는 솔라가 'GPT4'를 넘을 수 있을 것으로 보고 있다"고 강조했다.