챗GPT 같은 폐쇄형 인공지능(AI)을 추격하는 ‘개방형 AI’ 진영의 반격이 본격화하고 있다. 메타에 이어 중국 최대 전자상거래 업체 알리바바도 생성형 AI의 기반이 되는 거대언어모델(LLM) 무료 공개에 가세했다.
이는 오픈AI와 구글 같은 선발주자의 LLM 기술독점에 따른 후발주자의 반격으로, 빠르게 이용자를 늘려 영향력을 키우려는 대응전략이다. 정보기술(IT) 업계에서는 당분간 폐쇄형과 개방형 AI가 서로 경합하면서 공존할 것으로 보고 있다.
14일 업계에 따르면 알리바바의 디지털 기술 부문 계열사 알리바바클라우드가 70억개 파라미터(매개변수) 규모의 LLM ‘Qwen-7B’와 ‘Qwen-7B-Chat’을 오픈소스로 지난 8일 공개했다. 중국 빅테크 기업이 LLM을 오픈소스로 공개한 것은 처음 있는 일이다. 전날에는 이미지 등을 가공하는 AI 특허 100개도 무료로 풀었다.
알리바바는 “포용적 기술을 촉진하고 보다 많은 개발자와 중소기업이 AI의 이점을 누리도록 지원하기 위해서”라고 밝혔다.
다만 월간 활성 사용자가 1억명 이상인 기업은 알리바바에게 라이선스 비용을 납부해야 한다. 이는 메타도 마찬가지다. 지난달 자체 개발한 LLM ‘라마(Llama)2’를 공개한 메타는 사용자 7억명 이상인 경우엔 라이선스 계약을 요구한다.
알리바바와 메타의 LLM성능은 GPT-3.5 수준으로 기존 폐쇄진영의 LLM보다 성능이 떨어진다. 하지만 누구나 공짜로 필요에 맞춰 연구·상업화할 수 있어 확장성이 크다. 실제 메타가 라마2를 출시한 후 이를 활용한 LLM이 쏟아지고, 학계에서도 라마2를 활용한 다양한 논문이 나오고 있다. 한국에선 스타트업 업스테이지가 라마2를 미세조정(파인튜닝)한 모델을 공개해 화제가 됐다.
업계 관계자는 “개방형 LLM은 폐쇄형보다 경량화된 모델로, 초거대 AI를 자체적으로 개발할 여력이 없는 기업들이 자신에 맞는 생성형 AI를 만드는 데 쓸 수 있다”며 “개방형 LLM을 활용한 상업 서비스가 잇따라 출시되면 빠른 이용자 확보로 영향력도 더 커질 것”이라고 말했다.
반면 챗GPT를 개발한 오픈AI는 GPT-3.5·4에 대한 구체적인 정보를 외부에 공개하지 않고 있다. 구글도 ‘팜(PaLM)2’의 기술적 정보를 완전히 공개하지 않는다. 이들은 비용 지불 등의 협의가 있을 경우에만 제한적으로 정보를 공개한다.
표면적으로는 할루시네이션(환각) 등 ‘안전한 AI 사용’을 위해 함부로 공개하는 것이 위험하다는 이유를 내세운다. 하지만 천문학적인 비용을 투입한 만큼 원천기술인 LLM을 외부에 무료로 알려줄 수 없기 때문일 거라는 게 업계의 시각이다. 이들은 API(앱 프로그래밍 인터페이스)를 유료 판매해 개발비와 운영비를 마련하고 있지만, 양사 모두 뚜렷한 수익화 모델을 만들지 못하고 있다.
국내 업체들 가운데 폐쇄형 AI를 추구하는 네이버는 실생활 등 외부에서 보다 손쉽게 이용하기 쉬운 형태(API)로 유료로 제공하는 챗GPT식 방향을, 카카오는 스타트업과의 협업을 통해 모든 LLM 모델을 공개하는 오픈형 AI 방향을 추구하고 있다.
LLM을 둘러싼 양 진영의 경쟁은 앞으로도 계속될 전망이다. 김명주 서울여대 정보보호학과 교수는 “기업용 AI 시장에서 보면 선택지가 늘어나 당분간 양 진영의 경쟁이 더 치열해질 것”이라며 “규제 등 보이지 않는 비용과 변수 등이 남아 있고 아직 시장이 성숙해지지 않아 양쪽이 경합하며 공존을 이어갈 것으로 보인다”고 말했다.