2020년 챗GPT 3.0이 테스트 모델로 발표되고, 2022년 말경 3.5 버전을 사용자들이 실제로 사용해보면서 전 세계 사람들은 챗GPT에 열광했습니다. 필자도 직간접적으로 사용하거나 체험담을 보면서 전율을 느끼기도 했습니다. 그러나 사용함에 따라서 여러가지 부작용이 쏟아지고 있습니다. 미국 기업 'OpenAI'에서 개발한 획기적인 거대 AI의 한계를 조명해보고 우리가 나아가야 할 방향은 무엇인지 알아보도록 하겠습니다.
갑자기 문을 닫아버린 OpenAI 어떻게 된 일인가
실리콘밸리의 스타트업 기업 중 최근 뜨거운 기업이 OpenAI입니다. 제목은 마치 기업이 도산한 것처럼 표현되었지만 그렇지는 않습니다. 원래 거대 AI를 선도하는 기업은 OpenAI가 맞습니다. 그런데 이 기업은 이 기술을 독점하지 않고 공개하면서 치열한 토론을 통해 기술을 보완해 온 기업입니다. 마치 리눅스 운영체제를 전 세계 개발자들이 참여하여 만들어 온 것처럼 그들도 같은 행보를 보입니다.
그런데 이 사업이 전도유망해보이니 거대 기업의 자본이 투자됩니다. 그 중 마이크로소프트(MS)가 가장 큰 관심을 보입니다. 그 규모가 100억 달러에 달하며, 앞으로 1,000억 달러에 이를 예정이라고 합니다. 수익이 예상되므로 이제 개발보다는 비지니스의 관점으로 접근하기 시작했습니다. OpenAI는 돌연 개발 소스와 정보를 모두 차단해버립니다.
현재 사용하는 3.5버전의 서비스는 무료서비스도 있지만 그 기능이 제한적이고, 4.0 버전부터 매월 20달러를 지불하면 보다 빠르고 풍부한 자료를 제공받을 수 있다고 합니다. 본격적인 수익 실현화에 나선 OpenAI입니다.
일론 머스크도 투자했던 회사인데 왜 소송을 들먹이나
한 때 일론 머스크도 OpenAI에 투자를 했던 공동창업자입니다. 그러나 OpenAI의 비지니스 모델이 바뀌고 나서 일론 머스크는 OpenAI를 맹비난하기 시작했습니다. 일론 머스크는 챗GPT의 부정확한 답변과 할루시네이션(환상), 그리고 비윤리적인 답변으로 인해 인류를 멸망으로 몰아갈 수 있다고 경고하고 있습니다.
그리고 챗GPT가 발전하는 과정에서 자신이 운영하는 트위터의 정보를 불법적으로 학습했고, 미국의 일간지 등의 내용을 무단으로 사용하는 정황이 드러나면서 조사에 착수했다는 이야기도 덧붙입니다.
그러나 그간 일론 머스크의 코인 조작 정황 및 주식 고점 매도 등의 이력으로 보았을 때, 인류의 멸망에 대한 위기 의식이 정의감에서 표출된 것인지는 의문입니다. 일론 머스크의 입장이 바뀐 시점이 정확하게 마이크로소프트의 입김이 불기 시작한 시점과 일치하며 수익에서 배제되는 상황이 마뜩찮았을지도 모릅니다.
챗GPT는 영미권에서만 그나마 정보가 정확하다
그런데 필자는 이 포스팅의 제목을 1.0이나 아예 베타 버전이라고 주장했습니다. 그 이유는 비영미권에서의 사용 체험에 있습니다. 무료 버전의 품질은 유료보다 떨어지고, 설령 유료버전이라고 하더라도 많은 문제점이 있습니다. 우선 그 문제점을 나열해 보겠습니다.
- 질문에 대한 빠른 답변은 편리하나 그 내용을 검증해야 한다. 예를 들어 한국 어느 특정 지역의 맛집을 검색하는데, 그 지역에 없는 식당이 검색되거나 메뉴도 없는 검색 결과가 나온다. 검증시간이 더 걸린다.
- 질문이 상세할수록 정확한 답변이 나온다고 하지만, 할루시네이션이란 현상이 일어나므로 진실인지 검증하지 못한다.
- 필자가 어린이날 선물을 검색해보았는데 많은 선물 리스트를 보여주었으니 그 선물이 한국에 없다.
- 한국어를 인식하지 못한다는 것은 영미권에 비해 유료서비스의 질적인 면에서 떨어진다. 즉 문화와 사회통념 등을 영어로 모두 표현할 수 없다.
- 위 4가지의 문제점을 총평하면 한국의 상황을 전혀 고려하지 않은 검색 결과들이 제공되므로 유료서비스의 가치를 다하지 못한다.
이 같은 문제점은 예견된 문제점입니다. 만약 미국에서 이 서비스를 사용한다면 아주 만족도가 높을 것입니다. 그 사람들의 문화, 정치, 역사 등 모든 정보가 라벨링되어 그들의 언어에 맞게 최적화되어 있을 것이기 때문에 필자가 만약 미국인이었다면 당연히 유료서비스를 선택하였을 것입니다.
그러나 이곳은 한국입니다. 한국어라는 장벽이 그들의 서비스에 최적화되어 있지도 않으며, 만약 적용을 시켜준다고 해도 그들이 이해하지 못하는 한국어는 초성, 중성, 종성별로 인식할 것입니다. 예를 들어 미국의 경우 영어의 관용구 'piece of cake'는 무려 11자의 글자이지만 자주 쓰는 단어이므로 하나로 인식하나, 우리나라의 경우 '쉬운 일이야'는 5글자로 인식해야 하거나 초,중,종성별로 인식하면 무려 13글자로 인식해 몇 배나 되는 소스를 사용해야 할 것입니다.
그래서 챗GPT가 제공해주는 정보의 양은 미국보다 몇 배나 작은 양에 국한될 수 밖에 없는 것입니다. 만약 한자를 쓰는 일본이나 중국의 경우엔 어떨까요? 아랍어라면 또 어떻게 될까요? 영어에 비해 많은 소스를 사용하게 되므로 그들은 비영어권에 더 많은 비용을 청구하게 될 것입니다.
각국에서 대표하는 AI여야 정보가 정확하다
대한민국에는 한국형 AI가 개발되어야 합니다. 한국의 정서, 문화, 정치, 역사가 정확히 라벨링된 데이터가 필요하고, 위에서 언급한 소스사용 문제도 어느 나라 개발자가 관여를 해야 최적화 비지니스 모델이 나오느냐 하는 문제로 귀결됩니다. 결론은 한국의 정보는 한국인이 가장 잘 알 것이며, 프로그래밍과 개발기준도 한국인의 기준에서 개발된다면 문제될 것이 없습니다.
'콩심은데 콩나고 팥심은데 팥난다'를 한 소스로 인식하게 한다면 보다 빠른 속도와 적은 비용으로 서비스 제공이 가능하다는 것입니다.
현재 한국에서는 네이버 산하 '하이퍼클로바'라는 부서에서 주도하며 개발중이며 곧 한국인에게 맞는 서비스를 제공하리라 기대합니다. 결국 거대 AI산업은 각국에 맞는 AI가 개발되어져야 하는 것이 필수입니다. 그래서 필자는 챗GPT가 아직도 1.0이나 베타버전이라고 말하는 것입니다. 각국에 맞는 AI가 개발된다면 그 때부터 최적화되어 상용화되는 정식 버전의 상품이 나오는 것이라고 말할 수 있을 것입니다.
'산업 분석 > IT' 카테고리의 다른 글
구글은 왜 AR 글래스 사업을 포기했나 (0) | 2023.04.05 |
---|
댓글