'더 똑똑해진' GPT-4 등장…생성AI 시장 경쟁 나날이 격화
2023-03-15 20:24
오픈AI 전날 14일(현지시간) GPT-4 선봬
한국어 능력 대폭 향상…수학 지식도↑
SKT·네이버 등 업체 초거대 AI 개발에 사활
한국어 능력 대폭 향상…수학 지식도↑
SKT·네이버 등 업체 초거대 AI 개발에 사활
인공지능(AI) 챗봇 '챗GPT'로 최근 급격히 성장한 '생성AI' 시장에서 기업들의 주도권 경쟁이 격화하고 있다. 챗GPT 개발사 오픈AI가 현재 선두주자로 두각을 나타내는 가운데 구글·메타 등 해외 빅테크들도 생성AI 시장에 본격적으로 발을 들였다.
국내 IT업체들도 시장 공략에 속도를 내는 상황이다. SK텔레콤(SKT)·KT·LG유플러스 등 통신사와 네이버·카카오 등 포털업체 등이 핵심 주자다. 이들 업체는 초거대 언어모델 기반 AI 챗봇 서비스를 개발하거나 고도화하는 데 집중하고 있다.
15일 업계에 따르면 오픈AI는 전날 차세대 자연어처리(NLP) 모델인 GPT-4를 공개했다. GPT-4는 챗GPT의 근본 기술인 GPT-3.5와 비교해 AI의 언어 생성 능력이 15% 이상 향상됐다. 영어로만 제대로 된 답변을 하던 GPT-3.5와 달리 한국어를 포함한 27개 언어로 자연스러운 답변을 하는 것이 특징이다.
오픈AI가 이러한 기술 역량 강화로 빠르게 시장 선두 굳히기에 나서자 국내 기업들 발등에도 불이 떨어졌다. 이젠 한국어 특화를 강점으로 내세우는 것만으로는 시장 경쟁력 확보가 어려워질 전망이기 때문이다. 더 차별화된 서비스로 이용자의 마음을 사로잡는 것이 핵심 과제로 부상했다.
◆ GPT-4, 기존 버전과 어떻게 다를까
GPT-4는 GPT-3.5 대비 언어 생성 능력이 향상됐다. 이미지를 인식(컴퓨터 비전)할 수 있는 기능도 추가됐다. 오픈AI 측은 이를 두고 "여러 시험과 학술 벤치마크에서 인간 수준의 성능을 보여주는 초거대 멀티 모달 AI"라고 강조했다.
특히 미국 변호사 시험에서 하위 10%의 성적을 낸 GPT-3.5와 달리 상위 10% 점수를 받을 수 있을 정도로 언어 능력이 높아졌다. 한 번에 처리할 수 있는 단어 수는 3000개에서 2만5000개로 8배 이상 확대(영어 기준)됐다.
이를 통해 이용자가 더 자세하고 긴 맥락의 답변을 얻을 수 있게 됐다는 설명이다. 긴 문장 생성에 약점을 보인 트랜스포머 모델의 문제점을 해결한 것이다. 오픈AI가 클라우드 기반 AI 반도체 인프라를 제공한 마이크로소프트(MS)와 긴밀하게 협력한 성과다.
이용자는 챗GPT 플러스에 가입하면 GPT-4 기반 차세대 챗GPT를 사용할 수 있다. 다만 GPT-4 기반 챗GPT는 클라우드 서버 부하로 인해 현재 사용량이 4시간에 질문 100개로 제한돼 있다. 사용 한도가 꽉 차면 GPT-3.5 기반으로 사용해야 한다.
샘 올트먼 오픈AI 최고경영자(CEO)는 본인 소셜미디어 계정에서 "GPT-4는 여전히 결함이 있고 제한적이지만 사용할수록 더 인상적인 모델"이라고 평가했다. 오픈AI는 AI 모델을 지속적으로 최적화하고 AI 반도체를 확충함으로써 일일 사용량을 확대할 계획이다.
◆ 한국어 능력 대폭 향상…수학 지식도↑
오픈AI는 GPT-4의 언어 능력을 두고 "일상적인 대화에선 (GPT-3.5와) 큰 차이를 느낄 수 없지만 전문적인 질문을 하면 차이가 나타난다"며 "더 안정적이고 창의적이며 미묘한 질문에 대해 답변한다"고 밝혔다.
일례로 법률 지식 역량을 들 수 있다. GPT-3.5는 미국 변호사 시험에서 400점 만점에 213점을 받았지만, GPT-4는 400점 만점에 298점을 받았다. 또한, 미국 수학능력시험(SAT) 읽기·쓰기의 경우 800점 만점 기준 670점에서 710점으로 올랐다. 특히 GPT-3.5의 약점으로 지적 받아온 수학 부문은 590점에서 700점으로 크게 향상됐다. 의학 지식 자가 진단도 정답률이 53%에서 75%로 향상됐다.
GPT-4는 영어 외에 다른 언어에서도 GPT-3.5를 넘어서는 답변 능력을 보여준다. 초거대 AI의 NLP 능력을 검증하는 MMLU 벤치마크 기준 한국어 답변 능력은 77.0%로 올랐다. 이에 따라 GPT-3.5에 영어로 질문할 때보다 더 자세하고 정확한 답변을 얻을 수 있게 됐다. 답변 능력이 70%를 넘는 언어만 25개에 이른다.
오픈AI는 GPT-4에 NLP뿐 아니라 이미지를 이해할 수 있는 능력(컴퓨터 비전)도 추가했다. 이용자가 업로드한 이미지를 보고 이에 맞는 최적의 답변을 제공하는 식이다. 다만 이 기능은 현재 시범용으로 지원 중이라 이용자들은 사용이 어렵다.
GPT-4의 한계도 여전하다. 오픈AI는 GPT-4가 GPT-3.5의 단점인 '환각 오류'를 완전히 해결하지 못했다고 언급했다. 환각 오류란 AI가 사실과 다른 것을 마치 진실인 것처럼 강한 확신을 담아 답변하는 문제를 말한다. 때문에 GPT-4를 통해 얻은 답변이라도 실제 업무나 논문 등에 활용하려면 엄격한 사실 확인 단계를 거쳐야 한다.
◆ 韓 통신·포털업체, 초거대 AI 개발에 사활
한국어 능력이 강화된 챗GPT가 나온 상황에서 국내 업체들의 대응은 더 빨라질 수밖에 없다.
SKT는 지난달 12일 자체 구축한 슈퍼컴퓨터 '타이탄' 성능을 두 배 이상으로 강화했다고 밝혔다. 타이탄에 활용되는 엔비디아 A100 그래픽처리장치(GPU)를 1040개로 증설한 것. 기존 대비 두 배 이상 키운 규모다.
더 정교한 초거대 AI 구현에 나서기 위한 목적이다. SKT는 이번 인프라 확대로 더 광범위한 데이터를 빠르고 정확하게 처리할 수 있는 컴퓨팅 성능을 확보하게 됐다. 타이탄을 기반으로 서비스를 제공하는 GPT-3 기반 에이닷도 기존보다 더 정교하게 학습할 수 있다. 에이닷은 현재보다 두 배 이상 규모 모델로 고도화 하는 것이 가능해졌다.
KT는 한국과학기술원(KAIST)과 AI 공동 연구를 확대하고 있다. 가장 최근 사례를 보면 지난달 21일 양측 공동연구센터 워크숍 자리를 마련해 AI 관련 기술과 서비스, 연구과제 목표와 성과, 향후 계획을 점검했다. LG유플러스의 경우 LG AI연구원에서 개발한 초거대 AI '엑사원'을 IPTV 등 서비스에 적용하기 위한 방안을 찾고 있다.
네이버·카카오는 한국어 데이터를 대규모로 축적한 강점을 바탕으로 초거대 AI 서비스를 내놓을 예정이다. 네이버클라우드는 오는 7월 한국어 데이터 학습을 강화한 챗GPT 버전 '하이퍼클로바X' 공개를 앞두고 있다. 이 과정에서 삼성전자와 개발한 AI 반도체를 자체 인프라에 탑재하는 등 인프라도 강화하는 추세다.
카카오의 기술 개발 자회사 카카오브레인은 이달 초 온라인 채용설명회를 진행하고 대규모 AI 인력 채용에 나선 상태다. 모집 분야는 머신러닝(ML)옵스, 프론트엔드, 백엔드, 서비스 기획, 사용자경험(UX), AI 리서치 등이며 총 두 자릿수 규모로 경력직을 채용할 예정이다. 조만간 추가 분야에 대한 신입직 등 채용도 실시한다. 김일두 카카오브레인 대표는 사내 GPU를 연내 1000대 추가 활용하는 등 인프라 투자 계획도 발표했다.
◆ 구글·메타 등 잇따라 시장 진입…"차별화된 강점 있어야"
구글·메타 등 해외 업체들은 챗GPT에 대항해 최근 잇따라 생성AI 서비스를 선보이고 있지만 서비스 수준은 챗GPT에 못 미친다는 평가를 받는다. 구글이 지난달 선보인 AI 챗봇 서비스 '바드'는 출시 행사에서 오답을 제시하며 논란이 된 바 있다. 페이스북 모회사 메타도 최근 자체 언어모델 '라마'를 공개했지만 연구용 목적으로 쓰여 제한적이다.
국내 AI 전문가들은 GPT-4가 여러 강점을 지닌 모델이라고 평가했다. AI 업체 업스테이지의 김성훈 대표는 "GPT-4는 이미지를 보고 이해할 수 있으며 더 많은 데이터로 학습했기 때문에 (이용자가 GPT-4를) 속이는 일은 더 어려울 것 "이라며 "한국어를 포함한 다국어 지원이 가능한 것도 장점"이라고 말했다.
이어 "GPT-4는 다양한 성격을 갖고 있어 이용자가 이 모델에 기반한 챗GPT 성격을 본인이 원하는 대로 바꿀 수 있게 됐다"고 강조했다. 가령 '고정된 장황함, 어조, 스타일이 있는 고전적인 챗GPT 성격'을 요구하면 그에 따른 답변을 제공한다고 설명했다.
다만 생성AI 시장에서 살아남기 위해 서비스 차별화는 필수가 될 전망이다. 한 업계 관계자는 "이번 GPT-4 출시로 인해 국내 업체들은 더 차별화된 서비스를 제공해 경쟁력을 확보해야 할 것"이라며 "GPT-4가 방대한 데이터와 파라미터(매개변수)를 통해 한국어조차 좋은 성능을 보여줄 것으로 예상된다. 국내 업체들도 언어 특화 등 부분뿐 아니라 이러한 기술 발전을 활용하고 시장의 변화에 빠르게 대응해 지속적인 혁신을 추구하는 것이 중요하다"고 말했다.
한편, 오픈AI 투자사인 마이크로소프트(MS)는 이날 자사 검색엔진 빙에 이번 GPT-4를 탑재할 계획이라고 밝혔다. 구글 클라우드는 자체 생성 AI를 기반으로 구글 워크스페이스와 개발자를 지원하는 신규 AI 제품·기능을 발표하기도 했다.
국내 IT업체들도 시장 공략에 속도를 내는 상황이다. SK텔레콤(SKT)·KT·LG유플러스 등 통신사와 네이버·카카오 등 포털업체 등이 핵심 주자다. 이들 업체는 초거대 언어모델 기반 AI 챗봇 서비스를 개발하거나 고도화하는 데 집중하고 있다.
15일 업계에 따르면 오픈AI는 전날 차세대 자연어처리(NLP) 모델인 GPT-4를 공개했다. GPT-4는 챗GPT의 근본 기술인 GPT-3.5와 비교해 AI의 언어 생성 능력이 15% 이상 향상됐다. 영어로만 제대로 된 답변을 하던 GPT-3.5와 달리 한국어를 포함한 27개 언어로 자연스러운 답변을 하는 것이 특징이다.
오픈AI가 이러한 기술 역량 강화로 빠르게 시장 선두 굳히기에 나서자 국내 기업들 발등에도 불이 떨어졌다. 이젠 한국어 특화를 강점으로 내세우는 것만으로는 시장 경쟁력 확보가 어려워질 전망이기 때문이다. 더 차별화된 서비스로 이용자의 마음을 사로잡는 것이 핵심 과제로 부상했다.
◆ GPT-4, 기존 버전과 어떻게 다를까
GPT-4는 GPT-3.5 대비 언어 생성 능력이 향상됐다. 이미지를 인식(컴퓨터 비전)할 수 있는 기능도 추가됐다. 오픈AI 측은 이를 두고 "여러 시험과 학술 벤치마크에서 인간 수준의 성능을 보여주는 초거대 멀티 모달 AI"라고 강조했다.
특히 미국 변호사 시험에서 하위 10%의 성적을 낸 GPT-3.5와 달리 상위 10% 점수를 받을 수 있을 정도로 언어 능력이 높아졌다. 한 번에 처리할 수 있는 단어 수는 3000개에서 2만5000개로 8배 이상 확대(영어 기준)됐다.
이를 통해 이용자가 더 자세하고 긴 맥락의 답변을 얻을 수 있게 됐다는 설명이다. 긴 문장 생성에 약점을 보인 트랜스포머 모델의 문제점을 해결한 것이다. 오픈AI가 클라우드 기반 AI 반도체 인프라를 제공한 마이크로소프트(MS)와 긴밀하게 협력한 성과다.
이용자는 챗GPT 플러스에 가입하면 GPT-4 기반 차세대 챗GPT를 사용할 수 있다. 다만 GPT-4 기반 챗GPT는 클라우드 서버 부하로 인해 현재 사용량이 4시간에 질문 100개로 제한돼 있다. 사용 한도가 꽉 차면 GPT-3.5 기반으로 사용해야 한다.
샘 올트먼 오픈AI 최고경영자(CEO)는 본인 소셜미디어 계정에서 "GPT-4는 여전히 결함이 있고 제한적이지만 사용할수록 더 인상적인 모델"이라고 평가했다. 오픈AI는 AI 모델을 지속적으로 최적화하고 AI 반도체를 확충함으로써 일일 사용량을 확대할 계획이다.
◆ 한국어 능력 대폭 향상…수학 지식도↑
오픈AI는 GPT-4의 언어 능력을 두고 "일상적인 대화에선 (GPT-3.5와) 큰 차이를 느낄 수 없지만 전문적인 질문을 하면 차이가 나타난다"며 "더 안정적이고 창의적이며 미묘한 질문에 대해 답변한다"고 밝혔다.
일례로 법률 지식 역량을 들 수 있다. GPT-3.5는 미국 변호사 시험에서 400점 만점에 213점을 받았지만, GPT-4는 400점 만점에 298점을 받았다. 또한, 미국 수학능력시험(SAT) 읽기·쓰기의 경우 800점 만점 기준 670점에서 710점으로 올랐다. 특히 GPT-3.5의 약점으로 지적 받아온 수학 부문은 590점에서 700점으로 크게 향상됐다. 의학 지식 자가 진단도 정답률이 53%에서 75%로 향상됐다.
GPT-4는 영어 외에 다른 언어에서도 GPT-3.5를 넘어서는 답변 능력을 보여준다. 초거대 AI의 NLP 능력을 검증하는 MMLU 벤치마크 기준 한국어 답변 능력은 77.0%로 올랐다. 이에 따라 GPT-3.5에 영어로 질문할 때보다 더 자세하고 정확한 답변을 얻을 수 있게 됐다. 답변 능력이 70%를 넘는 언어만 25개에 이른다.
오픈AI는 GPT-4에 NLP뿐 아니라 이미지를 이해할 수 있는 능력(컴퓨터 비전)도 추가했다. 이용자가 업로드한 이미지를 보고 이에 맞는 최적의 답변을 제공하는 식이다. 다만 이 기능은 현재 시범용으로 지원 중이라 이용자들은 사용이 어렵다.
GPT-4의 한계도 여전하다. 오픈AI는 GPT-4가 GPT-3.5의 단점인 '환각 오류'를 완전히 해결하지 못했다고 언급했다. 환각 오류란 AI가 사실과 다른 것을 마치 진실인 것처럼 강한 확신을 담아 답변하는 문제를 말한다. 때문에 GPT-4를 통해 얻은 답변이라도 실제 업무나 논문 등에 활용하려면 엄격한 사실 확인 단계를 거쳐야 한다.
◆ 韓 통신·포털업체, 초거대 AI 개발에 사활
한국어 능력이 강화된 챗GPT가 나온 상황에서 국내 업체들의 대응은 더 빨라질 수밖에 없다.
SKT는 지난달 12일 자체 구축한 슈퍼컴퓨터 '타이탄' 성능을 두 배 이상으로 강화했다고 밝혔다. 타이탄에 활용되는 엔비디아 A100 그래픽처리장치(GPU)를 1040개로 증설한 것. 기존 대비 두 배 이상 키운 규모다.
더 정교한 초거대 AI 구현에 나서기 위한 목적이다. SKT는 이번 인프라 확대로 더 광범위한 데이터를 빠르고 정확하게 처리할 수 있는 컴퓨팅 성능을 확보하게 됐다. 타이탄을 기반으로 서비스를 제공하는 GPT-3 기반 에이닷도 기존보다 더 정교하게 학습할 수 있다. 에이닷은 현재보다 두 배 이상 규모 모델로 고도화 하는 것이 가능해졌다.
KT는 한국과학기술원(KAIST)과 AI 공동 연구를 확대하고 있다. 가장 최근 사례를 보면 지난달 21일 양측 공동연구센터 워크숍 자리를 마련해 AI 관련 기술과 서비스, 연구과제 목표와 성과, 향후 계획을 점검했다. LG유플러스의 경우 LG AI연구원에서 개발한 초거대 AI '엑사원'을 IPTV 등 서비스에 적용하기 위한 방안을 찾고 있다.
네이버·카카오는 한국어 데이터를 대규모로 축적한 강점을 바탕으로 초거대 AI 서비스를 내놓을 예정이다. 네이버클라우드는 오는 7월 한국어 데이터 학습을 강화한 챗GPT 버전 '하이퍼클로바X' 공개를 앞두고 있다. 이 과정에서 삼성전자와 개발한 AI 반도체를 자체 인프라에 탑재하는 등 인프라도 강화하는 추세다.
카카오의 기술 개발 자회사 카카오브레인은 이달 초 온라인 채용설명회를 진행하고 대규모 AI 인력 채용에 나선 상태다. 모집 분야는 머신러닝(ML)옵스, 프론트엔드, 백엔드, 서비스 기획, 사용자경험(UX), AI 리서치 등이며 총 두 자릿수 규모로 경력직을 채용할 예정이다. 조만간 추가 분야에 대한 신입직 등 채용도 실시한다. 김일두 카카오브레인 대표는 사내 GPU를 연내 1000대 추가 활용하는 등 인프라 투자 계획도 발표했다.
◆ 구글·메타 등 잇따라 시장 진입…"차별화된 강점 있어야"
구글·메타 등 해외 업체들은 챗GPT에 대항해 최근 잇따라 생성AI 서비스를 선보이고 있지만 서비스 수준은 챗GPT에 못 미친다는 평가를 받는다. 구글이 지난달 선보인 AI 챗봇 서비스 '바드'는 출시 행사에서 오답을 제시하며 논란이 된 바 있다. 페이스북 모회사 메타도 최근 자체 언어모델 '라마'를 공개했지만 연구용 목적으로 쓰여 제한적이다.
국내 AI 전문가들은 GPT-4가 여러 강점을 지닌 모델이라고 평가했다. AI 업체 업스테이지의 김성훈 대표는 "GPT-4는 이미지를 보고 이해할 수 있으며 더 많은 데이터로 학습했기 때문에 (이용자가 GPT-4를) 속이는 일은 더 어려울 것 "이라며 "한국어를 포함한 다국어 지원이 가능한 것도 장점"이라고 말했다.
이어 "GPT-4는 다양한 성격을 갖고 있어 이용자가 이 모델에 기반한 챗GPT 성격을 본인이 원하는 대로 바꿀 수 있게 됐다"고 강조했다. 가령 '고정된 장황함, 어조, 스타일이 있는 고전적인 챗GPT 성격'을 요구하면 그에 따른 답변을 제공한다고 설명했다.
다만 생성AI 시장에서 살아남기 위해 서비스 차별화는 필수가 될 전망이다. 한 업계 관계자는 "이번 GPT-4 출시로 인해 국내 업체들은 더 차별화된 서비스를 제공해 경쟁력을 확보해야 할 것"이라며 "GPT-4가 방대한 데이터와 파라미터(매개변수)를 통해 한국어조차 좋은 성능을 보여줄 것으로 예상된다. 국내 업체들도 언어 특화 등 부분뿐 아니라 이러한 기술 발전을 활용하고 시장의 변화에 빠르게 대응해 지속적인 혁신을 추구하는 것이 중요하다"고 말했다.
한편, 오픈AI 투자사인 마이크로소프트(MS)는 이날 자사 검색엔진 빙에 이번 GPT-4를 탑재할 계획이라고 밝혔다. 구글 클라우드는 자체 생성 AI를 기반으로 구글 워크스페이스와 개발자를 지원하는 신규 AI 제품·기능을 발표하기도 했다.