[테크인트렌드] 'AI 에이전트' 출현…승자가 AI 주도권 쥔다

한영훈 기자 2024-07-09 08:01

주체적 AI 비서…항공권 예매도 척척

아직 초기단계…범용성 확보 숙제

A가 사실인척 지어내는 '환각현상' 최대과제

마이크로소프트(MS) 창업자인 빌 게이츠는 인공지능(AI) 시대의 최종 승자는 "AI 에이전트 시장을 장악하는 업체가 될 것"이라고 전망했다. 고도화된 Al 에이전트는 사용자들이 가장 먼저 찾는 게이트 키퍼(문지기) 역할을 하게 될 가능성이 크기 때문이다. AI 에이전트는 단순히 질문에 답을 하는 챗봇에서 한층 더 진화한 형태다. 사용자 정보를 기반으로 단계적인 추론을 거쳐 적절한 계획을 세운다. 이를 통해 다양한 업무를 직접 수행할 수 있는 자율적이고 주체적인 비서 역할을 수행하게 된다.

예를 들어 이번 주말 일본 여행을 계획 중이라면 지금은 사용자가 직접 검색 엔진이나 사회관계망서비스(SNS)에서 필요한 정보를 찾고 여행 사이트 등을 통해 호텔이나 항공을 예약해야 한다. 하지만 AI에이전트가 발전하면 사용자 예산과 일정, 취향 등에 대한 정보를 기반으로 직접 호텔이나 항공을 예약해준다.

이를 통해 이용자들은 한층 고도화한 AI의 편의성을 직접 체감할 수 있다. AI가 삶 속에 보다 실용적으로 녹아드는 셈이다. 이는 대중들이 AI 영향력을 판단하는 중요한 지표가 된다. 이 시장을 장악한 업체는 AI 선두 업체라는 이미지를 확실히 각인시킬 수 있다. 이러한 이유로 빅테크 업체들은 AI 에이전트 시장을 선점하기 위해 분주하게 움직이고 있다.

본격화하는 AI에이전트 경쟁···빅테크 다수 '도전장'

오픈 AI의 'GPT 4o'와 구글의 '프로젝트 아스트라'가 대표적이다. 이 모델들은 사용자들과 친구처럼 대화하면서 다양한 서비스를 제공한다. 기존 파운데이션(데이터 기계학습) 모델과 비교하면 음성과 시각 인식 능력이 획기적으로 개선됐다. 사람은 기본적으로 음성으로 의사 소통을 하는데, 기존 모델은 음성을 텍스트로 변환하고 이를 모델에서 처리한 후 다시 음성화하는 번거로운 과정을 거쳐 처리 시간이 길었다. 음성을 텍스트로 변환하는 과정에서 사용자 톤이나 다른 정보들이 소멸해 자연스러운 대화도 어려웠다.

관련기사

그러나 GPT-4o는 이를 모두 하나의 모델로 처리함으로써 반응 속도를 크게 줄였고, 톤과 같은 정보까지 전달해 사람과 대화하는 것 같은 자연스러움을 구현했다. 시각 인식 능력 역시 개선돼 일상생활 속 사용자에게 도움을 줄 수 있는 다양한 작업을 할 수 있게 됐다. 화면을 보면서 어떤 상황인지 유추하거나 수학 문제를 보면서 풀이를 해주는 식이다.

애플의 '애플 인텔리전스'와 MS의 '코파일럿 PC'는 여기서 한발 더 나아가 사용자에 대한 풍부한 데이터를 기반으로 스마트폰이나 PC에서 사용자가 원하는 작업을 직접 해준다.

애플 인텔리전스는 '사용자 정보의 집결체'라고 볼 수 있는 스마트폰에서 사용자 정보를 충분히 활용할 수 있고, 자체 운영 체제를 통해 소프트웨어를 원활하게 제어할 수 있다. 이를 통해 사용자가 원하는 작업을 직접 수행할 수 있는 능력을 확보했다.

예컨대 사용자가 원하는 이미지를 찾거나 편집해주는 게 가능하고, 메일 답장의 초안도 써줄 수 있다. 메일이나 메시지를 검색해서 오늘 저녁 친구를 어디서 만나기로 했는지 사용자에게 알려주는 것도 가능하다. 사실 이러한 기능들은 기존 생성 AI 서비스들이 이미 상용화한 것들이지만 실제로 사용해 보면 생각보다 유용하지 못한 경우가 많았다. 사용자 정보를 충분히 확보하기 어려울 뿐 아니라 소프트웨어 제어에 한계가 있었기 때문이다.

하지만 애플은 스마트폰을 통해 '정보 확보' 문제를 해결했다. 반도체부터 소프트웨어, 운영 체제까지 자체적으로 수직 통합해서 운영하기 때문에 제어에도 무리가 없다. 이를 통해 실용성을 크게 높였다.

애플은 이번 시연에서 이미지나 메일 등 상대적으로 단순한 작업만 수행했다. 하지만 앱 인텐트(의도) API(컴퓨터 또는 컴퓨터 프로그램 간 연결을 지원하는 소프트웨어 인터페이스)를 공개한 만큼 향후에는 다른 개발자들도 이 같은 기능을 활용할 수 있게 될 것으로 예상된다. 이렇게 되면 애플의 AI 비서인 시리에게 음성으로 '이번 주말 일본에 여행가려는데 비행기와 호텔 예약 좀 해 줘'라고 요청하는 게 가능해진다.

MS의 코파일럿 PC도 유사한 기능을 선보이고 있다. PC에서 과거 한번 본 화면을 찾아주는 것과 게임 화면을 보면서 적절한 게임 방법을 가르쳐주는 기능을 갖췄다. 사용자 정보를 활용해 효용을 높이고 자체 운영 체제를 기반으로 한 제어 능력으로 필요한 행동까지 해줄 수 있다.

범용성 확보하려면 여러 모델 상호작용해야

AI 에이전트의 다음 관건은 이제 막 기초 작업을 수행하기 시작한 현실 세계에서 다양한 작업을 신뢰성 있게 수행하며 범용성을 확보할 수 있을지 여부다.

미국에서 Al 에이전트를 개발하고 있는 스타트업(신생기업) 시에라 AI는 최신 파운데이션 모델을 이용해 AI 에이전트가 다양한 업무를 수행할 수 있는지를 평가하는 '타우 벤치'를 발표했다.

그 결과를 보면 현재 가장 뛰어난 것으로 평가받고 있는 GPT-4o의 평균 작업 성공률이 50% 미만에 그쳤고, 다른 모델들은 훨씬 낮았다. 특히 같은 업무를 시켰을 때 다른 결과를 내놓는 경우가 많았다. AI 에이전트에게 "일본으로 가는 항공권을 구매해"라고 명령했는데 미국으로 가는 항공권을 구매해버리는 식이다.

이러한 현상이 발생하는 근본적인 원인은 파운데이션 모델의 한계다. 챗GPT와 같은 파운데이션 모델은 인터넷 수준의 대규모 테스트와 이미지 등을 학습했기 때문에 상식에 따른 추론과 맥락 파악이 가능하다. 그러나 기본적으로 앞에 나온 단어들을 보고 뒤에 나올 단어를 예측하는 식으로 확률에 기반한 답변을 한다. 이에 90%는 맞는 답변을 할 수 있지만 10%는 전혀 엉뚱한 답변을 할 수 있다.

파운데이션 모델은 답변을 모를 때 사실인 것처럼 지어내는 '환각' 현상도 있다. 스스로 비행편 가격을 지어내고 예약을 해버릴 수도 있는 것이다. 만약 다단계 추론이 필요한 복잡한 작업 중에 환각 현상이 발생하면 의도와 전혀 다른 결과가 나와 버릴 수 있다.

현실 세계에서는 다양한 변수가 생기고 상황이 시시각각으로 변하는데 이러한 다양한 변수를 모두 학습하기는 어렵기 때문에 환각 현상이 생긴다.

기본적인 파운데이션 모델의 추론 능력 자체도 한계가 있다. 현재의 파운데이션 모델은 상식에 기반해 간단한 추론은 가능하지만 어려운 수학 문제를 푸는 등 복잡한 추론을 하는 데 한계를 보인다.

시에라 AI는 이 중 가장 문제가 되고 있는 환각 현상에 대응하려면 하나의 모델이 아닌 최대 7개의 모델을 동시에 사용해야 한다고 주장한다. 이 중 하나의 모델을 답변을 감시하는 비판자 역할로 지정한다. 즉 모델끼리 상호작용함으로써 더 나은 답변을 유도해야 한다는 것이다.

이러한 접근법은 최근 AI 석학 앤드루 응이 제시한 의견과 일맥상통하는 측면이 있다. 앤드루 응은 "AI가 일을 하는 과정에 에이전트를 활용하면 AI의 성능을 획기적으로 개선할 수 있다"고 주장하고 있다.

가령 AI에게 에세이 작성 업무를 지시했다고 치자. 이때 하나의 AI가 아닌 다양한 역할을 가진 AI 에이전트들이 협업하도록 해야 더 좋은 결과를 기대할 수 있다는 뜻이다.

메모리를 활용해서 모델의 유용성을 높일 수도 있다. 대량의 데이터를 입력하고 여기서 답변을 찾게 하거나 외부 데이터 자료를 활용하도록 하면 보다 정확한 답변을 내놓을 수 있다. 개선 사안을 전달해 모델을 지속적으로 업그레이드하는 것도 방법이다. 애플과 같은 빅테크의 시장 참여는 이러한 피드백을 가속화시켜 서비스 품질을 높일 수 있다. 애플의 시리는 매일 15억개의 요구를 처리할 정도로 방대한 사용자 기반을 가지고 있다.

모델 자체의 발전도 가속화하고 있다. GPT-4o가 출시된 지 한 달 만에 앤트로픽에서는 추론‧비전 능력에서 이를 뛰어넘는 클로드 3.5 소넷을 발표했다. 오픈 AI 역시 GPT-5를 연내 출시할 예정이며 전체적인 성능이 크게 개선될 전망이다.

해외 스타트업도 시장 진출 속도

이러한 가능성에 주목한 다수의 스타트업도 AI 에이전트 시장 진출에 속도를 내고 있다. 앞서 언급한 시에라AI 외에도 아티장AI, 이머전시AI 등이 관련 행보를 가속화하고 있다.

아티장AI는 작년 7월 설립된 회사로, 마케팅 등 업무를 자율적으로 수행하는 AI 직원을 개발하고 있다. 이 회사의 AI 직원인 아바(Ava)는 3억개 이상의 기업 간 거래(B2B) 데이터를 바탕으로 사용자의 잠재적 고객군을 발굴한다.

이 밖에도 웹사이트‧SNS 등을 통해 고객사의 요구, 개인 성향 등을 분석해 맞춤형 판매 전략을 수립한다. 사전에 학습된 상황별 이메일 템플릿을 바탕으로 고객과 효과적인 소통을 이끌어 낸다. 아티장AI는 현재 판매 부문 AI 직원 서비스만 제공하고 있으나 추후 마케팅, 고객 관리 직원 등도 출시할 예정이다.

이머전시AI는 입력된 메시지가 명령 수행으로 이어지는 중간 과정에서 최적의 초거대언어모델(LLM)을 찾아 자율적으로 명령을 수행하도록 한다. 이 회사의 ‘에이전트 E’는 상황에 맞는 모델만을 선별하도록 하는 기술을 기반으로 정확한 명령 수행이 가능하다.

기자 정보: 한영훈; han@ajunews.com

0개의 댓글

0 / 300

실시간 인기

오늘의 1분뉴스

포토

주요뉴스