일본에서 들여다본 구글이 그리는 '머신러닝'의 미래

2015-11-12 00:26

구글은 10일 일본 도쿄에서 아시아태평양 지역 기자간담회를 열었다. (구글제공)


아주경제 한준호 기자 (일본 도쿄) = 구글은 10일 일본 도쿄에서 아시아태평양지역 12개국(한국, 일본, 중국, 대만, 홍콩 등) 기자들을 초청해 '머신러닝(Machine Learning)'을 주제로 기자간담회를 열었다. 이 행사에 참석하기 위해 100여명의 기자가 도쿄 도심에 위치한 롯폰기힐즈(Roppongi Hills)에 모였다.

구글은 인터넷검색, 유튜브, 구글맵 등 인터넷을 사용하는데 있어 꼭 필요하고 편리한 서비스를 제공해 온 인터넷 세계 최대 기업이다. 구글은 사람들의 일상을 더 편리하게 만들 수 있는 유용한 제품을 만들고자 노력하는 회사로 알려져 있으며, 이 목표를 이루기 위해 '머신러닝'에 몰두하고 있다.

머신러닝은 기계학습이란 뜻으로 인공지능(AI)의 한 분야다. 컴퓨터로 하여금 알고리즘을 기반으로 학습하게 해 새로운 데이터를 인식했을 때 그 결과를 예측하도록 하는 기술이다. 

구글은 5년 뒤 모든 산업에 머신러닝 기술이 적용될 것으로 확신하고 있으며, 이 확신을 전 세계에 알리기 위해 '더 매직 인더 머신(The Magic in the machine)'이라는 행사를 열고, 머신러닝에 대한 모든 것을 이야기했다.

◆ "머신러닝은 마술이 아니다" 
구글에서 인공지능과 머신러닝을 연구하는 그렉 코라도(Greg Corrado) 선임연구원은 간담회에서 "머신러닝은 마술이 아니라 새로운 방식으로 소프트웨어를 구축하는 하나의 툴(도구)"라고 강조했다. 머신러닝이 마술처럼 신기한 서비스를 제공하지만 그것은 철저하게 기계를 학습시킨 결과물이라는 것이다.  
 

머신러닝에 대해 설명하는 그렉 코라도 선임연구원. (사진=구글 제공) 


그는 공부시간과 성적과의 상관관계를 예로 들면서 공부시간이 길다고 해서 반드시 좋은 성적이 나올 수 없지만, 구글의 머신러닝은 이런 변수를 학습을 통해 줄여나간다고 설명했다.

시험이 너무 쉽게 출제되면 공부를 안해도 좋은 성적을 받을 수 있지만, 공부를 많이 해도 시험이 어려우면 성적이 나오지 않을 수 있다. 구글의 머신러닝에서는 공부한 시간을 데이터로 인풋(input)하면 컴퓨터는 성적이라는 결과를 아웃풋(output)으로 도출하게 되는데, 이 과정의 상관관계를 학습시킨다.  

코라도는 "여기서 우리가 배우려는 것은 공부와 성적과의 연관관계이며 이것은 랜덤한 추측으로 여러번 관찰하면 무엇이 연관관계인지 판단할 수 있다"고 설명했다. 이에 대한 정확성을 높이기 위해서는 사례(데이터)를 많이 취합해야 한다고 덧붙였다. 

그는 머신러닝을 쉽게 이해시키기 위해 로켓도 동원했다. 코라도는 "머신러닝은 로켓엔진과 비슷하다"면서 "로켓엔진의 중간 부분이 머신러닝이며 로켓의 연료가 데이터, 뿜어져 나오는 연기는 그 결과물"이라고 설명했다.
 

구글은 머신러닝이 로켓엔진과 비슷하다고 설명했다. 머신러닝은 로켓엔진의 중간 부분에 해당되고, 데이터가 로켓의 연료인 셈이다. (사진=한준호 기자)

 
이날 도쿄에서 기자간담회를 개최하기 직전, 미국 현지에서 구글은 인공지능 소프트웨어 '텐서플로(TensorFlow)'를 무상으로 공개한다고 발표했다. 순다르 피차이 구글 CEO는 블로그를 통해 "텐서플로는 구글 사내보다 회사 밖에서 이용되는 것이 임펙트가 있을 것으로 판단했다"고 소스를 공개한 이유를 설명했다.  

간담회에서 텐서플로를 소개한 코라도는 "이를 통해 개발자들은 CPU, GPU, 모바일 등 실제 제품에 접목할 수 있다"면서 "머신러닝의 표준화를 통해 미래제품 출시에도 도움이 된다”고 강조하면서 머신러닝의 보급에 최우선 순위를 두고 있다는 뜻을 내비쳤다.
 

그렉 코라도 연구원은 간담회에서 텐서플로는 머신러닝과 딥러닝의 표준이 될 오픈소프트웨어라고 소개했다. (사진=한준호 기자)


구글의 머신러닝 기술은 실제로 구글검색, 구글포토, 구글번역, 지메일(Gmail) 등 자사 제품에 이미 적용되고 있다. 구글앱을 통해 음성검색을 이용하면 그 음성을 인식한 뒤 분석한 내용을 바탕으로 검색어를 생성한다. 또 구글 포토를 이용하면 스마트폰으로 찍은 사진을 인물, 장소, 사물별로 분류해 저장하고, 클라우드에 보관된 위치 정보가 없는 사진도 촬영 장소의 특징을 분석해 그 위치를 찾아낸다.

코라도는 "3년 전에는 불가능했던 일들이 지금은 현실이 됐다"면서 "구글은 앞으로도 머신러닝을 통해 어떤 작업이 가능할지 계속해서 고민해 나갈 것"이라고 말했다.

이어 그는 "머신러닝은 사례를 통한 학습이 가장 중요하다"면서 인공지능의 진화를 위해서는 방대한 양의 정보(빅데이터)와 그것을 기초로 한 경험과 학습이 필요하다는 점을 강조했다. 그 이유는 인공지능은 인간의 뇌가 성장하듯이 수많은 지식을 학습하면서 성장하기 때문이다.

이렇게 빅데이터를 수집하기 위해서는 이용자와 인터넷을 연결하는 인터페이스가 필요하지만, 구글은 이미 세계 최대 인터넷 검색 엔진이라는 인터페이스를 갖추고 있다.

코라도는 머신러닝이 주목 받는 이유에 대해 "10년 전에도 머신러닝은 있었지만 컴퓨터 성능이 느려서 실용성이 떨어졌었다"면서 "그러나 지금은 컴퓨터와 스마트폰이 빨라졌기 때문에 본격적인 머신러닝이 가능해졌다”고 설명했다.

◆ "구글포토는 새로운 경험" 
구글포토의 검색과 분석 부문을 이끄는 크리스 페리(Chris Perry) 매니저는 '컴퓨터 비전과 사진'이라는 주제로 구글포토를 소개하면서 "올해 출시된 구글포토앱은 매달 1억명 이상이 사용하고, 500억장 이상의 사진들이 업로드됐다"고 말했다.  

구글포토는 스마트폰으로 촬영한 사진을 단어 검색이 가능하도록 인물, 위치, 사물별로 클라우드에 저장한다. 페리는 "구글포토는 모든 사람의 얼굴을 인지하고 그룹핑할 수 있다"면서 직접 시연해 보이기도 했다.   

그는 구글 포토의 얼굴 인식 수준에 대해 "인간의 성장기로 따지면 고등학교를 마치고 대학 입학을 앞둔 정도까지 왔다"면서 "얼굴이 50% 정도만 보이는 상황에서는 그룹 분류가 어려운 점을 앞으로 개선해 나가야 한다"고 말했다.
 

크리스 페리 매니저가 위치정보가 없는 사진의 촬영 장소를 인식하는 구글포토의 기능에 대해 설명하고 있다. (사진=구글 제공)


구글포토의 가장 큰 특징은 위치정보가 없는 사진의 장소를 사진에 촬영된 곳의 특색을 분석해 찾아낸다는 것으로, 페리는 "예를들어 프랑스 파리에 위치한 에펠탑 사진에서 머신러닝 기술을 통해 학습한 에펠탑의 여러 포인트들을 찾아내 매칭을 통해 에펠탑을 식별할 수 있다"고 설명했다.  

이어 그는 "사진 속 인물이나 사물, 장소를 식별하는 기능인 '인셉션'이 바로 머신러닝"이라면서 "수많은 데이터를 분석하는 학습과 트레이닝이 중요하다"고 강조했다.   

◆ "구글 전체가 머신러닝에 집중" 
이날 간담회에선 에릭 슈미트 알파벳(구글의 지주회사) 회장도 원격 화상회의을 통해 머신러닝 예찬을 이어갔다.  

슈미트 회장은 "내가 볼 때 구글은 이 분야(머신러닝)에서 월드 리더다"라고 강조하면서 "구글은 머신러닝을 통해 더욱 스마트해질 것"이라고 덧붙였다. 
 

에릭 슈미트 알파벡 회장이 미국 워싱턴과 일본 도쿄를 연결한 화상회의 시스템을 이용해 머신러닝에 대해 설명하고 있다. (사진=구글 제공) 


이어 텐서플로를 오픈소스로 공개한데 대해 슈미트 회장은 “머신러닝을 통해 업계가 스마트해질수록 구글도 얻는 것이 많아지고 혜택을 누리게 될 것”이라면서 “텐서플로를 공개함으로써 대부분의 인공지능 경쟁사들도 이를 사용할 것으로 자신하고 있으며 자부심을 느낀다”고 강조했다.

한편 슈미트 회장은 머신러닝의 최종 목표에 대해 “아직 머신러닝 기술은 초창기여서 실제 최종 목표가 무엇일지 아직 확신하기 어렵다"면서 "컴퓨터가 어려운 물리학을 많이 배워 논문을 쓸 수 있게 되면 좋을 것 같다"고 말했다. 이어 그는 "머신러닝을 통해 지식을 개선하고 사람들을 행복하게 해주는 것, 이러한 것들은 내가 살아있는 동안에 가능하지 않을까 생각한다"고 말했다.