[Tech in Trend] 개인정보 침해 우려 줄이는 AI 알고리즘, 연합학습

2022-08-08 07:00
  • 글자크기 설정

사용자 개인정보 대신, 개인정보 처리 '방법'만 학습해 성능 강화

인공지능 모델 학회에 비유...헬스, 제조, 금융, 교육 등 활용 기대

분산 컴퓨팅으로 스마트폰 과부하 우려...국내 연구진 해결책 제시

연합학습은 인공지능이 개최하는 학술대회에 비유된다.[사진=게티이미지뱅크]

최근 메타가 사회관계망서비스(SNS)의 '개인정보 처리 방침'에 대해 사용자 동의를 사실상 강제해 논란이 일었다. 메타는 마케팅 등에 개인정보를 활용한다는 방침을 안내하고, 이에 대해 동의하지 않으면 오는 9일부터 페이스북이나 인스타그램 등 자사의 서비스를 이용할 수 없다고 공지해 왔다.

많은 사용자가 이러한 강제적 동의 방식에 반발했으며, 자신의 개인정보가 마케팅 목적으로 다양하게 활용되고 있다는 사실에 놀랐다. 메타는 지난달 말 이러한 강제 방식을 철회했지만, 동의를 누르든 누르지 않았든 기존과 달라지는 것은 없다고 밝혔다. 메타는 개인정보 활용에 있어서 '사후 거부' 방식을 사용하고 있기 때문에 명시적인 거부 의사가 없으면 이전과 동일하게 사용자의 정보를 수집 및 활용한다.

개인정보 보호 위험과 활용 이익은 상충 관계에 있다. 개인정보 활용을 통해 사용자가 개인 맞춤형 서비스 효과를 얻을 수 있지만, 사용자 정보가 기업 및 제휴사 등에 제공되면 개인정보 오남용이나 해킹을 통한 유출 가능성이 높아진다.

정보주체인 사용자는 자신의 정보를 제공해 불필요한 지출을 줄이고 효율적인 금융 상품을 이용할 수 있다. 스마트홈 등 사물인터넷 기술에 개인정보를 활용하면 쇼핑, 교통, 여가 등 일상 곳곳에서 자신에게 최적화한 서비스를 이용하는 것도 가능하다. 기업 역시 이러한 데이터를 통해 과도한 마케팅 비용을 줄이고, 개인 맞춤형 특화 서비스를 신규 개발해 사업을 펼칠 수 있다. 대표적인 것이 금융 분야에서 도입된 마이데이터 사업이다.

한편으로는 개인정보 유출이나 노출 우려 역시 커졌다. 실제로 지난해 마이데이터 서비스가 도입된 지 얼마 되지 않아 특정 개인의 정보가 타인에게 노출되는 사고가 발생했다. 뿐만 아니라 클라우드 설정 오류로 인해 웹 사이트에서 개인정보가 유출되는 사고 역시 흔히 발생한다.

인공지능 기반 서비스가 확산하면 이러한 개인정보 침해 우려가 더욱 커진다. 인공지능이 사용자 맞춤형 서비스와 광고를 자동화하기 위해서는 개인정보를 통한 학습이 필요하다. 이 과정에서 사용자의 어떤 정보가 수집돼 쓰였는지 확인하기 어려우며, 특히 인공지능에 의해 특정 인물의 사상이나 성향이 낙인처럼 찍혀 편견을 만들 가능성도 있다.

◆인공지능 모델이 개최하는 학술대회, 연합학습

구글 연합학습 개념도. 구글이 '공통 모델(파란색 원)'을 배포하면, 모델은 각 사용자의 스마트폰 사용 방식에 따라 다양한 형태로 개선된다(A). 이후 모델이 서버에 모여 서로 개선된 내용을 비교 분석하며(B), 최적의 '공통 모델'을 다시 만들어 사용자에게 배포한다(C).[사진=구글]

이러한 상황에서 구글이 제안한 연합학습(Federated Learning)은 개인정보를 보호하면서도 인공지능의 성능을 강화할 수 있는 효과적인 방식으로 주목받고 있다. 개인정보의 유출 없이 사용자 기기에 있는 데이터를 활용할 수 있게 해, 의료 인공지능 기술 등 새로운 인공지능 서비스를 개발할 수 있다.

기계학습(Machine Learning)으로 대표되는 기존 인공지능 기술은 방대한 데이터를 통한 학습이 필수적이다. 대규모 데이터를 인공지능 서버에 모아 두고, 서버의 고성능 컴퓨팅 성능으로 데이터를 학습한다. 여기에는 인터넷에서 수집한 문서나 데이터베이스는 물론, 개인 사용자가 검색한 키워드, 클릭한 검색 결과, 스마트폰 사용 패턴 등도 활용될 수 있다. 잘 학습된 인공지능은 향후 더 나은 검색 서비스를 제공하거나 상품 등을 추천할 수 있다.

하지만 인공지능이 정확한 판단을 내리기 위해서는 특정 목적의 데이터를 학습해야 한다. 페이스북이나 구글 등 맞춤형 서비스에 특화한 기업은 개인정보가 목적 달성을 위한 데이터에 해당한다.

구글에 따르면 연합학습은 사용자 데이터가 아닌, 데이터를 처리하는 모델을 개선해 성능을 강화하는 방식이다.

우선 데이터 처리가 가장 먼저 이뤄지는 곳은 사용자 스마트폰이다. 스마트폰에 설치된 공통 인공지능 모델은 사용자가 스마트폰을 쓰면서 검색한 결과나 사용 패턴 등을 바탕으로 데이터 처리 모델을 개선한다.

이후 사용자가 스마트폰을 사용하지 않는 시간에는 개선된 모델을 서버로 전송한다. 서버에서는 모델을 취합한 뒤 개선된 공통 인공지능 모델을 만들고, 스마트폰으로 배포한다. 이 같은 과정이 반복되면서 인공지능 모델 성능은 점차 강화된다. 이때 서버에는 사용자의 실제 개인정보가 아닌, 개인정보를 처리했던 방법만 전송되기 때문에 개인정보 유출에 대한 우려를 줄일 수 있다.

구글은 이러한 방식을 '인공지능이 개최하는 학술대회'에 비유한다. 의사가 각자 자신의 환자를 치료한 경험을 학회에서 공유하면 다른 의사들이 자신이 경험하지 못한 새로운 질병과 증상에 대해 알 수 있게 된다. 이에 처음 보는 질병의 치료법을 알게 되는 것은 물론, 서로 의논해 더 나은 치료법을 개발할 수도 있다. 이때 의사가 공유하는 정보는 질병과 치료법에 대한 정보일 뿐, 환자의 개인정보가 아니다.

연합학습 역시 마찬가지다. 의사와 마찬가지로 공통 인공지능 모델이 사용자를 학습한 뒤 서버에 모여 새로운 데이터 처리 방식이나 사용 패턴을 공유한다. 개인정보를 직접 외부로 전송하지 않기 때문에 활용과 보호라는 가치를 모두 충족할 수 있는 셈이다.

사용자 입장에서는 더 가까운 곳에서 인공지능 기반 서비스를 이용할 수 있다. 그간 인공지능 서비스는 인터넷에 연결된 기기가 서버로 데이터를 전송하기 때문에 인터넷 연결 없이 쓸 수 없고 인터넷 품질에 따라 데이터 전송 지연시간 문제도 있었다. 높은 정확도가 필요한 서비스의 경우 서버 인프라를 통한 데이터 처리가 필수지만, 일상의 간단한 서비스는 연합학습을 통해 손에 있는 스마트폰만으로도 인공지능을 활용할 수 있는 셈이다.

◆스마트폰 이용한 모델 구동으로 '과부하' 우려...국내 연구진, 해결 방안 개발

연합학습은 서버 등 인공지능 학습을 위한 대규모 인프라 운영 부담을 해결할 수 있는 방안으로도 주목받고 있다. 기계학습의 경우 수많은 데이터를 활용하면서 이를 보관하고 처리할 수 있는 시스템 자원도 필수적이다. 이와 달리 스마트폰 등 개인용 기기를 통해 각자 학습하는 연합학습은 일종의 분산 컴퓨팅 개념이 된다.

기업 입장에서 상대적으로 적은 인프라로도 최적화한 인공지능 모델을 개발할 수 있다. 방대한 데이터를 저장하는 스토리지나 프로세서를 사용자 개인 스마트폰으로 분산해 시스템 자원을 아낄 수 있다. 또 개선된 모델만을 사용자에게 배포하는 만큼 네트워크 부하에 대한 부담도 적다. 이 때문에 구글을 비롯해 애플, 타오바오 등 세계적 빅테크 기업들이 널리 도입하고 있다.

하지만, 사용자 스마트폰의 자원을 이용하기 때문에 스마트폰에 과부하를 줄 수 있다는 우려도 나온다. 인공지능 모델 학습이 사용자의 스마트폰에서 이뤄지기 때문에, 기기 과부하를 일으켜 배터리 소모, 성능 저하 등이 발생할 수 있기 때문이다.

최근 한국과학기술원(KAIST)은 이러한 우려에 대응해 기존 연합학습 기술의 학습 속도를 가속화하고, 결과적으로 스마트폰 부하를 줄일 수 있는 방법론을 개발했다. 이성주 KAIST 전기및전자공학부 교수 팀은 '학회'에 참여하는 인공지능 모델의 학습 기여도를 평가해 최적의 모델만 활용할 수 있는 방법을 고안했다. 또한 샘플 선택으로 줄어든 학습 시간에 대응해, 학습 기간을 최적화하는 방식으로 모델 정확도를 개선했다.

이성주 교수는 "연합학습은 많은 세계적 기업들이 사용하는 중요한 기술이다ˮ며 "이번 연구 결과는 연합학습의 학습 속도를 향상하고 활용도를 높여 의미가 있으며, 컴퓨터 비전, 자연어 처리, 모바일 센서 데이터 등 다양한 응용에서 모두 좋은 성능을 보여, 빠른 파급효과를 기대한다"고 밝혔다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
공유하기
닫기
기사 이미지 확대 보기
닫기
언어선택
  • 중국어
  • 영어
  • 일본어
  • 베트남어
닫기