국제 컴퓨터 비전·패턴 인식 학회
‘이미지 인식 AI’ 논문 2359편 발표
자율주행·의료·스마트공장 등 활용
2010년 인공지능(AI)을 이용해 이미지 100만건을 사람, 동식물, 사물 등 1000개 항목으로 분류하는 ‘세계 이미지인식 대회(ILSVRC)’가 열렸다. 우승팀은 이미지 100만건 중 약 70만건을 제대로 인식했다. 2년 뒤 캐나다 토론토대학은 같은 대회에서 100만건의 이미지 가운데 약 84만건을 정확히 분류했다. AI가 스스로 이미지를 학습하는 ‘딥러닝’ 기술을 도입한 성과였다. 당시 토론토대학을 이끌며 ‘이미지 인식(비전) AI’의 지평을 연 제프리 힌튼 교수는 이후 구글에 합류했다.
세계 최대 공학 학술단체인 국제전기전자공학회(IEEE)와 국제컴퓨터비전재단(CVF)이 공동 주최하는 ‘국제 컴퓨터 비전 및 패턴 인식 학회(CVPR) 2023’이 18일(현지시간)부터 22일까지 캐나다 밴쿠버에서 열린다. 올해 학회에 접수된 비전 AI 관련 논문은 9155편으로 심사를 거쳐 발표되는 논문은 25.8%인 2359편이다.
비전 AI 기술이 활용되는 대표 분야는 자율주행이다. 주변 사물, 사람, 신호 등을 빠르고 정확하게 인식해 차량 속도와 방향 등을 조작하는 데 활용된다. 이번 CVPR 2023 행사에 앞서 진행된 ‘자율주행 챌린지’ 워크숍에서 현대차그룹 계열사 ‘포티투닷’은 도로 위 점유물 등을 인식하는 능력을 겨루는 ‘3D 점유 예측’ 과제에서 미국 엔비디아에 이어 2등을 차지했다.
공항을 비롯해 보안 유지나 주의가 필요한 장소에서 카메라가 얼굴을 식별하고 졸음 여부 등을 분석하는 안면인식 기술이나 용접 이미지와 회로 패턴 등을 학습해 제품 불량 여부를 판별하는 스마트공장에도 비전 AI 기술이 들어간다.
의료와 광학문자인식(OCR) 분야에서는 국내 AI 스타트업들의 활약이 눈에 띈다. CT, MRI, X레이 등 의료 사진과 영상을 분석해 건강 이상 여부를 판독하는 기술은 ‘루닛’이 개발했다. 종이 문서나 사진 속에 등장하는 문자를 인식해 전산화하는 기술 역시 ‘업스테이지’가 두각을 나타내고 있다.
중국, 최우수상 후보 다수 선정
국내 스타트업, 의료·OCR ‘두각’
전반적으로 비전 AI 분야에서는 중국 연구진의 성과가 두드러진다. 이번 CVPR 2023에서 최우수 논문상 후보에 오른 논문 12편 중에는 시베이공업대, 상하이 인공지능연구소, 홍콩중문대 등 중국 연구팀 논문이 다수 선정됐다.
이번 행사의 주요 관심사는 이미지 인식에 오디오·텍스트 인식 기능까지 더한 ‘멀티모달’ 연구다. 현재 멀티모달 연구는 AI가 이미지를 인식한 뒤 이를 문장으로 설명하는 정도에 머물러 있다. 하지만 조만간 AI가 동영상을 보고 영상 속 이미지뿐 아니라 소리, 텍스트 등을 한꺼번에 분석하는 수준에 이를 것으로 전망된다.
구글·애플·아마존 등 ‘채용 전쟁’
LG 계열사 5곳·현대차도 참여
밴쿠버 현지에서는 기업들의 비전 AI 분야 인재 채용 전쟁도 한창이다. 일단 구글, 애플, 아마존, 퀄컴, 메타(옛 페이스북) 등 미국 빅테크 기업들이 행사장에 부스를 차린다. 비전 AI 기술을 이용해 자율주행차를 개발 중인 테슬라와 아마존이 인수한 무인택시 스타트업인 ‘죽스’도 인재 영입전에 뛰어들었다.
국내에서는 LG AI연구원, LG전자, LG이노텍, LG에너지솔루션, LG유플러스 등 LG그룹 계열사 5곳이 공동으로 최신 AI 기술을 시연한다. 현대자동차그룹도 학회에 참석한 전문가들과 네트워크 구축에 나선다.