플랫
플랫

플랫팀

여성 서사 아카이브

AI 지도책

케이트 크로퍼드 지음·노승영 옮김|소소의책|392쪽|2만1000원

실리콘밸리는 미국의 캘리포니아주 샌프란시스코만을 둘러싼 첨단기술 연구단지다. 세계에서 가장 부유한 기업 아마존, 구글, 애플, 메타, 마이크로소프트 등이 이곳에 자리잡고 있다. 미 항공우주국 모펏 연방 비행장 근처에 구글 본사가 있다. 제2차 세계대전 당시 미 해군의 주력 비행장이던 이곳은 이제 구글의 고위 임원들의 개인 전용기 주기장으로 쓰인다. 제국주의 전쟁에 쓰이던 비행장이 구글 임원의 비행장으로 변한 것은 누가 이 세계를 지배하는가를 상징적으로 보여준다.

샌프란시스코는 1800년대 캘리포니아와 네바다 땅에서 캐낸 금과 은으로 지어졌다. 이 도시는 광업과 채굴에 의해 번성했다. 200년이 지나 샌프란시스코의 첨단산업을 떠받치는 것 역시 채굴이다. 반짝이는 금빛이 탁한 은빛으로 바뀌었을 뿐이다. 네바다에는 미국 유일의 리튬 광산 실버피크가 있다. 리튬은 스마트폰·전기차 등의 배터리 연료로 AI 산업에 필수적이다. 리튬은 ‘회색 금’으로 불린다. 일론 머스크가 가장 탐내는 광물이다.

인공지능이라고 하면 알파고가 이세돌을 상대로 승리를 거두는 장면처럼 인간을 초월하는 지능, 데이터와 연산으로 이뤄진 순수한 기술과 같은 이미지가 떠오른다. 그것은 표피적 이미지에 불과하다. AI를 떠받치는 것은 리튬 광산에서 착취당하는 노동자, 폐기물이 만들어내는 탄소발자국, 초저임금을 받고 일하는 크라우드 노동자, 개인정보를 무상으로 기업에 제공하는 사람들이다. <AI 지도책>을 쓴 케이트 크로퍼드는 단호하게 “AI가 인공적이지도 않고 ‘지능’도 아니다”라고 주장한다.


2018년 영국 헤멜 헴스테드에 있는 아마존 풀필먼트 센터의 보관 선반대에서 직원이 고객이 주문한 상품을 고르고 있다. 게티이미지

2018년 영국 헤멜 헴스테드에 있는 아마존 풀필먼트 센터의 보관 선반대에서 직원이 고객이 주문한 상품을 고르고 있다. 게티이미지



도발적으로 들릴지도 모르지만 귀를 기울일 필요가 있다. 가령 이런 말은 어떤가? “전 세계 연산 인프라의 탄소발자국은 이미 항공업계 최고치에 도달했으며 더욱 빠르게 증가하고 있다.” “국제노동기구가 아마존 메커니컬 터크, 마이크로워커스 등 인기 작업 플랫폼의 75개국 3500명 크라우드 노동자를 대상으로 설문조사를 했더니 고학력의 과학·기술 전문가였음에도 현지 최저임금을 밑도는 급여를 받는 경우가 많았다.” 아마존이 직원을 추천하고 채용하는 절차를 자동화했더니 “시스템이 여성을 추천하지 않았다. 시스템은 ‘여성’이라는 단어가 들어 있는 이력서를 적극적으로 평가 절하했다.”

마이크로소프트 연구소 선임 수석 연구원인 저자는 10여년간 연구를 바탕으로 AI가 어떤 정치적·사회적 의미를 지니며 세계를 재편하고 있는지를 다각적으로 검토하며 입체적 지도를 그려낸다. “인공지능을 추동하고 지배하는 국가와 기업, 지구에 흉터를 남기는 추출식 채굴, 데이터 대량 수집, 이를 떠받치는 불평등하고 착취적인 노동 관행 등을 설명하는 AI 이론이 필요하다.” <AI 지도책>은 이러한 시도다.

저자는 인공지능이 순전히 기술적 영역에 속한다는 통념에서 벗어나 ‘정치·노동·문화·자본을 아우르는 대규모의 산업적 구성물’로 정의한다. 또 지구의 에너지와 광물 자원, 값싼 노동력, 대규모 데이터를 추출하는 ‘추출 산업’이라고 규정한다. “AI는 널리 알려진 것보다 훨씬 더 많은 것을 우리와 지구로부터 뽑아낸다.”

리튬은 충전용 배터리에 필요한 원료다. 전 세계의 연산과 상거래는 배터리에 의존한다. 실버피크에서 320㎞ 떨어진 곳에 세계 최대의 리튬 배터리 공장인 테슬라의 기가팩토리가 자리하고 있다. 케이트 크로퍼드 사진 크게보기

실버피크의 리튬 광산

리튬은 충전용 배터리에 필요한 원료다. 전 세계의 연산과 상거래는 배터리에 의존한다. 실버피크에서 320㎞ 떨어진 곳에 세계 최대의 리튬 배터리 공장인 테슬라의 기가팩토리가 자리하고 있다. 케이트 크로퍼드

네바다의 리튬 광산 실버피크에서 책은 시작한다. 리튬은 충전용 배터리의 핵심 원료로 실버피크에서 320㎞ 떨어진 곳엔 테슬라의 기가팩토리가 있다. 세계 최대의 리튬 배터리 공장으로, 테슬라는 세계 1위의 리튬 이온 배터리 소비처다. 스마트폰 배터리에 약 8g의 리튬이 들어간다면, 테슬라 전기차 모델 S의 배터리팩에는 63㎏의 리튬이 들어간다. 저자는 전기차가 화석연료로 굴러가는 차의 해결책과는 거리가 멀다고 말한다. “배터리 공급사슬에서 이뤄지는 채굴, 제련, 추출, 조립, 운송은 환경에 심각한 악영향을 끼치며 환경 파괴는 지역사회에 피해를 입힌다.”

내몽골 바오터우엔 검은색 진흙으로 메워진 인공 호수가 있다. 희토류를 채굴하고 남은 부산물 가루가 1억8000만t 이상 쌓여 있다. 희토류는 전자, 광학, 자력에 널리 쓰이는 광물이지만, 폐기물 독소 비율이 상상을 초월한다. 채취된 점토의 희토류 함유량은 0.2%에 불과하며 99.8%가 폐기물이다. 희토류 1t을 정제해내기 위해선 7만5000ℓ 산성폐기물과 방사성 폐기물 1t이 산출된다. 전기에너지는 말할 것도 없다. 구글, 메타 등은 데이터센터를 가동하는 데 들어가는 엄청난 전기를 가장 싼값에 제공받는다. 정부의 공적자금이 투입된 결과다.

미국의 전기차 제조사 테슬라가 미국 네바다주의 사막에 세운 초대형 전기차 공장 기가팩토리는 미국 유일의 리튬 광산 실버 피크에서 가까운 곳에 바리잡고 있다. 테슬라는 연간 2만8000t 이상의 수산화리튬을 소비하는 것으로 추산된다. 테슬라 제공

테슬라 기가팩토리

미국의 전기차 제조사 테슬라가 미국 네바다주의 사막에 세운 초대형 전기차 공장 기가팩토리는 미국 유일의 리튬 광산 실버 피크에서 가까운 곳에 바리잡고 있다. 테슬라는 연간 2만8000t 이상의 수산화리튬을 소비하는 것으로 추산된다. 테슬라 제공

AI는 인간에게서 노동을 채굴한다. 감시탑에서 간수들이 재소자들을 감시할 수 있는 팬옵티콘은 감시 사회를 상징하는데, 사실 ‘원조’는 작업장에서 노동자들을 감독하기 위한 것이었다. 아마존 물류센터는 ‘현대판 팬옵티콘’의 결정체다. 작업공간엔 시간기록계 수십개가 있고, 작업은 초 단위로 감시되고 기록된다. 창고에서 물품이 스캔되듯이 작업자들도 최대한의 효율을 위해 스캔된다. 휴식시간은 10시간 교대근무 동안 15분에 불과하며 식사 시간은 30분에 무급이다. 로봇들이 알고리즘 춤사위를 펼치는 동안 작업자들은 ‘집품률’(할당된 시간 안에 선별·포장해야 하는 제품 수)을 맞추기 위해 종종거린다. 로봇이 핵심 노동력이며 인간은 로봇이 할 수 없는 자질구레한 허드렛일을 처리한다. 작업자들의 몸은 로봇 알고리즘의 연산 시스템에 맞춰 통제된다. “대규모 연산은 신체의 착취에 깊이 뿌리내리고 있다.”

AI 시스템의 착취적 작업 형태는 ‘고스트 워크(그림자 노동)’로도 나타난다. 수천 시간 분량의 AI 훈련 데이터에 라벨을 붙이고 해로운 콘텐츠를 검토하는 등의 반복적 업무를 하는 ‘크라우드 노동’이다. 이들은 최저임금에 못미치는 돈을 받고 이미지에 태그를 붙이거나 알고리즘이 올바른 결과를 내놓는지 검증하며 AI 시스템을 빠르고 값싸게 개선한다. 아마존이 메커니컬 터크를 제작한 이유는 쇼핑몰 사이트에 중복 게시된 제품을 AI 시스템이 걸러내지 못했기 때문이다. 보이지 않는 익명의 노동자들이 푼돈을 받고 AI를 대체했다. 제프 베이조스는 이를 ‘인공 인공지능’이라고 불렀다.

미국 아마존 물류센터에서 한 노동자가 물류를 분리하고 있다. AP 연합뉴스

아마존 물류센터

미국 아마존 물류센터에서 한 노동자가 물류를 분리하고 있다. AP 연합뉴스

AI의 ‘지능’은 데이터의 반복학습에서 비롯한다. AI 훈련을 위해선 무한에 가까운 데이터가 필요하다. “데이터는 새로운 석유”가 됐으며 플리커, 유튜브, 구글 이미지가 새로운 원전이 됐다. 인터넷에서 대량으로 긁어모은 사진에 라벨을 붙이고 범주를 나누는 일은 아마존 메커니컬 터크의 저임금 크라우드 노동자들이 맡았다. 이들은 분당 평균 50장의 이미지를 수천개의 범주로 분류했다. 사람들 사진에 ‘주정뱅이’ ‘창녀’ ‘찢어진 눈’과 같은 범주도 있었다. 동의 없는 대량의 데이터 추출, 저임금 크라우드 노동자들의 라벨링은 이후 표준 관행으로 자리잡았다.

라벨링, 즉 분류는 이후 큰 문젯거리를 낳았다. 앞서 아마존의 사례를 떠올려보자. 채용 시스템을 자동화했더니 여성이 배제됐다. 10년에 걸쳐 아마존에 채용된 엔지니어의 절대다수가 남성이었기에, 채용된 남성 직원 이력서를 바탕으로 훈련받은 시스템은 미래의 채용에서도 남성을 추천했다. “언어와 이력서, 회사 자체에 남성성이 스며드는 방식을 통해 편향이 이미 존재하고 있음을 예상치 못하게 드러냈다.” 이는 실리콘밸리 인력의 다양성 결여를 똑똑히 보여주는 동시에 데이터에 내재된 편향을 보여주는 대표적 사례다. 저자는 한발 더 나아가 데이터 학습을 위한 분류 자체가 이미 기존의 권력관계를 반영하며, 지배적 이데올로기를 내재하고 있다고 말한다.

안면인식기술은 19세기 인종차별적 골상학에 기반한다. 두개골 크기로 인류를 분류하고 등급을 매기려 했던(백인이 두개골이 가장 크고 흑인은 가장 작다고 주장했다) 미국의 두개골학자 새뮤얼 모턴의 시도처럼, IBM은 플리커에서 1억장의 이미지를 수집해 이마 높이, 입술 높이, 콧방울 너비를 측정한다. 안면 인식 시스템이 피부색이 짙은 사람과 여성에 대한 오류율이 높다는 문제를 해결하기 위한 시도였다. 이들은 인종적 다양성 문제를 해결하려 했지만, 남녀라는 이분법적 성별 구분을 적용했으며, 이에 속하지 않는 사람은 데이터 집합에서 배제했다. “AI를 이용해 얼굴 사진으로부터 성별, 인종, 성적 지향을 예측하는 사례는 겉모습을 바탕으로 정체성을 추출하고 부여하려는 욕망이라는 점에서 골상학과 관상학을 닮았다.”

브라이언 A. 스미스 제공

컬럼비아 시선 데이터 집합.

브라이언 A. 스미스 제공

최대의 이미지 데이터 훈련 집합인 이미지넷은 ‘성인 여성 신체’와 ‘성인 남성 신체’로 이분법적 성별을 전제한다. ‘남녀 한몸’ 항목이 있지만 이는 ‘사람→호색가→양성애자’ 계층에 놓여 있었다. 3년 전 ‘이미지넷 룰렛’ 사업이 화제가 됐는데, 사람들이 자신의 사진을 업로드하면 어떤 분류에 들어가는지를 볼 수 있었다. 이를 통해 데이터 집합에 인종차별적이고 성차별적 용어가 오랫동안 포함돼 있었다는 사실이 드러났다. 이미지넷은 비치 타월에 누워 있는 여성은 ‘도벽 환자’로, 배우 시고니 위버는 ‘남녀 한몸’으로 분류했다.

분류라는 행위 자체가 왜곡과 편향을 담고 있다. 이미지넷의 분류 속에 트랜스젠더, 논바이너리 등 성소수자는 배제된다. 문제는 메타 같은 거대 기업에서 이용하는 분류 체계를 조사하고 비판하기는 더욱 힘들다는 것이다. “분류 행위는 권력을 집중시킨다. 어떤 차이가 ‘차이’를 만드는지 결정하는 권력을 말한다.”

책은 ‘지도책’이란 제목답게 AI 기술의 물질적 상하부 구조, 역사적 형성과정을 보여주며 첨단기술이란 중립적 이미지 뒤에 숨겨진 AI의 지형학을 그려보인다. 이 책을 읽은 독자는 AI라는 말을 들으면 이제 광부, 크라우드 노동자의 노동 여건, 자동화로 인한 탄소발자국을 떠올리게 될 것이다. 그것이 AI의 진짜 모습에 가까울 것이다.

이영경 기자 samemind@khan.kr


플랫 뉴스레터를 구독해주세요. 밀려드는 뉴스의 홍수 속에서 놓치기 쉬운 젠더 관련 기사들을 매주 금요일 오전 7시 이메일로 만나보실 수 있습니다. 플랫을 만드는 기자들의 소회와 고민, 구독자들과 나누고 싶은 이야기들도 눌러 담았습니다. (▶구독링크 바로가기: https://bit.ly/3wwLnKJ)


TOP
경향신문 회원을 위한 서비스입니다

경향신문 회원이 되시면 다양하고 풍부한 콘텐츠를 즐기실 수 있습니다.

  • 퀴즈
    풀기
  • 뉴스플리
  • 기사
    응원하기
  • 인스피아
    전문읽기
  • 회원
    혜택