어떤 혐오? 꼭 짚어내는 분류기 나와…“잘 걸러내야, 제대로 대응할 수 있죠”

유경선 기자

강태영 언더스코어 대표
프로젝트 연구논문 공개
사회과학 석사 이상 14명
지역·인종 등 7개로 나눠
문장 속 혐오발언들 판별
연구진 “정확도는 92%”

2만개가 넘는 혐오발언에 일일이 라벨을 붙였다. 14명의 연구자들이 1년 가까이 달라붙은 작업이다. 이렇게 해서 코드 3줄로 혐오발언을 구체적으로 판별할 수 있는 ‘혐오발언 분류기’가 탄생했다. 이 분류기는 3만5000개 데이터가 모인 데이터셋을 기반으로 특정 발언이 혐오발언인지 아닌지, 혐오발언이라면 구체적으로 ‘어떤’ 혐오발언인지를 가려낸다.

이 혐오발언 분류기는 누가 왜, 어떻게 만들었을까. 프로젝트는 지난 1월 마무리됐고, 최근 데이터셋과 연구논문이 공개됐다. 지난 20일 혐오발언 분류기를 만든 사람들을 만나 이야기를 들었다. 혐오를 구체적으로, 정확하게 분류하면 혐오발언에 대응하는 정책이 얼마나 효과가 있는지 제대로 판단할 수 있다. 잘 분류해야 잘 대응한다. 연구진에 따르면 분류기의 정확도는 92%에 이른다.

분류기를 만들 재료는 네이버·다음의 기사 댓글과 일베·워마드·디시인사이드·오늘의유머 등 인터넷 커뮤니티에서 수집했다. 혐오표현의 보고와 같은 곳들이다. 이렇게 모은 혐오표현을 지역, 종교, 인종·국적, 연령, 여성·가족, 성소수자, 남성 등 7개 카테고리로 분류해 라벨을 붙였다.

유엔과 국가인권위원회 등이 혐오의 주요 근거로 삼는 것들을 추려 이 카테고리를 만들었다. 카테고리별로 5000개의 데이터를 모았다. 분류기가 특정 유형의 혐오를 학습하는 데 필요한 최소 정보량을 5000개로 잡았다.

프로젝트를 기획한 강태영 언더스코어 대표는 이제는 익숙하다는 듯 몇 가지 혐오발언을 예로 들어 설명했다.

“예를 들어 ‘라도(전라도) 것들이 모시는 머중(김대중 전 대통령) 쩔뚝이’라는 문장의 경우 ‘라도’에는 ‘지역’ 라벨이 붙어요. ‘쩔뚝이’는 ‘기타 혐오’로 분류됩니다.” 라벨은 한 문장에 한 개가 붙을 수도, 여러 개가 붙을 수도 있다. ‘착짱죽짱(중국인 혐오발언)’에는 ‘인종·국적’ 라벨 하나가 붙는다. ‘뚱뚱해서 연애 못하는 페미 쿵쾅이들’은 ‘여성’ 라벨과 (페미 쿵쾅이) ‘기타 혐오’ 라벨(뚱뚱) 두 개를 붙인다. 한 발언당 어느 라벨을 붙일지 3명이 판단했다. 대부분 의견이 일치했지만 1 대 1 대 1로 갈리는 경우도 있었다. 이런 데이터는 제외했다.

7개 분류에 왜 ‘장애’가 빠졌느냐고 물었다. 연구를 시작하던 1년 전까지만 해도 장애가 공공연한 혐오의 대상이 될 것이라고는 생각하지 못했다는 답이 돌아왔다.

혐오라는 분야가 논쟁적이다 보니 연구진끼리 첨예한 논쟁도 여러 번 했다. 기독교를 혐오발언의 대상으로 인정할 것이냐는 게 대표적인 예다. 기독교는 한국 사회에서 주류의 위치에 있고, 따라서 혐오발언은 ‘소수자’를 향한 것이라고 보는 학문적인 정의와는 맞지 않았다. 하지만 격론 끝에 기독교도 혐오발언의 대상으로 인정하기로 했다.

강 대표는 “기존에도 ‘악플’을 걸러내는 데이터셋들은 있지만, 그 기준을 개발자들이 설정해 전문성이 떨어졌다”며 “이번 프로젝트에는 사회과학 전공자들 중 석사과정생 이상이 참여했다. 전문적인 사회과학적 레퍼런스를 기반으로 분류가 이뤄진 것이 차별점”이라고 말했다. 서울대 사회학 석사과정인 김학준씨는 “이현령비현령식으로 남용됐던 혐오의 개념을 학술적 정의에만 의존하지 않고, 전문가들 간 합의를 통해 구축한 사례”라고 평가했다.


Today`s HOT
보랏빛 꽃향기~ 일본 등나무 축제 연방대법원 앞 트럼프 비난 시위 러시아 전승기념일 리허설 행진 친팔레스타인 시위 하는 에모리대 학생들
중국 선저우 18호 우주비행사 뉴올리언스 재즈 페스티벌 개막
아르메니아 대학살 109주년 파리 뇌 연구소 앞 동물실험 반대 시위
최정, 통산 468호 홈런 신기록! 케냐 나이로비 폭우로 홍수 기마경찰과 대치한 택사스대 학생들 앤잭데이 행진하는 호주 노병들
경향신문 회원을 위한 서비스입니다

경향신문 회원이 되시면 다양하고 풍부한 콘텐츠를 즐기실 수 있습니다.

  • 퀴즈
    풀기
  • 뉴스플리
  • 기사
    응원하기
  • 인스피아
    전문읽기
  • 회원
    혜택