이제 이 속담의 뜻을 모르는 사람들도 있겠다. ‘거름을 지고 장에 간다’ ‘남이 장에 간다니 거름 지고 나선다’는 말은, 아무 생각없이 남을 따라 행동하는 걸 말한다. 밭에 뿌릴 요량으로 거름을 지고 나섰다 얼떨결에 장에 와버렸으니 하루를 날린 셈이다.
때가 때인지라 아주 많은 인공지능(AI) 프로젝트를 보게 된다. 그중 많은 것이 이렇게 서문을 적는다. ‘인공지능의 시대가 왔다. 미국도 이렇게 하고, 중국도 이렇게 하고…’
틀린 말은 아니지만 그게 인공지능 프로젝트의 이유가 되어서는 안 된다. 기실 ‘남이 하니 나도 하겠다’는 말과 조금도 다르지 않기 때문이다. 내 비록 등에 거름을 지고 있지만, 남들이 다 장에 간다고 하니 대장부로서 어찌 장에 가지 않으리요! 시대의 흐름을 외면할 수는 없지 않은가! 이런 말이다.
기술이 부족해서 실패하는 경우는 생각보다 적다. 이런 프로젝트가 실패하는 가장 큰 이유는 ‘문제가 무엇인지 애초에 명확하지 않았기 때문이다’. 많은 프로젝트가 ‘인공지능으로 혁신한다’ ‘인공지능으로 자동화한다’로 시작한다. 이런 말들이 바로 당신이 등에 거름을 진 채 장으로 달려나가게 만드는 마법의 문장이다.
인공지능은 ‘만병통치약’이 아냐
우선 해결 과제가 뭔지 정의하고
적합한 데이터 확보하는 게 관건
성공 기준 미리 정하는 것도 필수
문제를 정의하는 데서 시작하는 게 언제나 옳다. 문제가 뭔지도 모르는 채 도구를 정할 순 없다. 나무를 베는 문제라면 톱이, 못을 박는 문제라면 망치가, 칠을 하는 문제라면 붓이 필요하다. 못 박을 일이 애초에 없는 사람이 아주 멋진 망치가 나왔다고 비싼 값에 사는 건 이상한 일이다. 당신 지금 등에 거름을 지고 있어요!
인공지능이 하는 일을 한마디로 정의하면 다음과 같다. ‘방대한 데이터를 학습한 다음 그 속에 잠재된 패턴을 찾아낸다.’ 그러므로 충분한 데이터가 없다면 인공지능은 힘을 쓰지 못한다. 잠재된 패턴이 없는 일이라면 그것도 인공지능이 풀 문제가 아니다. 예를 들어 ‘이 건물의 3층 어디에 화장실이 있나요?’와 같이 명확한 답이 있는 문제에 굳이 인공지능을 쓸 필요는 없다.
다음과 같은 질문에 ‘예’가 많을수록 효과가 있다.
같은 판단을 하루에도 여러 번 반복하는가? 사람이 처리하기에 업무량이 너무 많은가? 봐야 할 문서, 자료, 규정이 너무 많은가? 완전 자동이 아니라 ‘보조’만 해줘도 효과가 있는가?
데이터가 무엇보다도 중요하다. 풀 문제를 정의했다면 그에 맞는 데이터를 확보해야 한다. 어떤 인공지능 모델을 썼느냐보다 어떤 데이터를 확보했느냐가 프로젝트의 성패를 좌우한다. 어떤 데이터가 필요한가? 그 데이터는 어느 부서가 가지고 있나? 협업은 어떻게 해야 하나? 각 부서의 역할과 책임은 무엇인가? 데이터의 포맷은 통일돼 있나? 제때 현행화되고 있나? 등을 물어야 한다.
가령 행정안전부에서 인공지능 기반의 ‘재난재해통합예방 및 대처센터’를 만든다고 하자. 홍수만 보더라도 홍수위험지도(국가·지방 하천), 도시침수지도와 침수흔적도, 배수펌프장 데이터, 도로 침수 통계, 지하차도 침수 기록 등이 필요하다. 데이터들이 전국의 지자체를 비롯해 여러 부처에 걸쳐 있다는 걸 알 수 있다. 이 데이터들을 다 모아야 하는데, 다들 알듯 부처들은 사일로처럼 일한다. 협업이 보통 어려운 게 아니다. 모으기만 해서도 안 된다. 지속적으로 현행화를 해야 한다. 애써서 모아도 이번에는 공간 데이터, 시계열 데이터, 지도의 포맷이 제각기 다르고 수집 주기도 제각각이다. 바로 쓰지 못한다는 것이다. 산 넘어 산인데 이게 끝이 아니다. 가령 도시침수지도는 지자체에서 공개하기를 꺼린다. 집값이 떨어진다는 게 이유이다. 이쯤 되면 인공지능 모델을 어떤 걸 써야 하나와 같은 건 아주 사소한 문제라는 걸 알 수 있다.
프로젝트를 시작할 때 반드시 해야 할 일이 성공의 기준을 미리 정하는 것이다. 우리나라 정부 프로젝트가 대부분 성공하는 이유는 사후에 기준을 정하기 때문이다. 화살을 쏜 다음 과녁을 정하는 것이다. 화살이 꽂힌 곳에 가서 표적을 그리니 틀릴 리가 있나!
사용자 수가 얼마나 되나? 처리시간은 얼마나 빨라졌나? 담당자의 업무 부담은 얼마나 줄었나? 고객의 만족도는 얼마나 높아졌나?… 목표로 하는 지표가 ‘얼마나 좋아지면 성공인가’를 반드시 사전에 정해야 한다. 당신의 인공지능 프로젝트가 성공하기를 간절히 바란다. 당신의 보고서가 ‘인공지능으로 혁신한다’ ‘인공지능으로 자동화한다’로 시작한다면 그건 당신의 등에 거름이 있다는 뜻이다. 언제나 문제를 정의하고 데이터를 확보하는 데서 시작해야 한다.
박태웅 녹서포럼 의장