NEWSLETTER

노블레스 매거진의 뉴스레터를 신청해보세요.
트렌드 뉴스와 이벤트 소식을 가장 빠르게 확인할 수 있습니다.

닫기

말하는 대로

LIFESTYLE

나는 한국어로 말하지만 상대에겐 일본어로 들리고, 상대의 영어가 내겐 자연스레 한국어로 들리는 시대가 곧 오리라는 기대에서 시작한 인공지능 번역 프로그램의 미래.

번역과 비서, 의사소통은 물론 앞으로 30년 뒤엔 거의 대부분의 직업을 인공지능이 대체할 수 있다고 말하는 <사피엔스>의 저자 유발 하라리

영어 학습은 재미있다. 한데 그걸 써먹는 건 쉽지 않다. 외국인을 만나면 자연스레 과묵한 사람이 되고, 영작을 할 땐 이따금 두통까지 시작된다. 그런데 최근 이런 영어 울렁증을 극복할 수 있는 치료제가 개발됐다. 울렁증을 100% 해소하진 못하지만 크게 완화해준다. 지난해 10월과 11월, 네이버와 구글이 각각 발표한 인공지능(인공신경망) 탑재 번역 프로그램 ‘파파고’와 ‘구글번역’이 그것이다. 이 프로그램은 지난해에 우리를 충격에 빠뜨린 인공지능 바둑 프로그램 알파고와 마찬가지로 지금 이 시간에도 놀라운 속도로 진화하고 있다.
사실 번역 기술 자체만 놓고 보면 PC를 이용한 기계 번역은 그리 신기술이 아니다. PC 보급이 본격적으로 시작된 1990년대에도 단어와 어절, 구 단위로 번역하는 ‘통계 번역(Statistical Machine Translation, SMT)’ 기반의 프로그램이 존재했으니 말이다. 하지만 이들은 대부분 엉터리였다. 일례로 ‘서울시장애인지원센터’라는 문장을 ‘서울시 장애인 지원 센터’라고 번역해야 하는지, ‘서울시장 애인 지원 센터’라고 번역해야 하는지 구분하지 못하거나 ‘나 (걔한테) 차였어’ 같은 문장을 ‘I was a car’라고 번역한 엉터리 결과를 내놓는 일이 부지기수였기 때문이다. 하지만 최근 등장한 인공지능 번역(Neural Machine Translation, NMT) 프로그램은 이전의 통계 번역 프로그램과는 비교도 할 수 없는 성능을 자랑한다. 이들은 어와 구가 아닌, 문장 전체를 통으로 번역한다. 또 스스로 학습하는 인공지능과 빅 데이터를 활용해 시간이 지날수록 번역의 정확도까지 올라간다.

구글번역’에 인공지능을 접목해 괄목할 만한 성장을 이룬 마이크 슈스터 박사

한 예로 현재 서비스 중인 구글번역과 파파고에 각각 ‘가장 가까운 나이키 매장이 어디야?’라고 음성으로 입력하면 ‘Where is the nearest Nike store?’란 번역이 곧바로 튀어나온다. 물론 이런 번역을 돕는 스마트폰 앱의 음성 인식률도 뛰어나다. ‘앉다’, ‘핥다’, ‘훑다’, ‘비치다’, ‘붙이다’ 등의 발음도 귀신같이 인식한다. 더 놀라운 건 문학 번역도 훌륭히 해낸다는 것. 파파고의 경우 헤르만 헤세의 <데미안>에 나오는 유명한 문장 “새는 알에서 나오려고 투쟁한다. 알은 세계다. 태어나려고 하는 자는 한 세계를 깨뜨려야 한다”를 ‘A bird struggles to get out of the egg. The egg is the world. Those who intend to be born must break a world’라고 정확히 번역해낸다. 또 구글번역의 경우 ‘필요한 게 있으면 네이버 블로그에 물어보지만, 좋은 정보만 찾을 수 있다는 보장은 없지’ 같은 복잡한 구어체 문장도 ‘There is no guarantee that if you need anything, you will be able to find good information even if you ask Naver blog’라고 말끔히 번역한다. 쉽게 말해 기존 통계 번역이 ‘A는 B다’식의 주입식 교육이었다면, 인공지능 번역은 꼬마가 시행착오를 겪으며 뭔가를 배우듯 ‘한글-영어’ 번역 데이터가 쌓이면 쌓일수록 더 높은 성능을 발휘하는 프로그램이라 할 수 있다.
이 같은 인공지능 번역의 가장 큰 장점은 사람처럼 문장을 인식하는 것에 있다. 특정 국가의 원어민이 해당 언어를 읽을 때 단어와 어구를 구별해 읽지 않는 것처럼 말이다. 문장 전체를 한눈에 파악한 후 바로 뜻을 이해하는 어떤 기술. 그럼 이쯤에서 드는 우리의 생각은 바로 이런 것일 거다. ‘인공지능 번역기의 성능이 날로 성장하면 언어를 배우지 않아도 되는 날이 올까?’라는 의문. 한데 이 질문의 대답은 지금으로선 ‘No’다. 인공지능 번역 프로그램이라고 늘 완벽한 번역만 내놓는 것은 아니기 때문이다. 특히 이들 프로그램은 문장이 길거나 문장 중간에 숫자가 삽입된 경우 아주 난잡한 번역을 내놓는다. 또 예전엔 제대로 번역한 원문에 구나 절을 더해 문장을 늘리면 괴상망측한 번역이 나오기도 한다. 구글번역에 ‘옛날에 백조 한 마리가 살았습니다’라는 문장을 입력하면 ‘The 100,000,000,000,001 lived long ago’라는 결과를 내놓거나 ‘수능 만점’이란 어구를 넣으면 ‘Seoul National University’라고 ‘초월 번역’하는 참사를 일으키는 것처럼 말이다. 이는 파파고라고 크게 다르지 않다. ‘직구하고 싶은데요’라는 문장을 ‘I’d like fastball(내게 직구로 던져)’이라고 번역해 공포감을 조성하는가 하면, 띄어쓰기 문제의 고전인 ‘아버지가 방에 들어간다’ 같은 문장을 ‘Father enter the bag’으로 번역해 멀쩡한 아버지를 가방에 밀어 넣는 일이 꽤 흔하게 일어난다.

1 인공지능이 최초로 등장한 흑백 무성 영화 <메트로폴리스>(1927)   2 인간과 모든 주제로 일상의 대화를 나누는 인공지능을 다룬 <그녀>(2013)

지난 2월 21일에는 국제통역번역협회와 세종대학교가 ‘인간 대 인공지능(AI)의 번역 대결’을 펼치기도 했다. 국내는 물론 해외 언론까지 몰려든 이 대결은 인간 번역가 4명과 인공지능 번역 프로그램 3개가 같은 과제를 번역하면 출제자인 곽중철 한국통번역사협회 회장을 비롯한 협회 전문가 3인이 점수를 매기는 방식으로 진행했는데, 결국 인간의 승리로 끝났다. 이 결과에 대해 심사위원장을 맡은 곽중철 한국외국어대학교 교수는 “아직까지 인공지능이 정복하지 못한 분야가 바로 텍스트의 이해이며, 인간의 언어는 인간의 다양한 감정이 녹아 있어 그 뉘앙스가 바둑보다 경우의 수가 많고, 문맥이 다양하다”며 “인공지능이 이를 정복하는 데엔 생각보다 오랜 시간이 걸릴 것”이라고 전망했다. 그렇다면 금방이라도 인류의 바벨탑이 될 줄 알았던 인공지능 번역 프로그램이 앞으로 극복해야 할 과제는 무엇일까?
네이버 파파고의 개발자 김준석 리더는 “현재 감성 분석과 대용어 해소, 구문 분석 등은 기계도 어느 정도 가능한 수준이지만 질의응답, 의역, 요약, 대화 등은 기계가 여전히 어려워하는 단계에 속한다”며 “좋은 학습 데이터 확보만이 좋은 번역 프로그램을 만드는 길”이라고 답했다. 한편 지난 2월 초 구글코리아가 개최한 ‘구글AI포럼’에서 화상 세미나를 통해 관계자들 앞에 등장한 구글번역의 아버지 마이크 슈스터(Mike Schuster) 박사는 같은 질문에 “사람이 번역하면 절대 없을 단어 누락과 고유명사, 희귀 용어 오역이 여전히 구글번역에선 발생한다”며 “인공지능 번역이 완벽해지려면 더 많은 시간이 걸릴 것”이라고 잘라 말했다.
소설가 한강을 한국인 최초로 맨부커상 후보에 올린 숨은 주역, 번역가 데버러 스미스는 번역에서 가장 중요한 것으로 ‘문학적 감수성’을 꼽았다. ‘무엇을 말하느냐’보다 ‘어떻게 말하느냐’가 독자에게 큰 영향을 미친다는 얘기다. 문맥에 맞는 두 음절의 형용사를 찾으려고 며칠간 머리를 쥐어짜기도 했다고 고백한 그녀다. 이렇듯 인공지능 번역이 아무리 빠르게 진화한다고 해도 아직 해결해야 할 문제는 차고 넘친다. 한편으론 인공지능이 아무리 발전해도 최종 판단은 인간의 영역으로 남게 될 것이란 점에서 이제 슬슬 전문 번역가의 역할 재정립이 필요하다는 지적 또한 나온다. 이런 얘길 대충 종합해보면, 번역 분야에서만큼은 인간과 기계 사이의 협업이 반드시 이루어져야 한다는 답이 나오기도 한다. 인공지능은 지금 어디를 향해 가고 있을까? 인공지능이 인간의 삶을 풍요롭게 만들 수 있는 사회를 기대한다.

 

에디터 이영균(youngkyoon@noblesse.com)