한영, 한중 번역이 잘 안되는 이유

2 Comments

전문가가 아니라서, 또 전문가들은 이미 파악하고 있는 내용일지 모르겠지만, 전에 검색엔진을 준비하면서 언어에 대해서 간단한 고찰(-_-)을 해 본 적이 있었다.

그 때 오토태깅(주제어 추출)이라던가 검색어 추출 방식에 대해서 나 나름대로의 개념을 하나 설정했놨었는데, 그 때 생각했던 간단한 핵심 개념은 이렇다.

한국어, 일본어는 의미전달을 주로 명사 위주로 한다

중국어, 영어는 의미전달을 주로 동사 위주로 한다

현재 번역 엔진들은 대부분 단어 매칭 수준에서 구문에 맞는 단어로 변환해주는 방식인 것으로 보이는데, 실제 언어의 의미전달 방식이 다른 언어끼리의 번역 엔진을 만든다면 이 부분에 중점을 둬서 알고리즘을 만들면 잘 나올 것 같다.(해봐야 알겠고 생각한대로 나오지 않을 수도 있겠지만, 대충 생각한 것도 있고..)

물론 이 개념만으로는 한참 부족하겠지만, 언어라는 것은 의미전달을 목적으로 두고 있는 것이기 때문에 단순히 말을 만들어내는 것이 아니라, 의미를 전달한다는 개념으로 번역을 하는 것이 어떻겠냐는 생각이랄까.

꼬랑지. 흠. 여담이고 뭐든 그렇긴 하겠지만, 검색엔진(인덱서가 아닌)은 제대로 하려면 정말 돈이 많이 드는 사업인 듯. 개인이 짬짬히 하려니 아쉬운 점이 많다.

2 Comments (+add yours?)

  1. FX-J
    Jun 15, 2008 @ 19:29:08

    영어 전공학생으로서 매일 생각했던 주제네요. 한국어가 명사위주이고 영어가 동사위주라는 개념을 못 잡으면 문장이 안 만들어지거든요. 언어학자들의 연구가 최첨단으로 이뤄져서 범용 문법(Universal Grammar)이 등장한다면… 하는 생각도 들고요. 지금 기술로 제일 현실적인 것은 여러 언어의 특징을 위처럼 분석해서, 비슷한 언어군들을 묶고, 중간 단계 언어들을 지정해주고 하는 작업이 필요할 듯 합니다. 사람이 하는 번역은 의미 단위로 하는 경우가 많긴 합니다. 기계를 이용해서 의미 중심의 번역을 하기 위해서는 의미를 추상화 시키는 인공지능이 나와야 할 듯 합니다.

    개인적인 바램이 있다면, 검색엔진이나 번역엔진 등 컴퓨터상에서 언어를 받아들이고 처리하는 기술이 공동으로 개발되어서, 디지털 환경에서 언어를 쓸 때 좀 더 효율적이고 정확하게 쓸 수 있도록 했으면 좋겠다는 생각을 합니다.

  2. 골빈해커
    Jun 15, 2008 @ 19:44:25

    FX-J / 역시 같은 생각을 하시는 분들이 계시는군요. ^^ 방식에 있어서 저도 동일한 방법을 생각했습니다. 잘은 못하지만 프로그래밍쪽에서 인터프리터 언어쪽을 많이 해왔던터라, 중간 코드라는 개념을 상당히 좋아했습니다.

    Java, perl, ruby, python 등 근래 인기있는 언어들은 대부분 프로그래밍 후 바이트코드라는 중간 코드로 바꾼 후 실행을 하게 되는데요. 그렇게 되면 그 다음에는 (이론적으로는) 어떠한 컴퓨터와 플랫폼에서도 해당 프로그램을 인식할 수 있게 되는거죠.

    즉, 이 프로그래밍 언어의 해석처럼 어떠한 언어로든 변환할 수 있는 중간 단계의 (의미 기반)언어를 만들고, 그 다음에 어떠한 언어든지 중간 언어로 변환 그 다음 변환하고픈 다른 언어로 변환하게되면 어떠한 언어든지 상호 번역이 훌륭하게 이루어지지 않을까라는 생각이었습니다. ^^

Leave a Reply