지금까지 자연언어치리 분야는 눈부신 발전을 이루어 왔습 니다.소위 인공신경망을 이용한 딥러닝 알고리즘과 빅데이 터로 대표되는 새로운 방법론은 기계 번역 분야나정보 검색 분야에서 예상을 뛰어넘는 성능 향상은 이루어 냈습니다.
그러나 한계 역시 존재합니다. 그것은 인간 언어의 본질과 밀접한 관계가 있습니다.인간 언어는 무한한 생산성을 본질 로 가집니다. 따라서 아무리 큰 규모의 빅데이터를 구축하 더라도 인간 언어가 생산해 낼 수 있는 데이터 전체에 비 하면 ‘0’에 가깝다고 할 수 있습니다.그 이유는 분자가 아무리 크더라도 분모가 무한이면 그 결과는 0에 수렴하기 때문입니다.
이러한 이유로 현재와 같은 방법론을 따르는 솔루션들은 지속적인 데이터 갱신과 엔진 트레이닝이 불가피하고,지속 적인 대규모 비용 발생이 문제로 지적되고 있습니다.환경 문제를 고려할 때에 막대한 컴퓨팅 파워를 요구하는 방식 자체도 간과할 수 없는 문제이지만, 보다 근본적인 문제는 언어의 구조와 작동 원리를 무시한 채 빅데이터와 낮은 수준의 딥러닝 방식으로 진행되는 자연언어 처리 방법론을 통해서는 기계가 인간의 언어를 이해할 수 없다는 점입니다.