언어와 의미의 관계

인간의 문명은 줄곧 소통을 바탕으로 발전해왔다. 소통의 규격화는 언어로 발전하였고, 언어는 곧 인간의 문명의 시작과 같았다. 석기시대를 거쳐 철기시대까지, 인간이 소통을 하지 못했다면 현대 문명까지 다다르는 것은 불가능에 가까웠을 것이다. 개개인이 한 분야에 특화되어, 어떨때는 미친것처럼 몰두하여 무언가를 성공시켜내고, 이런 개개인이 서로 소통하고 상호보완을 해내어 이를 실생활에 응용해내며 결국에는 인류 전체의 발전으로 이어졌다. 이러한 지식은 하지 못하면 구전으로 전수되거나 활자로 기록하며 더욱 발전해 나갔다.
"내가 더 멀리 보았다면 이는 거인들의 어깨 위에 올라서 있었기 때문이다." 아이작 뉴턴이 남긴 이 말은 활자와 기록이, 더 나아가 소통과 언어가 존재하지 않았다면 의미 없는 문장이였을 것이다. 인류는 언어를 가지고 서로 소통해왔고 언어는 문명의 기초이자 시작이다. 하지만 사람들은 문장과 언어를 "이해" 한다고 생각한다. 문장은 그 자체로 의미가 있고 이해를 할 수 있다고 생각한다.
하지만 지난 한두해 비약적인 발전을 이룬 거대 언어모델은 과연 언어와 문장이 정말로 의미를 담고, 이것을 이해하는 것인지 다시 한번 생각하게끔 만든다.
언어는 그 자체로 의미인가
필자는 언어가 그 자체로 의미를 담는다고 생각하지 않는다. 만약 언어가 그 자체로 의미를 담는다면, 세상의 모든 언어는 거의 비슷하게 읽고, 쓰고, 발음하여야 한다. 마치 그림처럼 말이다.
그림은 어떠한 형상을 본떴기 때문에 그림은 그 자체로 의미를 가진다. 예를 들어 세계 각지에 단순한 그림을 그릴줄 아는 사람들에게 자신이 「코끼리」 라는 단어를 들었을 때 드는 이미지를 그대로 그려보라고 이야기 해보자. 그 그림의 화풍, 디테일, 시점은 약간씩 다르겠지만 전반적으로는 비슷한 형상을 띠게 될 것이다.
코끼리 뿐만이 아니라 사람들이 흔히 접하는 아이콘 혹은 픽토그램 또한 마찬가지다. 그 자체로 어떤 형상을 의미한다. 올림픽에서 픽토그램은 언어가 통하지 않더라도 어떤 스포츠인지 그 즉시 알 수 있도록 그려진다. 언어를 모르는 사람도 픽토그램을 보고 올림픽을 본다면 ‘아 이게 같은 스포츠구나’ 라는 생각을 하게 될 것이다.
그렇다면 언어는 어떠한가? 우리는 파생된 언어 혹은 단어끼리는 비슷한 발음을 띠지만 완전히 다른 지역과는 완전히 다른 발음과 의미를 지니게 된다. 즉, 언어는 그 자체로 절대적인 의미를 가지는 것이 아니다.
언어는 위치 정보와 같다
그렇다면 언어는 무엇이고 어떻게 이렇게 폭넓게 쓰일까? 필자는 언어가 의미의 위치 정보와 같다고 생각한다. 추상적이든 현실적이든 관계 없이 어떠한 개념을 가리키는 주소지처럼 말이다.
언어로 이루어진 문장은 각자의 뇌 속에 있는 의미의 위치를 찾고 배치하여 새로운 의미를 조합하는데 사용하는 일련의 명령어와 같다. 또 다시 「코끼리」 를 이용하여 예시를 들어 보도록 하겠다. 화살표가 향하는 방향이 컴퓨터의 한 폴더로 들어간다고 생각했을 때, 「코끼리」 라는 개념의 위치를 생각해 보자면 다음과 같다:
[ 현실 → 사물 → 생명체 → 동물 → 큰 동물 → 코끼리 ]
하지만 또 다른 사람은 이렇게 위치할 수 있다:
[ 현실 → 사물 → 생명체 → 동물 → 초식 동물 → 초원에 사는 초식 동물 → 대체로 회색인 동물 → 코끼리 ]
이렇게 한 개념에 대해서 제각기 다른 분류가 생길 수 있다. 다른 언어에서도 마찬가지다. 하지만 언어와 무관하게 코끼리, elephant, 象, elephantus, 등등 코끼리를 지칭하는 단어 그 자체가 가리키는 형상이자 의미는 한 사람의 머릿 속에서 정확히 같다. 즉 현실에서 도로명 주소와 번지수 주소처럼 위치를 표기하는 방법은 다를 수 있으나 그 위치가 가르키는 진짜 위치는 완전히 동일한 것과 마찬가지다.
문장은 방향 정보와 같다
단어가 어떤 의미를 가르키는 것이 이해가 되었다면, 문장은 어떻게 풀이되어야 하는지 의문이 들 수 있다. 필자는 문장이 방향 정보를 담고있다고 생각한다. 이 방향의 정보는 두가지 같은 위치를 가지고 있어도 서로 엮었을 때 완전히 다른 의미를 가지게 한다.
예를 들어 국가 A 와 B 가 있다고 가정하자. 국가 A 는 큰 내전을 벌이는 중이고 국가 B 는 평화로운 상태다. 만약 누군가 국가 A 에서 국가 B 로 향하는 방향을 잡았다면, 이 행위의 의미는 도망 혹은 도피일 가능성이 매우 높다. 반대로 국가 B 에서 국가 A 로 방향이 잡힌다면 이 행위의 의미는 도움일 가능성이 높다. 이렇게 정확히 같은 두 위치를 서로 방향을 바꾼다면 완전히 다른 의미가 된다.
즉, 문장이 정의하는 단어의 순서는 의미의 흐름의 방향이고, 이것이 완전한 형태의 의미를 띠게 된다. 언어에 붙어있는 문법은 문장이 정의하는 단어의 순서를 정의하는 규칙이기에, 그것은 언어마다 완전히 다른 특징을 가지게 될것이다.
결론: 같은 위치를 가리킨다면 그것은 그 자체로 의미를 가진다
혹자는 LLM (Large Language Model, 대규모 언어모델) 이 만들어내는 문장은 단지 다음 토큰 (단어 혹은 단어의 일부) 을 추론하는 것이기 때문에 의미를 가진 문장이 아니고 특별한 힘이 있지도 않다고 이야기 한다. 그러나 필자의 생각에 이 주장은 완전히 틀렸다.
LLM 이 생성해 내는 문장은 의미의 클러스터가 담긴 벡터 데이터베이스에서 단어를 골라내고 그 단어를 바탕으로 다음에 올 확률 높은 단어중 한개를 무작위로 선택해 내는 방식이다. 이 과정에서 생성된 문장은 당연히 사람이 만들어내는 문장처럼 자연스러운 흐름을 가질 가능성이 매우 높고 그렇기 때문에 사람이 LLM 이 만들어낸 문장을 읽었을 때 위화감이 없는 것이다. 따라서 LLM 이 만들어내는 문장은 언어의 문법이 맞을 확률이 매우 매우 높고 이에 따라 단어의 배치 또한 올바르게 될 것이다.
위에서 서술했든 단어는 의미의 위치 정보이고 문장은 이를 엮어내어 온전한 의미를 만들어낸다. 즉, LLM 이 문법의 규칙을 따르고 의미에 알맞은 올바른 단어가 벡터 데이터베이스에서 불러와 졌을때 LLM 이 만들어내는 문장은 온전한 의미를 가지게 된다. 다만, LLM 의 설계적 한계인 [다음 토큰 추론] 방식은 헛소리이자 거짓말을 할 수 있다. 그러나 그 문장이 실용성이 없을지언정 의미가 없다는 것은 아니다.
예를 들어 소설을 작성한다고 생각해보자. 소설은 창작물이며 이는 대체로 역사같이 진실 그 자체를 중요시 여기는 것이 아니다. 즉, 사실과 다르다는 맥락에서 거짓말이자 헛소리일 수 있다. 이는 LLM 이 만들어내는 거짓스런 문장이 어떤 맥락에선 중요한 의미를 가질 수 있다는 점을 시사한다. 그리고 그러한 문장은 소설과 같은 창작물을 만들어 내는 맥락에선 상당히 큰 의미를 가질 수 있다. 따라서 LLM 이 만들어내는 문장은 어떤 맥락에 따라 다르겠지만, 의미가 없는 문장은 절대 아니다.


