영어

한국어

순수 LLM의 필연적인 도태

순수 LLM의 필연적인 도태

날짜

March 20th, 2026

소요 시간

7분

AI의 미래는 왜 언어 중심 시스템에만 속하지 않는가 

순수 LLM은 성공했기 때문에 오히려 한계에 직면하고 있습니다. 

언어 생성에서 놀라운 성과를 이루었지만, 동시에 언어만으로 할 수 있는 것의 경계를 드러냈습니다. 모델은 질문에 답하고, 보고서를 작성하며, 코드를 생성할 수 있지만, 여전히 자신이 설명하는 실제 세계와는 근본적으로 분리되어 있습니다. 유창함은 강력했지만, 그 것만으로는 충분하지 않았습니다. AI가 실제 업무, 실제 환경, 그리고 실제 결과에 가까워질수록 이러한 한계는 더욱 분명해집니다. 

다음 단계의 AI는 언어를 인지, 계획, 행동, 그리고 피드백과 연결할 수 있는 시스템을 구축하는 데 있습니다. 다시 말해, 미래는 단순히 말을 잘하는 모델이 아니라, 현실 세계에서 책임 있게 작동할 수 있는 시스템에 달려 있습니다. 

이 글은 하나의 간단한 주장을 제시합니다. 순수 LLM만으로는 충분하지 않습니다. 고부가가치 AI 시스템에서 언어 모델은 점점 더 전체 시스템이 아닌, 더 큰 아키텍처를 구성하는 하나의 요소로 기능하게 될 것입니다. 

순수 LLM의 한계 

언어 모델의 한계를 설명하는 가장 중요한 논의 중 하나는 Emily M. Bender와 Alexander Koller가 2020년에 발표한 Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data에서 제시되었습니다. 이들의 핵심 주장은 다음과 같습니다. 어떤 시스템이 언어의 형식, 즉 구조와 통계적 패턴에만 접근할 수 있다면, 그 시스템이 의미—곧 언어와 세계 간의 관계—까지 이해하고 있다고 자동으로 결론 내릴 수는 없다는 것입니다. 

언어는 단어와 사물을 연결하는 다리 역할을 하지만, 사물의 존재는 그것을 어떻게 부르느냐에 의존하지 않습니다. 어떤 대상은 “apple”, “사과”, “trái táo”라고 불리든 그 자체로 동일한 존재입니다. 

이 관점에서 보면, LLM은 단어, 구문, 문맥 사이의 매우 정교한 관계를 학습할 수는 있지만, 이러한 패턴을 실제 물리적 대상, 현실의 사건, 혹은 세계의 인과 구조와 직접적으로 연결하지는 못할 수 있습니다. 즉, 다음 토큰을 예측하는 데는 뛰어나더라도, 그 토큰이 지시하는 대상과의 실질적인 연결은 여전히 결여될 수 있습니다. 

이를 잘 보여주는 예로 다음 문장을 들 수 있습니다. 

“The apple does not fit in the pocket because it is too small.” 

여기서 “it”이 무엇을 가리키는지를 해결하는 것은 단순한 문법만으로는 불가능합니다. 이는 현실 세계에 대한 배경 지식을 필요로 합니다. 주머니가 사과를 담기에는 너무 작을 수는 있지만, 사과가 너무 작아서 들어가지 않는 것은 일반적인 설명이 아니기 때문입니다. 이는 실제 세계에 대한 이해에 의존하는 문제입니다. 

이러한 이유로, LLM이 언어를 “이해한다”는 주장 역시 ‘이해’를 어떻게 정의하느냐에 크게 좌우됩니다. 만약 이해를 언어 구조를 매우 높은 정확도로 모델링하는 것이라고 본다면, LLM은 분명 놀라운 성과를 이룬 것입니다. 그러나 이해가 언어를 세계와 연결하고, 행동을 통해 가설을 검증하며, 그 결과에 따라 내부 모델을 업데이트하는 것까지 포함한다면, 순수 LLM은 여전히 상당한 격차를 안고 있습니다. 

언어에서 접지(Grounding)로: World Scope 5단계 

형식만으로 충분하지 않다면, 무엇이 부족한 것일까요? 

Bisk et al. (2020) [2]은 이에 대해 영향력 있는 답을 제시합니다. 바로 경험입니다. 이 관점에서 언어는 독립적으로 존재하지 않습니다. 언어는 반드시 지각, 행동, 그리고 환경과의 상호작용에 기반을 두어야 합니다. 저자들은 이를 설명하기 위해 World Scope라는 프레임워크를 제안하며, 그라운딩의 5단계를 다음과 같이 구분합니다. 

  • WS1 – Corpus: 정적인 텍스트로서의 언어 

  • WS2 – Internet: 온라인에 존재하는 방대한 텍스트 지식에 반영된 언어 

  • WS3 – Perception: 이미지, 소리 등 감각 신호에 기반을 둔 언어 

  • WS4 – Embodiment: 시스템이 환경 속에서 행동하고 그 결과를 경험함 

  • WS5 – Social: 사회적 상호작용을 통해 의미가 공동으로 형성됨 

오늘날의 순수 LLM은 WS1에서 강점을 보이며, WS2에서도 상당한 성과를 보여주고 있습니다. 또한 많은 멀티모달 시스템이 WS3로 확장되며, 언어를 이미지, 음성, 영상 등 다양한 지각 정보와 연결하고 있습니다. 

그러나 가장 중요한 전환은 WS4에서 일어납니다. 이 단계에서 AI는 더 이상 세상을 설명하는 데 그치지 않고, 실제로 그 안에서 행동하기 시작합니다. 

인간 이해와 LLM "이해"의 차이점
인간 이해와 LLM "이해"의 차이점

WS3와 WS4의 차이는 관찰과 경험의 차이입니다. 

WS3 단계에서 시스템은 사과가 위로 떠오르기보다 아래로 떨어진다는 사실을 학습할 수 있습니다. 하지만 WS4에서는 단순히 데이터로 그 규칙을 전달받는 데 그치지 않습니다. 시스템은 직접 행동하고, 실수를 하며, 그 결과를 관찰하고, 환경으로부터의 피드백을 바탕으로 자신의 행동을 수정할 수 있습니다. 다시 말해, 이해는 더 이상 설명만으로 이루어지는 것이 아니라, 행동의 결과를 통해 형성됩니다. 

이것이 바로 Embodied AI가 중요한 방향으로 떠오른 이유입니다. 이 맥락에서 지능은 더 이상 생성된 응답의 품질만으로 평가되지 않습니다. 대신, 오류에 비용이 따르는 동적이고 불확실한 환경에서 효과적인 의사결정을 내릴 수 있는 능력이 핵심 기준이 됩니다. 

Embodied AI와 다음 시스템 계층 

지식이 사전에 주어지지 않는 환경에서는, 의미 있는 이해는 종종 행동, 피드백, 조정의 반복적인 사이클을 통해서만 형성됩니다. 

대형 기술 기업들은 이를 일찍이 인식했습니다. Meta는 Embodied AI 연구를 위한 시뮬레이션 플랫폼인 Habitat을 개발했습니다. DeepMind는 로보틱스 및 제어 연구에서 MuJoCo와 같은 물리 시뮬레이션 환경을 활용해왔습니다. 또한 NVIDIA는 로보틱스와 강화학습을 위한 고성능 시뮬레이션 인프라를 구축했습니다 [4]. 이들의 공통점은 분명합니다. 단순히 텍스트에만 의존하는 학습을 넘어, AI가 관찰하고, 행동하며, 그 결과로부터 학습할 수 있는 환경에 투자하고 있다는 점입니다. 

시뮬레이션은 거의 필연적인 선택입니다. 현실 세계에서 데이터를 수집하는 것은 비용이 많이 들고, 속도가 느리며, 통제가 어렵고, 때로는 물리적 위험까지 수반합니다. 반면 시뮬레이션 환경은 대규모 실험을 훨씬 저렴하고 반복 가능하게 만들어 주기 때문에, 의사결정 시스템을 학습하고 검증하는 데 이상적인 조건을 제공합니다. 

이러한 환경 속에서 AI는 월드 모델(World Model), 즉 세계가 어떻게 작동하는지를 나타내는 내부 표현을 구축하거나 정교화하는 법을 배웁니다. 월드 모델은 지각, 예측, 계획, 의사결정을 지원합니다 [5]. 어떤 시스템도 행동과 결과 사이의 인과 관계에 대한 신뢰할 수 있는 모델 없이는 효과적으로 계획을 세울 수 없습니다. 

기술적인 관점에서 볼 때, 많은 최신 에이전트형 시스템은 서로 상호작용하는 세 가지 계층으로 설명될 수 있습니다. 

1. 고수준 계획 

가장 상위 계층에서는 LLM이나 기타 대규모 모델이 전략적 기획자로서 역할을 합니다. 목표를 해석하고, 작업을 분해하며, 전반적인 행동 방향을 선택하고, 개념적 수준에서의 추론을 유지합니다. 

2. 월드 모델링 

중간 계층에서는 시스템이 월드 모델 또는 시뮬레이션 메커니즘을 활용해, 다양한 행동 시나리오에서 어떤 결과가 발생할지를 예측합니다. 이는 계획이 단순한 언어적 추론을 넘어, 환경에 대한 구조화된 예측으로 확장된다는 점에서 중요합니다. 

3. 정책 및 제어 

가장 하위 계층에서는 정책 네트워크나 제어 모듈이 환경 내에서의 구체적인 행동 실행을 담당합니다. 

이러한 3계층 아키텍처는 Embodied AI 및 의사결정 연구에서 점점 더 보편화되고 있습니다 [6]. 이는 중요한 현실을 반영합니다. AI의 가치는 더 이상 언어 모델 자체에만 있는 것이 아니라, 언어, 월드 모델, 그리고 실행을 연결하는 능력에 있다는 점입니다. 

하지만 여기에도 여전히 중요한 한계가 존재합니다. 많은 현재 시스템에서는 경험이 주로 행동 계층이나 국소적인 계획 개선에는 기여하지만, 그 경험이 언어 모델의 가장 깊은 인지적 기반까지 완전히 반영되지는 않습니다. 다시 말해, AI는 지능을 ‘몸’에 연결하기 시작했지만, 아직 그 ‘몸’이 최상위 수준의 지능 자체를 재구성하도록 만들지는 못했습니다. 

따라서 Embodied AI는 중요한 진전이지만, 최종적인 해답은 아닙니다. 

왜 순수 LLM은 점점 충분하지 않게 되는가 

전략적인 관점에서 보면, 순수 LLM은 더 이상 고부가가치 환경에서 완전한 제품으로 기능하기에는 충분하지 않습니다. 

그 이유는 크게 네 가지로 정리할 수 있습니다. 

1. 언어는 현실의 모든 것을 포괄하지 못한다 

많은 중요한 기업 문제는 단순히 설명하거나 답하는 문제가 아닙니다. 그것은 행동하고, 우선순위를 정하며, 개입하고, 변화하는 환경에 적응하고 대응하는 문제입니다. 

2. 가치는 모델에서 시스템으로 이동하고 있다 

초기 생성형 AI 시대에는 더 강력한 모델을 보유하는 것이 경쟁력이 될 수 있었습니다. 그러나 시간이 지날수록 지속 가능한 가치는 시스템 설계로 이동하고 있습니다. 여기에는 메모리, 도구 활용, 워크플로우 통합, 안전성, 평가, 관측 가능성, 그리고 도메인 특화 데이터가 포함됩니다. 

3. 현실 세계의 과제는 오류에 실제 비용을 부과한다 

잘못된 답변을 하는 챗봇은 단순히 불편함을 줄 수 있습니다. 그러나 금융, 운영, 보안처럼 민감한 영역에서 잘못 행동하는 AI 에이전트는 직접적인 손실과 위험을 초래할 수 있습니다. 이로 인해 AI는 “그럴듯한 응답 생성”에서 “책임 있는 행동”으로 나아갈 수밖에 없습니다. 

4. 기업용 AI는 새로움보다 신뢰성을 요구한다 

AI의 3가지 물결
AI의 3가지 물결 

조직이 AI를 도입하는 이유는 비용 절감, 운영 속도 향상, 의사결정 표준화, 그리고 실제 프로세스 내에서의 안정적인 수행을 위해서입니다. 

이를 위해서는 단순한 언어 생성 능력을 넘어, 통합, 거버넌스, 보안, 그리고 시스템 피드백을 통한 지속적 개선 능력이 필요합니다. 

이것이 바로 순수 LLM의 “필연적인 도태”가 의미하는 바입니다. 이는 완전한 소멸이 아니라 역할의 재정의입니다. LLM은 여전히 매우 중요한 기술로 남겠지만, 점점 더 독립적인 시스템이 아닌, 더 큰 시스템 안의 핵심 인프라 구성 요소로 자리잡게 될 것입니다. 

기업과 스타트업을 위한 전략적 시사점 

AI 전략을 수립하는 기술 기업과 엔터프라이즈에 주는 가장 중요한 교훈은 바로 이것입니다. LLM 수준에서 멈추지 마십시오. 

기업을 위한 제언 

이제 전략적 화두는 '우리 조직이 언어 모델을 사용해야 하는가'가 아닙니다. 그보다는 '우리가 구축하는 AI가 단순한 챗봇인가, 아니면 업무 흐름을 관찰하고 결정하며 영향을 미칠 수 있는 시스템인가'에 집중해야 합니다. 

이를 위해 다음과 같은 실질적인 질문을 던져야 합니다. 

이 모델이 도구(Tools), 메모리, 고유 데이터 및 제어 메커니즘과 연결되어 있는가? 

시스템이 환경적 피드백으로부터 학습할 수 있는가, 아니면 그저 정교해진 언어 패턴을 반복하기만 하는가? 

우리가 만들고 있는 것은 단순한 '인터페이스'인가, 아니면 '운영 계층(Operating layer)'인가? 

스타트업을 위한 제언 

빅테크 기업은 1을 100으로 확장하는 스케일업에는 압도적으로 강하지만, 0에서 1을 만드는 혁신에는 기민함이 떨어지는 경우가 많습니다. 자원이 제한된 스타트업에게 가장 유망한 기회는 다음과 같은 영역에 있습니다: 

좁지만 가치가 높은 수직적 워크플로우를 위한 오퍼레이터 시스템 설계 

AI가 행동하고 학습할 수 있는 도메인 특화 환경 구축 

범용 시스템이 효과적으로 최적화할 수 없는 평가 루프 및 안전 제약 조건 생성 

일반인을 위한 제언 

AI가 기호를 다루는 능력이 점점 더 뛰어해지는 세상에서, 인간의 가치는 텍스트만으로는 압축하기 어려운 역량과 더욱 밀접해질 것입니다. 즉, 불완전한 정보 하에서의 판단력, 결과에 대한 민감성, 삶의 경험에 뿌리를 둔 창의성, 그리고 세상과의 진정한 상호작용을 통해 의미를 구축하는 능력이 중요해집니다. 

이것이 바로 글쓰기, 만들기, 테스트하기, 그리고 현실과 마주하는 일이 여전히 중요한 이유입니다. 모델은 비범한 유창함으로 언어를 재조합할 수 있습니다. 하지만 사고의 깊이는 대개 언어만으로는 해결할 수 없는 한계, 피드백, 그리고 현실에 대한 직접적인 노출에서 비롯됩니다. 

진정한 변화: 유창한 모델에서 책임 있는 시스템으로 

오늘날 AI 분야에서 일어나는 가장 중요한 변화는 유창한 모델에서 책임 있는 시스템으로의 전환입니다. 

유창한 모델은 세상에 대해 설득력 있게 말할 수 있습니다. 반면, 책임 있는 시스템은 세상 속에서 행동해야 하고, 세상의 제약 속에 머물러야 하며, 세상속에서 도출된 결과로 평가받아야 합니다. 

언어 전용 시스템은 여전히 많은 맥락에서 유용할 것입니다. 하지만 성공 여부가 역동적인 환경, 인과 구조, 실행의 신뢰성, 그리고 피드백 루프에 달려 있는 과업에서, 순수 LLM은 점차 그 불완전함을 드러내고 있습니다. 

AI의 머지않은 미래는 정확하게 관찰하고, 정확하게 행동하며, 정확하게 학습할 수 있는 시스템의 것이 될 것입니다. 

더 알아보기LLM 시스템에 실제로 필요한 데이터 파이프라인은 무엇인가?

Newsletter

더 보기

안녕하세요 또는 XIN CHÀO

contact@upp-technology.com

+84 38 890 1954

대화하기

원하신 정보를 이메일로 보내드립니다

이메일을 입력해 주세요

원하시는 내용을 입력해 주세요

구독하기
KSA Cloud
ISO 9001:2015
ISO 27001:2022

Hanoi, Vietnam

Web3 Tower, No. 15, Alley 4, Duy Tan, Cau Giay, Hanoi, Vietnam

© 2025 UPP 글로벌 테크놀로지

솔루션을 찾고 계신가요? UPP를 찾으세요!

개인정보 보호정책