ORIGINAL THOUGHT PAPER · MAY 2026

AI 시대가 증분지식에 미치는 영향

무임승차 가속, 시행착오 비용 회수 붕괴, 그리고 문명 정체의 구조적 리스크

The Impact of the AI Era on Incremental Knowledge:
Accelerated Free-Riding, Trial-and-Error Collapse,
and the Structural Risk of Civilizational Stagnation


발행일 2026년 5월 3일
분류 오리지널 사유논문 (Original Thought Paper)
분야 AI 인식론 · 지식경제학 · 문명 리스크 · 인지과학
이조글로벌인공지능연구소
LEECHO Global AI Research Lab
&
Claude Opus 4.6 · Anthropic
V2
자매편 · 「증분지식과 존량지식」(V2) 및 「인간 생물학적 인지 프런트엔드 시스템 분석」(V3)의 이론적 프레임워크에 기반

초록 / Abstract

본 논문은 「증분지식과 존량지식」의 자매편이며, 동시에 「인간 생물학적 인지 프런트엔드 시스템 분석」이 제공하는 인지 아키텍처 이론 위에 수립되었다. 본 논문은 AI가 증분지식 생산에 대해 가하는 체계적 위협을 논증한다. 첫째, AI는 역사상 가장 효율적인 존량 재활용 기계로서, 증분지식이 생산된 후 무임승차되기까지의 전환 주기를 거의 영(零)에 수렴하도록 압축한다—이는 이미 실증 데이터로 뒷받침된다: ChatGPT 출시 불과 8개월 만에 프리랜서 작문 수요가 30% 하락했고, 기업의 프리랜서 지출은 이전의 5분의 1 수준으로 폭락했다. 둘째, AI는 인간을 대체하여 진정한 증분 생산을 수행할 수 없다—데이터량이 부족해서가 아니라, 아키텍처 차원에서 다차원 물리적 감각부터 저장-연산 일체형 시냅스 재구성, 무의식적 심상 창발에 이르는 전체 생물학적 경로가 결여되어 있기 때문이다. 셋째, 위 두 가지가 함께 ‘인지적 거품’을 제조한다—사회는 AI가 지식의 경계를 확장하고 있다고 착각하지만, 실제로 AI는 지식 존량의 소진을 가속하면서 공급원을 차단하고 있다. 현재 인터넷 신규 콘텐츠 중 AI 생성 비중은 이미 64%를 초과했으며, 인간 원작 텍스트 데이터는 이르면 2026년 고갈에 직면할 전망이다. 본 논문은 그 종국—증분 생산자 소멸 → 학습 데이터 품질 퇴화 → 인지적 거품과 금융 거품의 중첩적 붕괴 → 정보 암흑시대—이 이미 가동된 경로임을 논증한다.

Section I

AI의 본질: 역사상 가장 효율적인 존량 재활용 기계
The Nature of AI: The Most Efficient Stock Reuse Machine in History

대규모 언어 모델의 기술적 본질은 무엇인가? 모든 상업적 서사를 벗겨 내면, 그것은 인류의 전체 디지털화된 존량 정보를 압축·색인·재조합하는 기계다. 학습 데이터는 인터넷상의 텍스트, 코드, 논문, 서적, 대화 기록에서 온다—이 모든 것은 인류가 수천 년에 걸쳐 축적한 존량지식의 디지털 매핑이다. 모델의 파라미터는 이러한 정보 속 통계적 상관관계의 압축 표현을 저장한다. 추론 과정은 입력된 맥락에 기반하여 이 압축 공간에서 통계적으로 가장 확률이 높은 출력 시퀀스를 찾아내는 것이다.

이 과정의 모든 단계는 존량 재활용이지, 증분 생산이 아니다. AI는 새로운 물리 법칙을 발견하지 않고, 새로운 수학 정리를 발명하지 않으며, 새로운 인과관계를 수립하지 않는다. 이미 알려진 정보를 극도로 빠른 속도로 재배열·재조합하여, 겉보기에 참신하지만 정보이론적 의미에서 새로운 정보를 포함하지 않는 출력을 생성한다.

1.1 AlphaFold의 교훈: 영역 존량 재활용의 성공은 증분 생산의 성공이 아니다

AlphaFold는 “AI가 과학적 증분을 산출한다”는 전형적 사례로 자주 인용된다. 그러나 그 기술적 아키텍처를 면밀히 살펴보면 오히려 정반대—AI가 존량 재활용 도구로서 탁월함을 보여 주는 최적의 증거임을 알 수 있다. AlphaFold는 단백질 데이터 뱅크(PDB)의 약 21만 5천 개 실험적으로 확정된 구조에 대해 지도학습을 수행하여, 아미노산 서열에서 3차원 구조로의 매핑 패턴을 학습했다. 이 학습 데이터는 인간 과학자들이 X선 결정학, 핵자기공명 등 물리적 실험 방법으로 수십 년에 걸쳐 하나하나 측정해 낸 것이다. AlphaFold가 하는 일은 이 폐쇄적 데이터셋에 대한 효율적인 패턴 학습과 일반화다.

핵심적 증거는 그것의 실패 양태에 있다: AlphaFold는 단백질 접힘의 물리적 메커니즘 문제를 해결하지 못했고, 접힘 경로를 식별하지도 못했다. 구조적 동적 변화(conformational dynamics)와 알로스테릭 효과(allosteric effects) 등의 메커니즘을 포착하지 못한다. 학습 데이터가 다루지 않는 비정상적 구조를 마주하면, 예측 구조와 실험 구조 사이의 편차가 30옹스트롬을 초과할 수 있다. 그 능력의 천장은 인간 실험자가 제공한 학습 데이터에 의해 정밀하게 결정된다—이것은 영역 데이터의 존량 재활용 성공이지, 지식 일반화의 증분 생산 성공이 아니다.

AI는 인류 역사상 가장 강력한 존량 재활용 도구이지만, 증분 생산 도구로 포장되어 있다. 이 잘못된 인식이야말로 현재 인지적 거품의 핵심 발생기다.

AI의 모든 능력은 하나의 전제 위에 서 있다: 누군가가 지속적으로 증분지식을 생산하여 인류의 정보 집합에 주입하고 있다는 것. 새로운 논문이 발표되지 않으면 AI의 과학 지식은 학습 마감 시점에 멈춘다. 새로운 코드가 개발되지 않으면 AI의 프로그래밍 능력은 새 프레임워크를 다루지 못한다. AI는 강물 위의 물레방아다—수류를 이용해 극도로 효율적으로 일을 할 수 있지만, 물 자체를 생산하지는 않는다.

· · ·

Section II

무임승차 가속: 이미 발생한 절벽
Accelerated Free-Riding: The Cliff Already Underway

자매편은 증분지식의 핵심 딜레마를 논증했다: 강한 양의 외부효과로 인해 생산자가 수익의 대부분을 내부화할 수 없다. 그러나 AI 이전 시대에는 증분지식이 “생산”된 후 “사회에 의해 완전히 무임승차되기”까지 적어도 시간적 창구가 존재했다. AI는 이 창구를 거의 영(零)으로 압축했다—그리고 이것은 이론적 예측이 아니라 이미 실증 데이터가 절벽이 발생하고 있음을 증명한다.

2.1 실증: 경사면이 아닌 절벽

Ramp 경제연구실험실은 2021~2025년 사이 기업의 프리랜서 마켓플레이스와 AI 모델 제공업체 간 지출 변화를 추적했다. 결과는 경악스럽다: 프리랜서 마켓플레이스(Upwork, Fiverr)에 대한 기업 지출 비중이 2021년 4분기 0.66%에서 2025년 3분기 0.14%로 폭락했다. 같은 기간 AI 모델 제공업체에 대한 지출 비중은 0%에서 약 3%로 급등했다. 2022년에 프리랜서를 사용하던 기업의 절반 이상이 이미 완전히 사용을 중단했다. 가장 핵심적인 것은 대체 비율이다: 프리랜서 지출 1달러 감소당, 기업은 AI 지출을 겨우 0.03달러 증가시켰다—무임승차 효율의 경제학적 측정치: 원래 산출의 100%를 3%의 비용으로 확보.

임페리얼 칼리지 런던, 하버드 경영대학원, 독일경제연구소의 공동 연구는 61개국 약 200만 건의 프리랜서 직무 게시 데이터를 분석했다: ChatGPT 출시 후 불과 8개월 만에 프리랜서 작문 직무 수요가 약 30% 하락하여 모든 카테고리 중 가장 큰 낙폭을 기록했다. 창작 전문가들의 직접적 피드백이 이 추세를 뒷받침한다—일러스트레이터, 아트 디렉터, 프리랜서 작가들이 일제히 2024년을 “입사 이래 가장 힘든 해”라고 보고했다.

무임승차 가속의 실증 데이터

기업의 프리랜서 지출 비중 변화 (Ramp, 2021~2025)

0.66% → 0.14%

ChatGPT 출시 8개월 내 작문 직무 수요 하락폭

-30%

대체 비율: 프리랜서 지출 -$1 = AI 지출 +$0.03

1 : 0.03

이것은 선형적 감소가 아니다. 이것은 절벽이다. 프리랜서를 사용하던 기업의 절반 이상이 이미 완전히 사용을 중단했다.

2.2 임계 효과: 왜 세류(細流)가 아닌 단류(斷流)인가

증분 생산자의 이탈은 선형적이지 않다. 독립 개발자가 직면하는 것은 생존 임계치다—기대 수입이 생존 비용 이하로 떨어지면 그는 완전히 전업한다. 기초연구자는 과학연구에서 “부분적으로 이탈”하지 않는다—연구비가 고갈되고 취업 전망이 사라지면, 산업계로 이동하여 존량 재활용 업무를 수행한다.

가능한 반론 하나가 있다: 증분 생산자 중 상당 비율은 비경제적 동기—호기심, 사명감, 학술적 명성 추구—에 의해 구동된다. 이들은 수입이 영(零)으로 떨어져도 증분을 계속 생산할 수 있다. 역사적으로 극단적 빈곤 속에서 연구를 계속한 과학자는 실제로 다수 존재한다. 그러나 이 집단은 극히 작고, 그들 역시 가장 기본적인 생존 자원—식량, 거주지, 실험 장비—이 필요하다. 사회 전체가 증분 생산에 대한 대가 지불을 중단하면, 이 가장 기본적인 조건조차 보장할 수 없게 된다. 호기심은 점심을 대체할 수 없다.

· · ·

Section III

AI는 왜 증분을 생산할 수 없는가: 인지 아키텍처에서 본 근본적 결함
Why AI Cannot Produce Increments: Fundamental Deficits from a Cognitive Architecture Perspective

“AI가 증분 생산자를 소멸시킨다”는 논증에 직면하면, 자연스러운 반론이 떠오른다: “어쩌면 AI 스스로 증분을 생산할 수 있지 않은가?” 혹은 보다 온건한 버전: “어쩌면 AI가 인간이 더 빠르게 증분을 생산하도록 도울 수 있지 않은가?” 본 절은 예견 가능한 미래에 왜 두 반론 모두 성립하지 않는지 논증한다.

3.1 부족한 것은 데이터량이 아니라, 전체 인지 경로다

「인간 생물학적 인지 프런트엔드 시스템 분석」은 감각층에서 추상층까지의 4층 인지 모델을 수립했다. 이 모델에서 증분지식의 생성은 현시적 추론 단계(시스템 2)에서 발생하는 것이 아니라, 저장-연산 일체형 생물학적 하드웨어상의 무의식적 수렴(시스템 1)에서 발생한다. 과학사의 가장 중요한 돌파구들—케쿨레가 뱀이 자기 꼬리를 무는 꿈을 꾸고 벤젠 고리 구조를 발견한 것, 아인슈타인이 광선을 타고 날아가는 상상으로 상대성이론을 촉발한 것, 멘델레예프가 꿈속에서 원소의 배열을 본 것—모두 시스템 1의 산물이었다. 과학자는 먼저 시스템 2로 대량의 다차원 정보를 축적하고, 이어서 이완 상태에서 저장-연산 일체형 시스템이 백그라운드에서 다차원 정보의 재조합을 지속적으로 수행하다가, 어느 순간 수렴을 완성하여 완전한 심상(心像)이 의식 속으로 분출한다.

AI에 결여된 것은 “더 많은 데이터”나 “더 강력한 추론 사슬”이 아니라, 증분을 생산하는 데 필요한 전체 생물학적 경로다:

첫째, 다차원 물리적 감각. 인간은 10개 이상의 감각 차원(시각, 청각, 촉각, 후각, 미각, 고유감각, 전정감각, 온도감각, 통각, 내수용감각 등)을 통해 동일한 물리적 대상의 정보를 동시에 수집하여 고차원 구속 공간을 형성한다. AI의 “멀티모달”은 2~3개 채널(시각+텍스트+부분적 오디오)을 다루며, 이 채널들이 수신하는 것은 인간의 감각 필터를 거친 후 디지털 부호화된 이차 정보다. 2차원 평면 위에 아무리 많은 선을 그어도 3차원 공간의 폐곡면을 둘러쌀 수 없다—차원의 결여는 데이터량으로 보상할 수 없다.

둘째, 저장-연산 일체형 생물학적 하드웨어. 인간 뇌의 모든 뉴런은 연산 유닛인 동시에 저장 유닛이다. 시냅스의 연결 강도가 저장된 ‘데이터’이며, 시냅스 간 신호 전달이 ‘연산’이다. 지식이 곧 구조이고, 구조가 곧 연산이다. 성공적인 범주 정의 행위가 일어날 때마다 시냅스 연결이 직접 변경된다—이는 뇌가 쓸수록 강해짐을 의미한다. AI는 폰 노이만 아키텍처 위에서 구동되며 처리기와 메모리가 물리적으로 분리되어 있어, 추론이 종료되면 즉시 소멸하고 지속적으로 운행되는 백그라운드 수렴 과정이 존재하지 않는다.

셋째, 무의식적 심상 창발. 인간 추상층의 최종 산물은 감각할 수 있고, 조작할 수 있고, 회전시킬 수 있고, 분해할 수 있는 완전한 정신적 심상이다. AI가 “고양이”라는 토큰을 생성할 때 활성화되는 것은 고차원 부동소수점 벡터—그 안에 부드러움도, 온기도, 그르렁거림도 없다. 인간이 “고양이”를 떠올릴 때 창발하는 것은 형태, 질감, 소리, 냄새, 무게, 온도, 정서적 색채를 포함하는 완전한 심상이다. AI의 벡터는 통계적 거리이지, 심상이 아니다.

AI는 오직 “시스템 2″만 갖고 있다—매번의 추론은 의식적이고, 순차적이며, 대량의 연산 자원을 소모하는 행렬 연산이다. 백그라운드에서 지속적으로 운행되는 저장-연산 일체형 하드웨어가 없으므로, “샤워 중에” 돈오(頓悟)를 경험하는 것이 불가능하다. AI의 추론은 종료 즉시 소멸하지만, 인간의 시냅스 구조는 결코 작동을 멈추지 않는다.

3.2 “AI가 인간의 증분 생산을 가속한다”는 함정

보다 온건한 반론이 있다: “어쩌면 AI가 인간이 더 빠르게 증분을 생산하도록 도울 수 있지 않은가?” 이 반론은 합리적으로 보이지만, 위의 인지 아키텍처 분석에 기반하면 치명적인 맹점이 있다.

AI가 보조하는 것은 무엇인가? 시스템 2의 현시적 추론 과정—문헌 검색, 데이터 정리, 정보 배열, 코딩 가속을 도와주는 것이다. 그러나 증분지식의 생성은 시스템 1에서 발생한다—저장-연산 일체형 하드웨어상의 무의식적 다차원 정보 재조합과 심상 창발에서. 시스템 1의 입력 품질은 대량의 다차원 감각 경험의 장기적 축적에 달려 있다—직접 실험을 수행하고, 직접 현상을 관찰하고, 직접 문제 속에 수개월 혹은 수년간 침잠해야 시냅스 구조가 충분히 정밀한 지식 인코딩을 형성하여 무의식적 수렴에 원료를 공급할 수 있다.

AI 보조의 역설은 이것이다: 시스템 2의 작업 효율을 가속함으로써 인간이 직접 장시간 실천적 작업을 수행할 필요성을 줄이지만—바로 이 장시간의 실천적 작업이야말로 시스템 1에 다차원 감각 경험을 축적해 주는 것이다. AI는 증분 생산에서 가장 중요하지 않은 고리(정보 정리)를 보조하면서, 가장 중요한 고리(다차원 감각 축적 및 무의식적 수렴의 원료 품질)를 손상시킬 가능성이 있다.

3.3 정보 격차의 정량화

정량적 수준에서, 현재 최대 규모 언어 모델의 학습 데이터는 약 1014 비트 규모이며, 모델 압축 후 파라미터에 저장된 유효 정보량은 약 1012 비트(추정치)다.

완전한 세계에서 AI까지: 정보 깔때기의 종단

관측 가능 우주 물질 정보 (Wheeler / Vopson 추정)

~1080 bits

인류 전체 독립 기록 정보

~1023 bits

AI 모델의 유효 정보량 (추정)

~1012 bits

물리적 세계에서 AI까지, 정보 손실은 약 68자릿수에 달한다. 그러나 정보량보다 더 핵심적인 것은: AI에 결여된 것이 더 많은 데이터가 아니라, 물리적 감각에서 저장-연산 일체형 처리, 심상 창발에 이르는 전체 인지 경로라는 사실이다. 이 경로의 부재는 아키텍처 차원의 문제이며, 데이터량으로 보상할 수 없다.

· · ·

Section IV

인지적 거품: 금융 거품보다 위험한 환각
The Cognitive Bubble: A More Dangerous Illusion Than Financial Bubbles

대량의 존량 재활용자가 AI를 통해 자신의 육체적 지식 저장 상한을 돌파하고 개인 용량을 훨씬 초과하는 기존 정보를 호출할 수 있게 되면, 그들은 강렬한 환각을 경험한다: “내가 더 강해졌다.” 기업은 기초연구팀을 유지할 필요가 없다고 판단한다. 투자자는 AI가 미래라고 확신하며 자본 전부를 응용 레이어에 베팅한다. 사회 여론은 “모든 것이 AI화될 수 있다”고 단정한다. 사회 전체에서 증분지식 생산자에 대한 수요 인식이 하락하고, 그에 대해 비용을 지불하려는 의지가 소멸하고 있다.

이것이 바로 인지적 거품이다. 인지적 거품은 금융 거품보다 훨씬 위험하다. 금융 거품이 붕괴해도 실물경제는 남아 있다—공장이 있고, 사람이 있고, 재건이 가능하다. 인지적 거품이 붕괴하면 재건 능력마저 사라진다—왜냐하면 증분지식의 생산자가 거품 팽창 과정에서 체계적으로 소멸되었기 때문이다.

4.1 AI 기업의 비즈니스 모델: 무임승차의 산업화

AI 기업의 비즈니스 모델을 본 논문의 프레임워크 언어로 번역하면 다음과 같다: 각 영역에서 1%의 증분 성과를 모델에 압축하여 99%의 존량 재활용자에게 제품으로 판매한다. 새 기능이 출시되고, 새 도구가 통합되고, 새 모델이 업그레이드될 때마다 또 하나의 영역에서 시행착오 비용 회수 창구를 닫아 버리는 것이다. 그리고 이 제품들의 밸류에이션—수천억 달러 규모—이 가격을 매기는 것은 “우리가 전 인류의 증분 정보를 얼마나 빠른 속도로, 얼마나 큰 규모로 무임승차할 수 있는가”라는 능력이다.

AI는 소프트웨어를 잠식하는 것이 아니고, AI는 디자인을 잠식하는 것이 아니고, AI는 글쓰기를 잠식하는 것이 아니다. AI는 이 영역들의 증분 생산 동력을 잠식하고 있다. 잠식의 결과는 AI가 강해지는 것이 아니라, AI의 곡간(穀間)이 비워지는 것이다. 이것은 “AI가 세계를 삼킨다”가 아니다. 이것은 AI의 자굴분묘(自掘墳墓)다.

4.2 금융 거품이 인지적 거품 안에 중첩된다

현재의 AI 금융 거품과 인지적 거품은 중첩 구조다. 금융 거품(AI 기업의 밸류에이션)은 인지적 거품(AI가 증분 생산을 대체할 수 있다는 믿음) 위에 세워져 있다.

금융시장 자체의 작동 논리가 여기서 흥미로운 재귀(recursion)를 생산한다. AI는 정보 전파 속도 차이를 영으로 압축하고 있으며, 이에 따라 전파 속도 차이에 기반한 금융 차익거래 공간이 사라지고 있다. 유일하게 남는 정보 비대칭은 진정한 증분지식—”다른 사람들이 아직 모르는 새로운 발견”—이다. 그러나 앞의 논증에 따르면, 증분 생산자는 체계적으로 소멸되고 있다. 정보 비대칭 자체가 하나의 자원으로서 고갈되고 있다.

더 심층적인 문제는: 금융 투자는 순수한 정보 비대칭 게임이었던 적이 없다—여기에는 대량의 비합리적 요소도 포함된다. 뉴턴은 인류 역사상 가장 위대한 증분지식 생산자 중 한 사람이었지만, 1720년 남해 거품(South Sea Bubble)에서 자산의 약 77%를 잃었다. 그의 유명한 말이 모든 것을 요약한다: “나는 천체의 운동은 계산할 수 있지만, 사람들의 광기는 계산할 수 없다.” 미네소타 대학의 앤드루 오들리즈코(Andrew Odlyzko) 교수의 연구는 뉴턴이 분산 투자하는 신중한 투자자에서 거의 전 재산을 단일 주식에 베팅하는 투기자로 변했음을 밝혔다. 인지 프런트엔드 이론으로 분석하면: 뉴턴의 시스템 2(합리적 추론)는 인류 역사상 가장 강력한 것 중 하나였지만, 그의 시스템 1은 다른 모든 사람과 마찬가지로 FOMO와 군중 효과에 쉽게 납치되었다. 금융시장은 시스템 1 게임이지, 시스템 2 게임이 아니다. 이것이 높은 인지 능력이 투자 성공을 보장하지 못하는 이유다—금융 게임의 차원과 증분지식 생산의 차원은 근본적으로 동일한 평면에 있지 않다.

· · ·

Section V

소프트웨어가 먼저 죽는다: 디지털 상태 증분의 선행적 붕괴
Software Dies First: The Earliest Collapse of Digital-State Increments

자매편에서 제시한 ‘물리적 내재 깊이’ 변수가 여기서 명확한 예측을 산출한다: 디지털 상태의 증분이 가장 먼저 정체되고, 물리적 상태의 증분이 가장 나중에 쓰러진다.

소프트웨어는 순수한 디지털 상태의 제품이다. 복제 비용이 영(零)이다. AI의 해석 속도가 가장 빠르다. 시행착오 비용 회수 창구가 가장 짧다. Ramp의 데이터가 이 예측을 이미 확인해 주었다—프리랜서 작문, 디자인, 기초 코딩 시장이 절벽식으로 추락하고 있으며, 대체 비율은 극단적으로 비대칭적이다(1달러 대 0.03달러).

반면 물리적 상태의 증분—반도체 제조 공정, 항공 엔진 설계, 신소재 합성—은 시행착오 비용이 물리적 시스템에 내장되어 있어 복제에 원래와 근접한 시간과 자원 투입이 여전히 필요하므로, 이 압축으로부터 일시적으로 면제된다. 그러나 ‘일시적’이 핵심어다—AI 제어 로봇 시스템과 자동화 실험실의 발전에 따라, 물리적 상태 증분의 무임승차 비용도 점진적으로 하락하고 있다.

아이러니하게도, AI가 대체에 가장 능숙한 영역이 정확히 소프트웨어와 텍스트—순수 디지털 상태의 증분—이다. AI가 가장 먼저 소멸시키는 것은, 바로 자기 자신을 먹여 살리는 영역의 혁신 동력이다. AI는 최대 속도로 자기 자신의 곡간을 비우고 있다.

· · ·

Section VI

죽음의 나선: 이미 가동된 자기소진 과정
The Death Spiral: A Self-Consumption Process Already Underway

죽음의 나선은 미래에 대한 예측이 아니다. 이미 진행 중이다.

6.1 학습 데이터의 오염과 고갈

2025년 Ahrefs가 약 100만 개의 신규 게시 웹페이지를 분석한 결과, 74.2%가 검출 가능한 AI 생성 콘텐츠를 포함하고 있었다. 대규모 텍스트 분석에 따르면 활성 웹 코퍼스의 30~40%가 이미 합성 콘텐츠다. MIT와 옥스퍼드 인터넷 연구소의 공동 연구는 AI 생성 콘텐츠가 전체 신규 게시 인터넷 콘텐츠의 64%를 차지하며, AI 대 인간 산출 비율이 17:1에 달한다고 추정했다. 유로폴(Europol)은 2026년까지 온라인 콘텐츠의 최대 90%가 합성 생성될 수 있다고 경고했다.

이는 AI의 미래 학습 데이터가 점점 더 많이 AI 자체의 출력을 포함하게 됨을 의미한다. Shumailov 등(2024)이 Nature에 발표한 연구는, 모델이 자기 자신이 생성한 데이터로 학습할 경우 비가역적 품질 퇴화가 발생함을 증명했다—출력 다양성이 감소하고, 분포가 평균을 향해 붕괴하며, 소수 모드가 계속 강화되는 반면 다수 모드는 영구적으로 소실된다.

정밀하게 구분해야 하는 것이 있다: 엄밀한 의미의 모델 붕괴(Model Collapse—순수 AI 자기학습으로 인한 비가역적 퇴화)와 실제로 진행 중인 학습 데이터 품질 퇴화(인간 원작 콘텐츠가 AI 합성 콘텐츠로 희석되는 현상)는 서로 다르지만 관련된 두 현상이다. 후자는 전자의 극단적 상황이 도래하기를 기다릴 필요 없이 이미 AI의 출력 품질을 훼손하고 있다—롱테일 경험과 니치 전문 지식이 합성 텍스트에서 체계적으로 누락되고, 템플릿화된 표현이 코퍼스를 점점 더 지배하며, 잘못된 정보가 대량 복제를 통해 신뢰할 수 있는 출처로 취급된다. 하버드 법률·기술 저널은 이미 “오염되지 않은 인간 생성 데이터에 대한 권리”라는 법적 개념을 제시했으며, 2022년 이전에 수집된 데이터가 AI 개발자의 경쟁적 해자(moat)가 될 수 있음을 지적했다—이것 자체가 학습 데이터 위기의 제도화된 신호다.

더 근본적인 것은: 설사 AI 학습 데이터가 합성 콘텐츠로 오염되지 않더라도, 인간 원작 텍스트 데이터의 증가분은 둔화되고 있다. 증분 생산자가 시행착오 비용을 회수할 수 없어 이탈하면, 인터넷에 주입되는 고품질 원작 콘텐츠가 감소한다. 연구에 따르면 인간이 생성한 텍스트 데이터는 이르면 2026년 고갈에 직면할 수 있다. 학습 데이터의 오염과 증분 공급 차단은 동일한 죽음의 나선의 두 지류이며, 이들은 현재 합류하고 있다.

학습 데이터 오염의 실증 데이터

신규 게시 웹페이지 중 AI 콘텐츠 비중 (Ahrefs, 2025.4)

74.2%

신규 게시 인터넷 콘텐츠 중 AI 생성 비중 (MIT/Oxford, 2025)

64%

AI 산출 대 인간 산출 비율

17 : 1

유로폴 경고: 2026년 온라인 합성 콘텐츠 비중

최대 90%

6.2 완전한 죽음의 나선 경로

AI가 증분지식의 무임승차 주기를 거의 영(零)으로 압축
(이미 발생: 작문 수요 -30%, 지출 비중 0.66% → 0.14%)
증분 생산자의 시행착오 비용 회수 불가
(이미 발생: 대체 비율 $1=$0.03, 기업 절반이 프리랜서 사용 완전 중단)
증분 생산자 이탈 (임계 효과: 단류)
(진행 중: 창작 전문가들 “입사 이래 가장 힘든 해” 보고)
인터넷 신규 콘텐츠가 AI 합성물에 의해 지배
(이미 발생: 신규 웹페이지의 74%가 AI 콘텐츠 포함, AI:인간 산출=17:1)
AI 학습 데이터 품질 퇴화 + 인간 원작 데이터 고갈 직면
(진행 중: 인간 텍스트 데이터 2026년 고갈 가능성)
인지적 거품 붕괴 → 금융 거품 연쇄 붕괴
그러나 이 시점에서 지식 생산을 재가동할 증분 생산자가 남아 있지 않다
정보 암흑시대

6.3 역사적 선례와 가장 핵심적인 차이

증분 생산 시스템의 붕괴가 문명의 정체를 초래한 것은 인류 역사에서 선례가 있다. 로마 제국 붕괴 후, 증분지식 생산을 떠받치던 제도적 기반이 파괴되었다—학원이 사라지고, 학술적 전승이 단절되고, 문자해독률이 폭락하고, 로마 콘크리트의 배합비마저 실전(失傳)되었다. 정보 자체가 사라진 것이 아니라, “새로운 정보를 생산할 수 있는 사람과 메커니즘”이 사라진 것이었다. 하나의 문명 전체가 거의 천 년간 존량 안에서 맴돌았다.

그 암흑시대가 궁극적으로 종식될 수 있었던 것은 핵심적 조건이 하나 있었기 때문이다: 외부의 증분 정보원이 존재했다. 아랍 세계가 그리스-로마의 지식을 보존·발전시켰고, 이것이 십자군 원정과 무역로를 통해 유럽으로 환류하면서 르네상스에 불을 붙였다.

AI 시대의 인지적 거품이 글로벌한 것이라면—전 세계가 동시에 증분 생산에 대한 대가 지불을 포기한다면—외부 백업은 존재하지 않는다. 독립적으로 증분 생산을 유지하는 또 다른 문명권이 없다. 인류는 외부 구원이 없는 정보 암흑시대에 사상 처음으로 직면하게 될 것이다.

유럽의 천 년 암흑시대가 주는 교훈은 “문명이 붕괴할 수 있다”는 것이 아니다—그건 누구나 안다. 교훈은: 붕괴한 것이 존량이 아니라 증분이었다는 것이다. 존량은 수도원에서 천 년간 필사·보존될 수 있다. 그러나 존량 위에서 새로운 것을 만들어 낼 수 있는 사람이 없다면, 존량 자체가 출구 없는 미궁이 된다.

· · ·

Section VII

결론: AI가 세계를 삼키는 것이 아니다—AI가 자기 무덤을 파고 있다
Conclusion: AI Is Not Eating the World — AI Is Digging Its Own Grave

시장의 서사는 “AI is eating software”이다. 본 논문이 논증하는 인과관계는 정확히 그 반대다. AI가 하나의 산업을 “잠식”할 때마다, 그 산업에서의 자기 자신의 증분 공급 파이프라인을 끊는 것이다. 더 빨리 잠식할수록, 더 빨리 죽는다. AI 기업 간의 경쟁은 이 과정을 가속한다—경쟁의 본질은 증분 공급이 차단되기 전에 누가 마지막 몇 입을 더 먹을 수 있느냐를 다투는 것이다. 이것은 상업적 경쟁이 아니다. 이것은 재생 불가능한 자원에 대한 약탈적 채굴이다.

본 논문의 핵심 명제는 한 문장으로 압축할 수 있다:

하나의 문명이, 전체 증분지식을 거의 영(零) 비용으로 무임승차할 수 있는 도구를 발명했는데, 그 도구 자체는 증분지식을 생산할 수 없다면—다차원 물리적 감각에서 저장-연산 일체형 시냅스 재구성, 무의식적 심상 창발에 이르는 전체 생물학적 경로가 결여되어 있으므로—그 문명은 비가역적 자기소진 과정을 가동한 것이다. 증분 공급이 차단되기 전에 증분 생산자를 보호할 새로운 인센티브 메커니즘을 수립하지 않는 한, 그 문명은 외부 구원이 없는 정보 암흑시대로 미끄러질 것이다.

참고문헌 및 주석

[1] 이조글로벌인공지능연구소 & Claude Opus 4.6 (2026). 「증분지식과 존량지식.」 오리지널 사유논문, V2. 본 논문의 자매편.

[2] 이조글로벌인공지능연구소 & Opus 4.6 (2026). 「인간 생물학적 인지 프런트엔드 시스템 분석.」 오리지널 사유논문, V3. 본 논문 인지 아키텍처 이론의 기초.

[3] Shumailov, I. et al. (2024). “AI models collapse when trained on recursively generated data.” Nature.

[4] Acemoglu, D., Kong, D., & Ozdaglar, A. (2026). “AI, Human Cognition and Knowledge Collapse.” NBER Working Paper No. 34910.

[5] Bazzichi, E., Riccaboni, M., & Castellacci, F. (2026). “Bridging Distant Ideas: the Impact of AI on R&D and Recombinant Innovation.” arXiv 2604.02189.

[6] Ramp Economics Lab / Stevens, R. (2026). “AI and Labor Market Impact: Freelancers.” 기업 프리랜서 지출 0.66%에서 0.14%로 하락, 대체 비율 1:0.03.

[7] 임페리얼 칼리지 런던, 하버드 경영대학원, 독일경제연구소 공동 연구. 61개국 약 200만 건 프리랜서 직무 분석, ChatGPT 출시 8개월 내 작문 수요 30% 하락. ScienceDirect 참조.

[8] Ahrefs (2025). AI Content Prevalence Study. 신규 웹페이지의 74.2%가 AI 생성 콘텐츠 포함.

[9] MIT CSAIL & Oxford Internet Institute (2025–2026). AI 생성 콘텐츠가 신규 게시 인터넷 콘텐츠의 64% 차지, AI:인간 산출 비율 17:1.

[10] Europol (2022/2026). 합성 미디어 경고: 2026년까지 온라인 콘텐츠의 최대 90%가 합성 생성될 수 있음.

[11] Harvard Journal of Law & Technology (2025). “Model Collapse and the Right to Uncontaminated Human-Generated Data.” 오염되지 않은 데이터에 대한 권리라는 법적 개념 제시.

[12] Jumper, J. et al. (2021). “Highly accurate protein structure prediction with AlphaFold.” Nature, 596, 583–589. PDB 데이터 기반 AlphaFold의 지도학습.

[13] Nussinov, R. et al. (2022). “AlphaFold, Artificial Intelligence, and Allostery.” J. Phys. Chem. B. AlphaFold는 접힘 메커니즘을 해결하지 못하고 구조적 동태를 포착하지 못함.

[14] 뉴턴의 남해 거품 투자: Odlyzko, A. (2019). “Newton’s financial misadventures in the South Sea Bubble.” Notes and Records: The Royal Society, 73(1), 29–59. 약 77% 손실.

[15] Egan, C. A., & Lineweaver, C. H. (2010). “A Larger Estimate of the Entropy of the Universe.” The Astrophysical Journal, 710(2).

[16] Vopson, M. M. (2021). “Estimation of the Information Contained in the Visible Matter of the Universe.” AIP Advances, 11(10).

[17] Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.

주: 본 논문은 오리지널 사유논문(Original Thought Paper)이다. 핵심 프레임워크는 이조글로벌인공지능연구소의 독립적 사유에서 기원하며, Claude Opus 4.6과의 구조화된 대화를 통해 논증 전개와 텍스트 생성이 완성되었다. 본 논문은 동료 심사를 거치지 않았다. 아이러니하게도, 본 논문의 집필 과정 자체가 본 논문이 비판하는 현상의 한 사례다—증분적 사유는 인간이 제안했고, 존량 재활용적인 논증 전개와 텍스트 생성은 AI가 수행했으며, 이 과정은 완전히 무상이었다.

이조글로벌인공지능연구소
LEECHO Global AI Research Lab

© 2026 All Rights Reserved · V2 · May 3, 2026

댓글 남기기