본 논문은 하나의 기능 정의적 명제를 제시한다: AI 검색 정보 정렬은 대규모 언어 모델(LLM)의 가장 핵심적인 기능이다. 이 명제는 다차원 실증 데이터의 교차 통합 분석에 기반하며, OpenAI 공식 사용자 행동 데이터(NBER Working Paper 34255), 전 세계 243개국 AI 검색 침투율 연구(arxiv 2602.13415), 산업별 AI 트래픽 데이터(Previsible/Adobe/Semrush 2025), 그리고 RAG 기술 진화가 검색 패러다임에 미친 구조적 영향을 포괄한다. 연구 결과, 기존 학술 문헌은 각자 단일 차원에서 충분한 경험적 증거를 축적했으나—정보 획득이 LLM의 최고 빈도 사용 시나리오라는 발견—모두 기술적 수준에 머물러 있으며, 이러한 발견들을 통합된 기능 정의로 정립하지 못했다. 본 논문은 네 가지 독립적 증거 차원의 교차 검증을 통해, 정보 검색과 정렬이 LLM의 “하나의 응용”이 아니라 모든 다른 기능을 지탱하는 기초 계층임을 논증하며, 경험적 기술에서 이론적 정의로의 공백을 메운다.
문제의 제기: LLM의 본질적 기능은 무엇인가?
The Question: What Is the Essential Function of LLMs?
2022년 11월 ChatGPT 출시 이후, 대규모 언어 모델(LLM)은 전례 없는 속도로 인류의 정보 생활에 침투했다. 2025년 7월 기준으로 ChatGPT는 매주 7억 명의 사용자가 180억 건의 메시지를 전송하고 있으며, 이는 전 세계 성인 인구의 약 10%에 해당한다. 그러나 하나의 근본적인 이론적 문제는 여전히 정면으로 답변되지 않고 있다: 인간 사용자의 관점에서 LLM의 가장 핵심적인 기능은 과연 무엇인가?
학계는 기술 아키텍처 관점에서 LLM을 “대량의 텍스트 코퍼스에서 훈련된 확률적 언어 모델”로 정의하며, 그 핵심 능력을 “언어 이해 및 생성”으로 기술한다. 그러나 이것은 기술 존재론적 답변이지, 기능 현상학적 답변이 아니다. 수십억 명의 사용자가 LLM과 상호작용할 때, 그들은 실제로 무엇을 하고 있는가? 이 행동 차원의 사실이 LLM의 핵심 기능 정의에 반영되어야 하지 않는가?
본 논문의 핵심 논점은 다음과 같다: 사용자 행동 데이터, 글로벌 검색 침투율, 산업 분포, 그리고 기술 아키텍처 논리라는 네 가지 차원의 교차 분석을 통해 명확한 결론에 도달할 수 있다—AI 검색 정보 정렬은 LLM의 가장 핵심적인 기능이다. 정보 검색과 정렬은 코딩, 작문, 분석과 병렬되는 기능 중 하나가 아니라, 이 모든 기능을 지탱하는 기초 계층이다.
사용자 행동 데이터: 사람들은 LLM으로 무엇을 하는가?
Evidence Dimension 1: What Do People Actually Use LLMs For?
2025년 9월, OpenAI 경제 연구팀과 하버드대 경제학자 David Deming은 지금까지 가장 대규모의 ChatGPT 사용 행동 연구(NBER Working Paper No. 34255)를 공동 발표했으며, 이는 150만 건의 실제 대화에 대한 프라이버시 보호 분석에 기반한다.
논문은 대화 주제별 분류를 통해 “실용적 안내”(Practical Guidance, 28.1%), “정보 획득”(Seeking Information, 21.3%→24%), “작문”(Writing, 28.3%→24%)이 가장 흔한 세 가지 주제이며, 전체 대화의 약 80%를 차지한다는 사실을 발견했다.
더욱 주목할 점은, “실용적 안내” 역시 본질적으로 개인화된 정보 검색과 정렬의 한 형태라는 것이다. 논문은 명확히 구분한다: 실용적 안내는 “대화와 후속 질문을 통해 조정 가능한 고도로 맞춤화된 사용자 상담”이고, 정보 획득은 “모든 사용자에게 일관되어야 하는 사실적 정보”이다. 양자의 공통된 기저 논리는: 사용자에게 정보 수요가 있고, LLM이 가장 적합한 콘텐츠를 찾아 정렬하는 것을 돕는다는 것이다.
독립적인 조사 데이터가 이 발견을 더욱 강화한다:
| 데이터 출처 | 연도 | 핵심 발견 |
|---|---|---|
| NBEROpenAI Signals | 2026.02 | 대화의 75%가 실용적 안내, 정보 획득, 작문에 집중 |
| SurveySearcherries | 2026.02 | n=1090: 빠른 팩트체크 67%, 심층 연구 52.3%가 최고 빈도 용도 |
| SurveyPew/AP-NORC | 2025 | 미국인의 60%가 AI로 정보 검색 — 모든 용도 중 1위 |
| IndustryTTMS | 2025 | LLM 사용자의 2/3가 LLM을 검색 엔진으로 사용한다고 보고 |
| SurveyHigherVisibility | 2025.08 | 사용자의 54.1%가 매일 AI 검색 사용, 78%가 주 여러 회 |
사용자 행동 데이터를 보면, 어떤 데이터 출처나 분류 체계를 사용하든 정보 획득/검색/안내 유형의 사용이 항상 LLM 사용량의 절대 다수를 차지한다. 또한 “정보 획득”은 유일하게 지속적으로 성장하는 범주이며, 코딩과 기술 도움 등의 범주는 모두 하락하고 있다. 이는 LLM 사용자층이 기술 전문가에서 일반 대중으로 확대됨에 따라, 정보 검색의 핵심적 지위가 더욱 강화될 것임을 시사한다.
글로벌 검색 침투율: AI 검색의 폭발적 성장
Evidence Dimension 2: The Global Explosion of AI Search
2026년 2월에 발표된, 243개국, 24,000건의 쿼리, 280만 건의 검색 결과를 포괄하는 대규모 실증 연구(arxiv 2602.13415)는 AI 검색 글로벌 침투율에 관한 가장 권위 있는 데이터를 제공한다.
이 연구의 핵심 발견은: AI 검색이 전통적 검색을 대체한 것이 아니라, 인류 전체의 검색 행동 총량을 증폭시켰다는 것이다. 전통적 검색은 감소하지 않았으며, 총 검색량(검색 엔진 + LLM 검색)이 전 세계적으로 26% 증가했다. 이는 “정보 검색”이 AI가 충족시키는 가장 근본적인 수요임을 정확히 보여준다—이것은 제로섬 대체가 아니라 잠재 수요의 해방이다.
각국의 AI 검색 성장 지리적 분포 역시 심층적인 추세를 드러낸다:
| 국가 | AI 검색 성장률 | 2025년 쿼리 중 AI 응답 비율 |
|---|---|---|
| 브라질 | +82% | ~33% |
| 인도네시아 | +78% | ~28% |
| 일본 | +76% | ~36% |
| 멕시코 | +73% | ~38% |
| 미국 | +60% | 67% |
| 인도 | +54% | ~59% |
| 영국 | +44% | ~52% |
산업 분포: 누가 AI 검색을 사용하며, 무엇을 위해 사용하는가?
Evidence Dimension 3: Industry Distribution of AI Search
만약 AI 검색이 기술 전문가만의 도구라면, “핵심 기능”으로 정의될 수 없다. 데이터는 정반대를 보여준다—비기술 산업의 대중 사용자가 AI 검색을 더 높은 비율로 사용한다.
YMYL 산업이 AI 검색 채택을 선도
YMYL(Your Money Your Life, 돈과 생명과 관련된 산업)은 가장 높은 AI 검색 성장률을 보인다:
| 산업 | AI 트래픽 성장 배수 | LLM 총 세션 비율 |
|---|---|---|
| 법률 | 11.9× | 합계 55% |
| 금융 | 2.9× | |
| 의료 | 2.9× | |
| 보험 | 2.5× | |
| 중소기업 | 2.2× | |
| SaaS | 1.8× | 낮음 |
| 전자상거래 | 1.4× | 낮음 |
이 다섯 개의 고상담 산업은 모든 LLM 기반 세션의 55%를 차지한다. 이 산업에서 사용자들은 상담형, 신뢰 집약적, 복잡한 질문을 던진다—”계약 전에 변호사에게 무엇을 물어봐야 하나?” “이 약이 내 상황에 안전한가?” “5인 꽃집의 급여 구조를 어떻게 설정해야 하나?”
소비 분야의 AI 검색 폭발
Adobe 연구에 따르면, 소매 AI 리퍼럴 트래픽은 2024년 7월부터 2025년 5월까지 11개월 만에 35배 증가했고, 여행은 33배, 은행업은 28배 증가했다. 소비자 전자제품 및 가전 분야에서는 구매자의 40-55%가 AI 검색으로 구매 결정을 보조한다.
기술 아키텍처: 정보 정렬의 핵심 교량으로서의 RAG
Evidence Dimension 4: RAG as the Bridge to Information Alignment
기술 아키텍처 측면에서, 검색 증강 생성(Retrieval-Augmented Generation, RAG) 기술의 등장과 보급은 “AI 검색 정보 정렬”에 인프라 수준의 지원을 제공한다.
RAG는 2020년 Meta AI, 유니버시티 칼리지 런던, 뉴욕대 연구팀이 NeurIPS에서 발표한 것으로, 그 핵심 메커니즘은 검색 컴포넌트와 대규모 언어 모델을 결합하는 것이다—검색기가 관련 단락을 찾고, 생성기가 유창한 답변을 구성한다. 이 기술은 LLM을 “정적 기억 재생”에서 “동적 지식 연결”로 전환시켰다.
RAG의 도입은 세 가지 구조적 변화를 가져왔다:
첫째, 키워드 매칭에서 의미 이해로. 전통적 검색 엔진은 사용자 쿼리와 문서 키워드를 매칭한다. RAG-LLM 시스템은 쿼리의 의미적 의도를 이해하며, 쿼리 표현이 문서와 완전히 다르더라도 관련 콘텐츠를 찾을 수 있다.
둘째, 문서 순위 매기기에서 정보 종합으로. 전통적 검색은 링크 목록을 반환하여 사용자가 직접 선별하고 통합한다. RAG-LLM 시스템은 여러 출처에서 정보를 검색하여, 일관되고 인용이 첨부된 하나의 답변으로 종합한다.
셋째, 단일 검색에서 반복적 정렬로. 전통적 검색은 일회성 쿼리-반환 과정이다. RAG-LLM은 다회 대화를 지원하여, 사용자가 점진적으로 요구를 구체화하고 시스템이 지속적으로 재검색하고 출력을 조정하여, 점진적인 정보 정렬을 실현한다.
AI 지식 관리 시스템의 시장 규모 역시 이 추세를 뒷받침한다: 미국 AI 지식 관리 시스템 시장은 2025년 31억 달러에 도달하고, 연평균 42.9% 성장률로 2034년 687억 달러에 이를 것으로 전망된다. GEO(생성형 엔진 최적화) 시장은 2025년 8.48억 달러에서 시작하여, 50.5% CAGR로 2034년 337억 달러에 도달할 것으로 예상된다. 전체 산업이 “AI 검색”이라는 핵심 기능을 중심으로 자원을 배치하고 있다.
왜 “가장 핵심”이지 “가장 흔한” 것이 아닌가
Why “Core Function” Rather Than “Most Common Use”
“사용 빈도가 가장 높다”는 것만으로는 “가장 핵심적인 기능”이라는 판단을 지지하기에 충분하지 않다. 본 논문 논증의 핵심은: 정보 검색과 정렬이 빈도가 가장 높은 사용 시나리오일 뿐만 아니라, 기능적 의존성을 갖는다는 것이다—모든 다른 LLM 기능이 이를 전제 조건으로 의존한다.
기능적 의존성 논증
| LLM 응용 시나리오 | 내포된 정보 검색 수요 |
|---|---|
| 프로그래밍 | 코드 패턴, API 문서, 모범 사례 검색 |
| 작문 | 사실, 소재, 스타일 참고, 배경 지식 검색 |
| 데이터 분석 | 분석 프레임워크, 산업 벤치마크, 비교 데이터 검색 |
| 의사결정 자문 | 선택지, 찬반 증거, 사례 참고 검색 |
| 번역 | 맥락 적응, 용어 대조, 문화적 배경 검색 |
| 창의적 생성 | 영감 원천, 스타일 참조, 제약 조건 검색 |
어떤 고빈도 AI 사용 시나리오도 “정보 검색과 정렬”이라는 기저 단계를 건너뛸 수 없다. 사용자가 LLM에게 글을 쓰도록 요청할 때, LLM은 본질적으로 다음을 수행한다: 훈련 데이터 또는 외부 지식 출처에서 가장 관련성 높은 정보를 검색 → 사용자 의도에 따라 선별하고 정렬 → 적합한 형식으로 생성하여 출력. “생성”은 마지막 단계이며, “검색과 정렬”은 앞의 두 단계이다.
수요 해방 논증
AI 검색은 전통적 검색을 제로섬으로 대체하는 것이 아니라, 억눌려 있던 정보 수요를 해방하고 있다. 글로벌 검색 총량(검색 엔진 + AI 검색)은 26% 증가했으며, 이는 이전에 전통적 검색으로 충족될 수 없었던 대량의 정보 수요—너무 복잡하거나, 너무 개인화되었거나, 종합적 판단이 과도하게 필요한 문제들—가 이제 LLM의 정보 정렬 능력을 통해 충족되고 있음을 의미한다.
인지 패러다임 전환 논증
arxiv 2602.13415 논문은 깊은 인지적 변화를 드러낸다: 검색이 “내비게이션”에서 “종합”으로의 패러다임 전환을 겪고 있다. 웹은 수십억 명에게 출처를 선택하여 지식을 탐색하는 방법을 가르쳤다. AI 검색은 그들을 종합적이고 통합된 하나의 답변을 기본적으로 신뢰하도록 재훈련하고 있다. 이것은 단순한 도구 차원의 교체가 아니라, 인류 정보 획득 방식의 근본적인 재편이다.
기존 연구의 위치와 본 논문의 기여
Literature Position and Contribution of This Paper
본 논문의 명제와 기존 학술 문헌 사이에는 정확한 관계가 존재한다: 기존 문헌은 경험적 증거를 제공하지만, 모두 기술적 수준에 머물러 있으며 기능 정의적 판단을 내리지 않았다.
| 논문 | 무엇을 발견했는가 | 어떤 결론을 내렸는가 | 취하지 않은 단계 |
|---|---|---|---|
| NBERHow People Use ChatGPT (2025) | 실용적 안내+정보 획득+작문이 80% 차지 | 기술적: 세 가지 범주를 병렬 나열 | “실용적 안내”를 광의의 정보 정렬에 귀속시키지 않음, 기능 순위를 매기지 않음 |
| arxivRise of AI Search (2026) | 미국 쿼리의 67%가 AI로 응답됨 | AI 검색은 “아마도” 가장 영향력 있는 응용 | 영향에 주목했지 정의에 주목하지 않음; “possibly”라는 한정어 사용 |
| ACMLLMs for IR: A Survey (2025) | LLM이 IR에 세 가지 패러다임 전환을 가져옴 | LLM이 IR 시스템을 강화함 | “LLM이 검색에 봉사한다”는 관점이지 “검색이 LLM을 정의한다”가 아님 |
| SIGIRLLMs and Future of IR (2024) | LLM은 검색 엔진을 대체하지 않을 것 | LLM은 검색 엔진 사용법을 배워야 함 | 검색을 내재적 기능이 아닌 외부 도구로 간주 |
| SpringerLLMs for IR: Challenges (2025) | LLM이 “타협된 정보 수요”를 해결함 | LLM이 사용자 수요와 시스템 응답 간의 간극을 메움 | 정보 정렬을 핵심 정의가 아닌 능력 중 하나로 간주 |
| isjtrendLLMs as Info Seeking Tool (2024) | LLM이 정보 획득 행동을 촉진함 | LLM과 전통적 방법의 결합 사용이 바람직 | “core function”이 아닌 “facilitate”라는 표현 사용 |
시간적 한정과 가능한 반대 의견
Temporal Qualification and Counterarguments
시간적 한정
본 논문의 명제에는 명확한 시간적 한정이 필요하다: 현 단계(2024-2026년)에서 정보 검색과 정렬은 인류의 AI 사용에서 가장 핵심적인 기능이다. AI Agent(에이전트) 기술이 빠르게 발전하고 있으며, 미래에 AI가 대규모로 인간을 대신하여 자율적으로 작업을 수행한다면(쇼핑, 예약, 관리), “실행”이 “검색”과 대등해질 수 있다. 그러나 2026년 현재, 소비자의 24%만이 AI 에이전트의 자율 쇼핑에 안심한다고 응답하며, 에이전트는 아직 초기 단계에 있다.
가능한 반대 의견과 응답
반대 1: “LLM의 핵심은 언어 능력이며, 검색은 단지 응용일 뿐이다.”
응답: 이것은 기술 존재론과 기능 현상학의 관점 차이이다. 우리는 언어 능력이 LLM의 기술적 기반임을 부정하지 않지만, 사용자 관점의 기능 정의는 실제 사용 현실을 반영해야 한다고 논증한다. 스마트폰의 핵심 기술은 칩과 운영체제이지만, 기능적 정의에서 보면 그것은 통신 및 정보 기기이다.
반대 2: “작문(28.3%)이 정보 획득(21.3%)보다 높으므로, 작문이 제1 기능이다.”
응답: (a) 정보 획득은 유일하게 지속적으로 성장하는 범주이다(14%→24%), 작문은 지속적으로 하락하고 있다(36%→24%); (b) 작문 자체가 정보 검색을 전제 단계로 의존한다; (c) “실용적 안내”(28.1%)는 본질적으로 개인화된 정보 정렬이며, 광의의 정보 검색 범주에 포함되어야 한다. 합산하면 광의의 정보 검색 정렬 비율이 작문을 크게 초과한다.
반대 3: “11%의 ‘개인 표현’은 정보 검색에 해당하지 않는다.”
응답: 우리는 모든 LLM 사용이 정보 검색이라고 주장하지 않는다. 11%의 개인 표현(감정 동반, 오락)은 확실히 이 정의로 포괄하기에 적합하지 않다. 그러나 핵심 기능의 정의는 100% 포괄율을 요구하지 않는다—”통신”이 핸드폰의 핵심 기능이지만, 핸드폰으로 사진을 찍고 게임을 하는 것이 이 판단을 바꾸지 않는 것과 같다.
결론과 전망
Conclusion and Outlook
네 가지 독립적 증거 차원의 교차 검증—사용자 행동 데이터, 글로벌 검색 침투율, 산업 분포 데이터, 기술 아키텍처 논리—에 기반하여, 본 논문은 다음과 같은 결론에 도달한다:
이 명제는 기존 학술 문헌에서 경험적 기술에서 기능 정의로의 이론적 공백을 메운다. 모든 사람이 LLM의 “생성” 능력을 논할 때, AI의 가장 큰 가치는 실제로 “찾기”와 “정렬”에 있다. 인류가 LLM을 사용하는 제1 수요는 새로운 콘텐츠를 창조하는 것이 아니라, 방대한 정보의 바다에서 자신의 수요와 가장 일치하는 지식을 찾는 것—그리고 전례 없이 자연스러운 방식으로 이 정렬 과정을 완수하는 것이다.
이 인식은 산업에 심대한 실천적 함의를 갖는다:
첫째, LLM 제품 설계에 있어, 검색과 정보 정렬 능력(순수 생성 품질이 아닌)이 최우선 최적화 방향이어야 한다.
둘째, GEO/AEO 실무자에게 있어, LLM의 정보 정렬 본질을 이해하는 것은 보다 근본적인 콘텐츠 전략 수립에 도움이 된다—목표는 “AI에 의해 인용되는 것”이 아니라, AI 정렬 과정에서의 고품질 신호원이 되는 것이다.
셋째, AI 거버넌스에 있어, LLM이 본질적으로 인류 정보 획득의 중개 시스템임을 인식하는 것은, 그 정확성, 공정성, 투명성 기준이 (창의적 도구가 아닌) 정보 인프라를 참조하여 설정되어야 함을 의미한다.
참고문헌
- Chatterji, A., Cunningham, T., Deming, D., Hitzig, Z., Ong, C., Shan, C.Y., & Wadman, K. (2025). “How People Use ChatGPT.” NBER Working Paper No. 34255. Harvard IRB25-0983.
- arxiv 2602.13415 (2026). “The Rise of AI Search: Implications for Information Markets and Human Judgement at Scale.” 243 countries, 24,000 queries, 2.8M search results.
- Zhu, Y. et al. (2025). “Large Language Models for Information Retrieval: A Survey.” ACM Transactions on Information Systems.
- SIGIR 2024. “Large Language Models and Future of Information Retrieval: Opportunities and Challenges.” ACM.
- Datenbank-Spektrum / Springer (2025). “Large Language Models for Information Retrieval: Challenges and Chances.”
- isjtrend (2024). “Large Language Models (LLMs) as a Tool to Facilitate Information Seeking Behavior.”
- Taylor & Francis (2025). “Information Retrieval in the Age of Generative AI: A Mismatch That Matters.”
- Lewis, P. et al. (2020). “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks.” NeurIPS 2020.
- Pradeep, R. et al. (2023). “GEO: Generative Engine Optimization.” arXiv:2311.09735.
- Previsible (2025). “2025 AI Traffic Report.” 19 GA4 properties, 527% YoY growth.
- Adobe (2025). “The Explosive Rise of Generative AI Referral Traffic.” & “Q2 2025 AI-Driven Traffic Report.”
- OpenAI (2026). “OpenAI Signals.” Based on NBER Working Paper 34255.
- Searcherries (2026). “AI Search Statistics for 2026.” n=1,090, February 2026 survey.
- HigherVisibility (2025). “How People Search in 2025.” Identical surveys Feb & Aug 2025, n=1,500.
- Frase.io (2026). “What is Generative Engine Optimization (GEO)? 2026 Guide.”
- Grand View Research (2025). “AI Search Engine Market Size, Share | Industry Report, 2033.”
- Semrush (2025). Multiple AI search visibility studies, LLM visitor conversion data.
- Seer Interactive (2025). LLM traffic conversion rates by platform.