本文提出一个功能定义性命题:AI搜索信息对齐是大语言模型(LLM)最核心的功能。这一命题基于对多维度实证数据的交叉整合分析,涵盖OpenAI官方用户行为数据(NBER Working Paper 34255)、全球243国AI搜索渗透率研究(arxiv 2602.13415)、分行业AI流量数据(Previsible/Adobe/Semrush 2025)、以及RAG技术演进对搜索范式的结构性影响。研究发现,现有学术文献虽然各自从单一维度积累了充分的经验证据——发现信息获取是LLM的最高频使用场景——但均停留在描述层面,未将这些发现整合为统一的功能定义。本文通过四个独立证据维度的交叉验证,论证信息搜索与对齐不仅是LLM的”一个应用”,而是支撑所有其他功能的基础层,从而填补了从经验描述到理论定义的空白。
问题的提出:LLM的本质功能是什么?
The Question: What Is the Essential Function of LLMs?
自2022年11月ChatGPT发布以来,大语言模型(LLM)以史无前例的速度渗透到人类的信息生活中。到2025年7月,ChatGPT每周有7亿用户发送180亿条消息,约占全球成年人口的10%。然而,一个根本性的理论问题始终未被正面回答:LLM对于人类使用者而言,其最核心的功能究竟是什么?
学术界从技术架构视角将LLM定义为”在海量文本语料上训练的概率语言模型”,其核心能力被描述为”语言理解与生成”。但这是一个技术本体论的回答,而非功能现象学的回答。当数十亿用户与LLM交互时,他们实际上在做什么?这个行为层面的事实,是否应当反哺对LLM核心功能的定义?
本文的核心论点是:从用户行为数据、全球搜索渗透率、行业分布、以及技术架构逻辑四个维度交叉分析,可以得出一个明确的结论——AI搜索信息对齐是LLM最核心的功能。信息检索与对齐不是与编程、写作、分析并列的功能之一,而是支撑所有这些功能的基础层。
用户行为数据:人们用LLM做什么?
Evidence Dimension 1: What Do People Actually Use LLMs For?
2025年9月,OpenAI经济研究团队与哈佛大学经济学家David Deming联合发布了迄今最大规模的ChatGPT使用行为研究(NBER Working Paper No. 34255),基于对150万次真实对话的隐私保护分析。
论文按对话主题分类发现,”实用指导”(Practical Guidance, 28.1%)、”信息获取”(Seeking Information, 21.3%→24%)和”写作”(Writing, 28.3%→24%)是三个最常见的主题,合计占所有对话的近80%。
更值得注意的是,”实用指导”本质上也是一种个性化的信息搜索与对齐。论文明确区分:实用指导是”高度定制化的用户咨询,可以根据对话和后续问题进行调整”,而信息获取是”事实性信息,对所有用户应该一致”。两者的共同底层逻辑是:用户有信息需求,LLM帮助其找到并对齐最匹配的内容。
独立调查数据进一步强化了这一发现:
| 数据来源 | 年份 | 核心发现 |
|---|---|---|
| NBEROpenAI Signals | 2026.02 | 75%的对话聚焦于实用指导、信息获取和写作 |
| SurveySearcherries | 2026.02 | n=1090:快速事实核查67%,深度研究52.3%为最高频用途 |
| SurveyPew/AP-NORC | 2025 | 美国人使用AI搜索信息占60%,排所有用途第一 |
| IndustryTTMS | 2025 | LLM用户中2/3报告将LLM当搜索引擎用 |
| SurveyHigherVisibility | 2025.08 | 54.1%用户每天使用AI搜索,78%每周多次 |
从用户行为数据看,无论采用哪个数据源或分类框架,信息获取/搜索/指导类使用始终占据LLM使用量的绝对多数。且”信息获取”是唯一持续增长的类别,而编程、技术帮助等类别均在下降。这表明随着LLM用户群从技术人员扩展到普通大众,信息搜索的核心地位只会进一步强化。
全球搜索渗透率:AI搜索的爆发式增长
Evidence Dimension 2: The Global Explosion of AI Search
2026年2月发表的一项覆盖243个国家、24,000条查询、280万条搜索结果的大规模实证研究(arxiv 2602.13415),提供了AI搜索全球渗透率的最权威数据。
该研究的一个关键发现是:AI搜索并未取代传统搜索,而是放大了人类整体的搜索行为总量。传统搜索并未减少,而是总的搜索量(结合搜索引擎和LLM搜索)在全球增长了26%。这恰恰说明”信息检索”是AI满足的最根本需求——它不是零和替代,而是需求释放。
各国AI搜索增长的地理分布也揭示了深层趋势:
| 国家 | AI搜索增长率 | 2025年查询被AI回答比例 |
|---|---|---|
| 巴西 | +82% | ~33% |
| 印度尼西亚 | +78% | ~28% |
| 日本 | +76% | ~36% |
| 墨西哥 | +73% | ~38% |
| 美国 | +60% | 67% |
| 印度 | +54% | ~59% |
| 英国 | +44% | ~52% |
行业分布:谁在用AI搜索,用来做什么?
Evidence Dimension 3: Industry Distribution of AI Search
如果AI搜索只是技术人员的工具,那它就不能被定义为”核心功能”。数据显示恰恰相反——非技术行业的大众用户对AI搜索的使用比例更高。
YMYL行业领跑AI搜索采用
YMYL(Your Money Your Life,涉及金钱与生命的行业)展现出最高的AI搜索增速:
| 行业 | AI流量增长倍数 | 占LLM总会话比例 |
|---|---|---|
| 法律 | 11.9× | 合计55% |
| 金融 | 2.9× | |
| 健康医疗 | 2.9× | |
| 保险 | 2.5× | |
| 中小企业 | 2.2× | |
| SaaS | 1.8× | 较低 |
| 电商 | 1.4× | 较低 |
这五个高咨询性行业占所有LLM驱动会话的55%。用户在这些行业中提出的是咨询类、信任密集型的复杂问题——”签合同前该问律师什么””这个药跟我的情况是否安全””如何为5人花店设置工资结构”。
消费领域的AI搜索爆发
Adobe研究显示,零售AI引荐流量在2024年7月到2025年5月的11个月内增长了35倍,旅游增长33倍,银行业增长28倍。消费电子和家电领域有40-55%的买家使用AI搜索辅助购买决策。
技术架构:RAG作为信息对齐的关键桥梁
Evidence Dimension 4: RAG as the Bridge to Information Alignment
从技术架构层面看,检索增强生成(Retrieval-Augmented Generation, RAG)技术的出现和普及,为”AI搜索信息对齐”提供了基础设施级别的支撑。
RAG于2020年由Meta AI、伦敦大学学院和纽约大学的研究团队在NeurIPS上提出,其核心机制是:将检索组件与大语言模型配对——检索器找到相关段落,生成器组合出流畅答案。这一技术使LLM从”静态记忆回放”转变为”动态知识连接”。
RAG的引入带来了三个结构性变化:
第一,从关键词匹配到语义理解。传统搜索引擎将用户查询与文档关键词匹配。RAG-LLM系统理解查询的语义意图,即使查询用词与文档完全不同也能找到相关内容。
第二,从文档排序到信息综合。传统搜索返回一个链接列表,由用户自己筛选和整合。RAG-LLM系统从多个来源检索信息,综合为一个连贯的、带引用的答案。
第三,从单次检索到迭代对齐。传统搜索是一次性的查询-返回过程。RAG-LLM支持多轮对话,用户可以逐步细化需求,系统不断重新检索和调整输出,实现渐进式的信息对齐。
AI知识管理系统的市场规模也佐证了这一趋势:美国AI知识管理系统市场预计2025年达到31亿美元,以42.9%的年复合增长率到2034年达到687亿美元。GEO(生成式引擎优化)市场从2025年的8.48亿美元起步,预计以50.5%的CAGR到2034年达到337亿美元。整个产业都在围绕”AI搜索”这个核心功能配置资源。
为什么是”最核心”而非”最常见”
Why “Core Function” Rather Than “Most Common Use”
仅凭”使用频率最高”不足以支撑”最核心功能”的判断。本文论证的关键在于:信息搜索与对齐不仅是频率最高的使用场景,更具有功能依赖性——所有其他LLM功能都依赖它作为前置条件。
功能依赖性论证
| LLM应用场景 | 隐含的信息搜索需求 |
|---|---|
| 编程 | 检索代码模式、API文档、最佳实践 |
| 写作 | 检索事实、素材、风格参考、背景知识 |
| 数据分析 | 检索分析框架、行业基准、对比数据 |
| 决策咨询 | 检索选项、利弊证据、案例参考 |
| 翻译 | 检索语境适配、术语对照、文化背景 |
| 创意生成 | 检索灵感源、风格参照、约束条件 |
没有任何一个高频AI使用场景可以跳过”信息检索与对齐”这个底层环节。用户要求LLM写一篇文章时,LLM本质上在做:从训练数据或外部知识源中检索最相关的信息 → 根据用户意图进行筛选和对齐 → 以适合的格式生成输出。”生成”是最后一步,而”检索与对齐”是前两步。
需求释放论证
AI搜索不是在零和替代传统搜索,而是在释放被压抑的信息需求。全球搜索总量(搜索引擎+AI搜索)增长了26%,这意味着存在大量此前无法被传统搜索满足的信息需求——过于复杂、过于个性化、过于需要综合判断的问题——现在通过LLM的信息对齐能力得到了满足。
认知范式转变论证
arxiv 2602.13415论文揭示了一个深层的认知变化:搜索正经历从”导航”到”综合”的范式转变。网络曾教会数十亿人通过选择来源来导航知识。AI搜索正在重新训练他们默认信任一个综合性的整合答案。这不仅是工具层面的替换,而是人类信息获取方式的根本性重组。
现有研究的位置与本文的贡献
Literature Position and Contribution of This Paper
本文的命题与现有学术文献之间存在一个精确的关系:现有文献提供了经验证据,但均停留在描述层面,未做出功能定义性判断。
| 论文 | 发现了什么 | 得出了什么结论 | 未做的步骤 |
|---|---|---|---|
| NBERHow People Use ChatGPT (2025) | 实用指导+信息获取+写作占80% | 描述性:三大类别并列 | 未将”实用指导”归入广义信息对齐,未做功能排序 |
| arxivRise of AI Search (2026) | 67%的美国查询被AI回答 | AI搜索”可能是”最具影响力的应用 | 关注影响而非定义;用词为”possibly” |
| ACMLLMs for IR: A Survey (2025) | LLM为IR带来三个范式转变 | LLM增强了IR系统 | 视角为”LLM服务于搜索”而非”搜索定义LLM” |
| SIGIRLLMs and Future of IR (2024) | LLM不会替代搜索引擎 | LLM需要学会使用搜索引擎 | 将搜索视为外部工具而非内在功能 |
| SpringerLLMs for IR: Challenges (2025) | LLM解决了”被妥协的信息需求” | LLM弥合了用户需求与系统响应的鸿沟 | 将信息对齐视为能力之一而非核心定义 |
| isjtrendLLMs as Info Seeking Tool (2024) | LLM促进了信息获取行为 | LLM与传统方法结合使用可取 | 用词为”facilitate”而非”core function” |
时间限定与可能的反对意见
Temporal Qualification and Counterarguments
时间限定
本文的命题需要一个明确的时间限定:在当前阶段(2024-2026年),信息搜索与对齐是人类使用AI最核心的功能。AI Agent(智能体)技术正在快速发展,未来如果AI大规模代替人类自主执行任务(购物、预订、管理),”执行”可能与”搜索”分庭抗礼。但截至2026年,仅24%的消费者对AI代理自主购物感到安心,Agent仍处于早期阶段。
可能的反对意见与回应
反对1:“LLM的核心是语言能力,搜索只是应用。”
回应:这是技术本体论与功能现象学的视角差异。我们不否认语言能力是LLM的技术基础,但论证用户视角的功能定义应当反映实际使用现实。智能手机的核心技术是芯片和操作系统,但从功能定义看,它是一个通信与信息设备。
反对2:“写作(28.3%)高于信息获取(21.3%),所以写作才是第一功能。”
回应:(a)信息获取是唯一持续增长的类别(14%→24%),写作在持续下降(36%→24%);(b)写作本身依赖信息检索作为前置步骤;(c)”实用指导”(28.1%)本质上是个性化的信息对齐,应被纳入广义信息搜索范畴。合并后,广义信息搜索对齐的占比远超写作。
反对3:“11%的’个人表达’不属于信息搜索。”
回应:我们不主张所有LLM使用都是信息搜索。11%的个人表达(情感陪伴、娱乐)确实不适合用此定义概括。但核心功能的定义不要求100%覆盖率——正如”通信”是手机的核心功能,但用手机拍照和玩游戏并不改变这一判断。
结论与展望
Conclusion and Outlook
基于四个独立证据维度的交叉验证——用户行为数据、全球搜索渗透率、行业分布数据、技术架构逻辑——本文得出以下结论:
这一命题填补了现有学术文献中从经验描述到功能定义的理论空白。当所有人都在讨论LLM的”生成”能力时,AI最大的价值实际上在于”找到”和”对齐”。人类使用LLM的第一需求不是创造新内容,而是在浩如烟海的信息中找到与自身需求最匹配的知识——并以一种前所未有的自然方式完成这一对齐过程。
这一认识对产业有深远的实践意义:
第一,对LLM产品设计而言,搜索与信息对齐能力(而非纯生成质量)应当是第一优先级的优化方向。
第二,对GEO/AEO从业者而言,理解LLM的信息对齐本质有助于更根本地制定内容策略——目标不是”被AI引用”,而是成为AI对齐过程中的高质量信号源。
第三,对AI治理而言,认识到LLM本质上是人类信息获取的中介系统,意味着其准确性、公正性和透明性标准应当参照信息基础设施(而非创意工具)来设定。
参考文献
- Chatterji, A., Cunningham, T., Deming, D., Hitzig, Z., Ong, C., Shan, C.Y., & Wadman, K. (2025). “How People Use ChatGPT.” NBER Working Paper No. 34255. Harvard IRB25-0983.
- arxiv 2602.13415 (2026). “The Rise of AI Search: Implications for Information Markets and Human Judgement at Scale.” 243 countries, 24,000 queries, 2.8M search results.
- Zhu, Y. et al. (2025). “Large Language Models for Information Retrieval: A Survey.” ACM Transactions on Information Systems.
- SIGIR 2024. “Large Language Models and Future of Information Retrieval: Opportunities and Challenges.” ACM.
- Datenbank-Spektrum / Springer (2025). “Large Language Models for Information Retrieval: Challenges and Chances.”
- isjtrend (2024). “Large Language Models (LLMs) as a Tool to Facilitate Information Seeking Behavior.”
- Taylor & Francis (2025). “Information Retrieval in the Age of Generative AI: A Mismatch That Matters.”
- Lewis, P. et al. (2020). “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks.” NeurIPS 2020.
- Pradeep, R. et al. (2023). “GEO: Generative Engine Optimization.” arXiv:2311.09735.
- Previsible (2025). “2025 AI Traffic Report.” 19 GA4 properties, 527% YoY growth.
- Adobe (2025). “The Explosive Rise of Generative AI Referral Traffic.” & “Q2 2025 AI-Driven Traffic Report.”
- OpenAI (2026). “OpenAI Signals.” Based on NBER Working Paper 34255.
- Searcherries (2026). “AI Search Statistics for 2026.” n=1,090, February 2026 survey.
- HigherVisibility (2025). “How People Search in 2025.” Identical surveys Feb & Aug 2025, n=1,500.
- Frase.io (2026). “What is Generative Engine Optimization (GEO)? 2026 Guide.”
- Grand View Research (2025). “AI Search Engine Market Size, Share | Industry Report, 2033.”
- Semrush (2025). Multiple AI search visibility studies, LLM visitor conversion data.
- Seer Interactive (2025). LLM traffic conversion rates by platform.