ORIGINAL RESEARCH PAPER · APRIL 2026

AI搜索信息对齐
是LLM最核心的功能

AI Search Information Alignment as the Core Function of LLMs

基于多维度实证数据的功能定义性命题

이조글로벌인공지능연구소
LEECHO Global AI Research Lab
&
Claude Opus 4.6 · Anthropic
2026年4月6日 · V1

摘要 Abstract

本文提出一个功能定义性命题:AI搜索信息对齐是大语言模型(LLM)最核心的功能。这一命题基于对多维度实证数据的交叉整合分析,涵盖OpenAI官方用户行为数据(NBER Working Paper 34255)、全球243国AI搜索渗透率研究(arxiv 2602.13415)、分行业AI流量数据(Previsible/Adobe/Semrush 2025)、以及RAG技术演进对搜索范式的结构性影响。研究发现,现有学术文献虽然各自从单一维度积累了充分的经验证据——发现信息获取是LLM的最高频使用场景——但均停留在描述层面,未将这些发现整合为统一的功能定义。本文通过四个独立证据维度的交叉验证,论证信息搜索与对齐不仅是LLM的”一个应用”,而是支撑所有其他功能的基础层,从而填补了从经验描述到理论定义的空白。


SECTION 01 · 引言

问题的提出:LLM的本质功能是什么?

The Question: What Is the Essential Function of LLMs?

自2022年11月ChatGPT发布以来,大语言模型(LLM)以史无前例的速度渗透到人类的信息生活中。到2025年7月,ChatGPT每周有7亿用户发送180亿条消息,约占全球成年人口的10%。然而,一个根本性的理论问题始终未被正面回答:LLM对于人类使用者而言,其最核心的功能究竟是什么?

学术界从技术架构视角将LLM定义为”在海量文本语料上训练的概率语言模型”,其核心能力被描述为”语言理解与生成”。但这是一个技术本体论的回答,而非功能现象学的回答。当数十亿用户与LLM交互时,他们实际上在做什么?这个行为层面的事实,是否应当反哺对LLM核心功能的定义?

本文的核心论点是:从用户行为数据、全球搜索渗透率、行业分布、以及技术架构逻辑四个维度交叉分析,可以得出一个明确的结论——AI搜索信息对齐是LLM最核心的功能。信息检索与对齐不是与编程、写作、分析并列的功能之一,而是支撑所有这些功能的基础层。


SECTION 02 · 证据维度一

用户行为数据:人们用LLM做什么?

Evidence Dimension 1: What Do People Actually Use LLMs For?

2025年9月,OpenAI经济研究团队与哈佛大学经济学家David Deming联合发布了迄今最大规模的ChatGPT使用行为研究(NBER Working Paper No. 34255),基于对150万次真实对话的隐私保护分析。

信息获取 Asking
49%
所有消息的占比
任务执行 Doing
40%
写作、编程、规划
个人表达 Expressing
11%
反思、娱乐
三大主题覆盖率
~80%
指导+信息+写作

论文按对话主题分类发现,”实用指导”(Practical Guidance, 28.1%)、”信息获取”(Seeking Information, 21.3%→24%)和”写作”(Writing, 28.3%→24%)是三个最常见的主题,合计占所有对话的近80%。

关键趋势:“信息获取”是增长最快的类别——从2024年7月占14%增长到2025年7月的24%,一年内增长了71%。同期”写作”从36%下降到24%,”技术帮助”从12%降至5%。编程查询仅占消息的4.2%。

更值得注意的是,”实用指导”本质上也是一种个性化的信息搜索与对齐。论文明确区分:实用指导是”高度定制化的用户咨询,可以根据对话和后续问题进行调整”,而信息获取是”事实性信息,对所有用户应该一致”。两者的共同底层逻辑是:用户有信息需求,LLM帮助其找到并对齐最匹配的内容。

独立调查数据进一步强化了这一发现:

数据来源 年份 核心发现
NBEROpenAI Signals 2026.02 75%的对话聚焦于实用指导、信息获取和写作
SurveySearcherries 2026.02 n=1090:快速事实核查67%,深度研究52.3%为最高频用途
SurveyPew/AP-NORC 2025 美国人使用AI搜索信息占60%,排所有用途第一
IndustryTTMS 2025 LLM用户中2/3报告将LLM当搜索引擎用
SurveyHigherVisibility 2025.08 54.1%用户每天使用AI搜索,78%每周多次
证据小结

从用户行为数据看,无论采用哪个数据源或分类框架,信息获取/搜索/指导类使用始终占据LLM使用量的绝对多数。且”信息获取”是唯一持续增长的类别,而编程、技术帮助等类别均在下降。这表明随着LLM用户群从技术人员扩展到普通大众,信息搜索的核心地位只会进一步强化。


SECTION 03 · 证据维度二

全球搜索渗透率:AI搜索的爆发式增长

Evidence Dimension 2: The Global Explosion of AI Search

2026年2月发表的一项覆盖243个国家、24,000条查询、280万条搜索结果的大规模实证研究(arxiv 2602.13415),提供了AI搜索全球渗透率的最权威数据。

美国查询被AI回答
67%
2024年:42%
AI月度会话vs搜索
56%
全球搜索引擎的56%
AI引荐流量增长
527%
2025年1-5月同比
搜索总量变化
+26%
全球搜索总量增长

该研究的一个关键发现是:AI搜索并未取代传统搜索,而是放大了人类整体的搜索行为总量。传统搜索并未减少,而是总的搜索量(结合搜索引擎和LLM搜索)在全球增长了26%。这恰恰说明”信息检索”是AI满足的最根本需求——它不是零和替代,而是需求释放。

各国AI搜索增长的地理分布也揭示了深层趋势:

国家 AI搜索增长率 2025年查询被AI回答比例
巴西 +82% ~33%
印度尼西亚 +78% ~28%
日本 +76% ~36%
墨西哥 +73% ~38%
美国 +60% 67%
印度 +54% ~59%
英国 +44% ~52%
核心洞察:起步越晚的国家增速越快。低收入国家的AI搜索增长率是高收入国家的4倍以上(OpenAI Signals, 2026)。这不是用户的自发行为,而是平台策略推动的全球渗透——AI搜索正在成为人类信息获取的全球基础设施。

SECTION 04 · 证据维度三

行业分布:谁在用AI搜索,用来做什么?

Evidence Dimension 3: Industry Distribution of AI Search

如果AI搜索只是技术人员的工具,那它就不能被定义为”核心功能”。数据显示恰恰相反——非技术行业的大众用户对AI搜索的使用比例更高

YMYL行业领跑AI搜索采用

YMYL(Your Money Your Life,涉及金钱与生命的行业)展现出最高的AI搜索增速:

行业 AI流量增长倍数 占LLM总会话比例
法律 11.9× 合计55%
金融 2.9×
健康医疗 2.9×
保险 2.5×
中小企业 2.2×
SaaS 1.8× 较低
电商 1.4× 较低

这五个高咨询性行业占所有LLM驱动会话的55%。用户在这些行业中提出的是咨询类、信任密集型的复杂问题——”签合同前该问律师什么””这个药跟我的情况是否安全””如何为5人花店设置工资结构”。

消费领域的AI搜索爆发

Adobe研究显示,零售AI引荐流量在2024年7月到2025年5月的11个月内增长了35倍,旅游增长33倍,银行业增长28倍。消费电子和家电领域有40-55%的买家使用AI搜索辅助购买决策。

反直觉的发现:编程类查询在ChatGPT全量消息中仅占4.2%,印度市场的编程查询是全球中位数的3倍——说明编程是特定市场的特征,而非全球AI使用的主流场景。真正的主流是:普通人用AI搜索信息、获取指导、做出决策。

SECTION 05 · 证据维度四

技术架构:RAG作为信息对齐的关键桥梁

Evidence Dimension 4: RAG as the Bridge to Information Alignment

从技术架构层面看,检索增强生成(Retrieval-Augmented Generation, RAG)技术的出现和普及,为”AI搜索信息对齐”提供了基础设施级别的支撑。

RAG于2020年由Meta AI、伦敦大学学院和纽约大学的研究团队在NeurIPS上提出,其核心机制是:将检索组件与大语言模型配对——检索器找到相关段落,生成器组合出流畅答案。这一技术使LLM从”静态记忆回放”转变为”动态知识连接”。

RAG的本质贡献:没有RAG,LLM只是在回忆训练数据中的模式;有了RAG,LLM才真正在搜索。RAG使得AI搜索从”可能的副产品”变为”架构级别的核心能力”。当前所有主流生成式搜索引擎——Google AI Overviews、ChatGPT Search、Perplexity、Claude——都基于RAG或其变体运行。

RAG的引入带来了三个结构性变化:

第一,从关键词匹配到语义理解。传统搜索引擎将用户查询与文档关键词匹配。RAG-LLM系统理解查询的语义意图,即使查询用词与文档完全不同也能找到相关内容。

第二,从文档排序到信息综合。传统搜索返回一个链接列表,由用户自己筛选和整合。RAG-LLM系统从多个来源检索信息,综合为一个连贯的、带引用的答案。

第三,从单次检索到迭代对齐。传统搜索是一次性的查询-返回过程。RAG-LLM支持多轮对话,用户可以逐步细化需求,系统不断重新检索和调整输出,实现渐进式的信息对齐。

AI知识管理系统的市场规模也佐证了这一趋势:美国AI知识管理系统市场预计2025年达到31亿美元,以42.9%的年复合增长率到2034年达到687亿美元。GEO(生成式引擎优化)市场从2025年的8.48亿美元起步,预计以50.5%的CAGR到2034年达到337亿美元。整个产业都在围绕”AI搜索”这个核心功能配置资源。


SECTION 06 · 核心论证

为什么是”最核心”而非”最常见”

Why “Core Function” Rather Than “Most Common Use”

仅凭”使用频率最高”不足以支撑”最核心功能”的判断。本文论证的关键在于:信息搜索与对齐不仅是频率最高的使用场景,更具有功能依赖性——所有其他LLM功能都依赖它作为前置条件。

功能依赖性论证

LLM应用场景 隐含的信息搜索需求
编程 检索代码模式、API文档、最佳实践
写作 检索事实、素材、风格参考、背景知识
数据分析 检索分析框架、行业基准、对比数据
决策咨询 检索选项、利弊证据、案例参考
翻译 检索语境适配、术语对照、文化背景
创意生成 检索灵感源、风格参照、约束条件

没有任何一个高频AI使用场景可以跳过”信息检索与对齐”这个底层环节。用户要求LLM写一篇文章时,LLM本质上在做:从训练数据或外部知识源中检索最相关的信息 → 根据用户意图进行筛选和对齐 → 以适合的格式生成输出。”生成”是最后一步,而”检索与对齐”是前两步。

需求释放论证

AI搜索不是在零和替代传统搜索,而是在释放被压抑的信息需求。全球搜索总量(搜索引擎+AI搜索)增长了26%,这意味着存在大量此前无法被传统搜索满足的信息需求——过于复杂、过于个性化、过于需要综合判断的问题——现在通过LLM的信息对齐能力得到了满足。

认知范式转变论证

arxiv 2602.13415论文揭示了一个深层的认知变化:搜索正经历从”导航”到”综合”的范式转变。网络曾教会数十亿人通过选择来源来导航知识。AI搜索正在重新训练他们默认信任一个综合性的整合答案。这不仅是工具层面的替换,而是人类信息获取方式的根本性重组。

类比论证:汽车的核心功能是”移动”(transportation),而非”引擎”(engine)。引擎是实现移动的技术架构,但用户购买汽车是为了移动。同理,LLM的技术架构是”语言理解与生成”,但用户使用LLM是为了”信息搜索与对齐”。定义核心功能应当从用户的功能需求出发,而非从技术实现出发。

SECTION 07 · 文献对照

现有研究的位置与本文的贡献

Literature Position and Contribution of This Paper

本文的命题与现有学术文献之间存在一个精确的关系:现有文献提供了经验证据,但均停留在描述层面,未做出功能定义性判断。

论文 发现了什么 得出了什么结论 未做的步骤
NBERHow People Use ChatGPT (2025) 实用指导+信息获取+写作占80% 描述性:三大类别并列 未将”实用指导”归入广义信息对齐,未做功能排序
arxivRise of AI Search (2026) 67%的美国查询被AI回答 AI搜索”可能是”最具影响力的应用 关注影响而非定义;用词为”possibly”
ACMLLMs for IR: A Survey (2025) LLM为IR带来三个范式转变 LLM增强了IR系统 视角为”LLM服务于搜索”而非”搜索定义LLM”
SIGIRLLMs and Future of IR (2024) LLM不会替代搜索引擎 LLM需要学会使用搜索引擎 将搜索视为外部工具而非内在功能
SpringerLLMs for IR: Challenges (2025) LLM解决了”被妥协的信息需求” LLM弥合了用户需求与系统响应的鸿沟 将信息对齐视为能力之一而非核心定义
isjtrendLLMs as Info Seeking Tool (2024) LLM促进了信息获取行为 LLM与传统方法结合使用可取 用词为”facilitate”而非”core function”
本文的贡献:本文将上述六个独立研究的发现进行多维度交叉整合:用户行为数据(NBER)× 全球渗透率(arxiv)× 行业分布(Previsible/Adobe)× 技术架构逻辑(RAG),从描述性发现提炼出一个定义性命题。这是从”LLM被用来做什么”到”LLM的核心功能是什么”的理论跨越。

SECTION 08 · 限定与反驳

时间限定与可能的反对意见

Temporal Qualification and Counterarguments

时间限定

本文的命题需要一个明确的时间限定:在当前阶段(2024-2026年),信息搜索与对齐是人类使用AI最核心的功能。AI Agent(智能体)技术正在快速发展,未来如果AI大规模代替人类自主执行任务(购物、预订、管理),”执行”可能与”搜索”分庭抗礼。但截至2026年,仅24%的消费者对AI代理自主购物感到安心,Agent仍处于早期阶段。

可能的反对意见与回应

反对1:“LLM的核心是语言能力,搜索只是应用。”

回应:这是技术本体论与功能现象学的视角差异。我们不否认语言能力是LLM的技术基础,但论证用户视角的功能定义应当反映实际使用现实。智能手机的核心技术是芯片和操作系统,但从功能定义看,它是一个通信与信息设备。

反对2:“写作(28.3%)高于信息获取(21.3%),所以写作才是第一功能。”

回应:(a)信息获取是唯一持续增长的类别(14%→24%),写作在持续下降(36%→24%);(b)写作本身依赖信息检索作为前置步骤;(c)”实用指导”(28.1%)本质上是个性化的信息对齐,应被纳入广义信息搜索范畴。合并后,广义信息搜索对齐的占比远超写作。

反对3:“11%的’个人表达’不属于信息搜索。”

回应:我们不主张所有LLM使用都是信息搜索。11%的个人表达(情感陪伴、娱乐)确实不适合用此定义概括。但核心功能的定义不要求100%覆盖率——正如”通信”是手机的核心功能,但用手机拍照和玩游戏并不改变这一判断。


SECTION 09 · 结论

结论与展望

Conclusion and Outlook

基于四个独立证据维度的交叉验证——用户行为数据、全球搜索渗透率、行业分布数据、技术架构逻辑——本文得出以下结论:

核心命题:在2024-2026年的当前阶段,AI搜索信息对齐是大语言模型(LLM)最核心的功能。信息检索与对齐不是LLM的一个垂直应用,而是支撑所有其他功能的基础层,也是整个AI产业的基石功能。

这一命题填补了现有学术文献中从经验描述到功能定义的理论空白。当所有人都在讨论LLM的”生成”能力时,AI最大的价值实际上在于”找到”和”对齐”。人类使用LLM的第一需求不是创造新内容,而是在浩如烟海的信息中找到与自身需求最匹配的知识——并以一种前所未有的自然方式完成这一对齐过程。

这一认识对产业有深远的实践意义:

第一,对LLM产品设计而言,搜索与信息对齐能力(而非纯生成质量)应当是第一优先级的优化方向。

第二,对GEO/AEO从业者而言,理解LLM的信息对齐本质有助于更根本地制定内容策略——目标不是”被AI引用”,而是成为AI对齐过程中的高质量信号源。

第三,对AI治理而言,认识到LLM本质上是人类信息获取的中介系统,意味着其准确性、公正性和透明性标准应当参照信息基础设施(而非创意工具)来设定。

参考文献

  1. Chatterji, A., Cunningham, T., Deming, D., Hitzig, Z., Ong, C., Shan, C.Y., & Wadman, K. (2025). “How People Use ChatGPT.” NBER Working Paper No. 34255. Harvard IRB25-0983.
  2. arxiv 2602.13415 (2026). “The Rise of AI Search: Implications for Information Markets and Human Judgement at Scale.” 243 countries, 24,000 queries, 2.8M search results.
  3. Zhu, Y. et al. (2025). “Large Language Models for Information Retrieval: A Survey.” ACM Transactions on Information Systems.
  4. SIGIR 2024. “Large Language Models and Future of Information Retrieval: Opportunities and Challenges.” ACM.
  5. Datenbank-Spektrum / Springer (2025). “Large Language Models for Information Retrieval: Challenges and Chances.”
  6. isjtrend (2024). “Large Language Models (LLMs) as a Tool to Facilitate Information Seeking Behavior.”
  7. Taylor & Francis (2025). “Information Retrieval in the Age of Generative AI: A Mismatch That Matters.”
  8. Lewis, P. et al. (2020). “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks.” NeurIPS 2020.
  9. Pradeep, R. et al. (2023). “GEO: Generative Engine Optimization.” arXiv:2311.09735.
  10. Previsible (2025). “2025 AI Traffic Report.” 19 GA4 properties, 527% YoY growth.
  11. Adobe (2025). “The Explosive Rise of Generative AI Referral Traffic.” & “Q2 2025 AI-Driven Traffic Report.”
  12. OpenAI (2026). “OpenAI Signals.” Based on NBER Working Paper 34255.
  13. Searcherries (2026). “AI Search Statistics for 2026.” n=1,090, February 2026 survey.
  14. HigherVisibility (2025). “How People Search in 2025.” Identical surveys Feb & Aug 2025, n=1,500.
  15. Frase.io (2026). “What is Generative Engine Optimization (GEO)? 2026 Guide.”
  16. Grand View Research (2025). “AI Search Engine Market Size, Share | Industry Report, 2033.”
  17. Semrush (2025). Multiple AI search visibility studies, LLM visitor conversion data.
  18. Seer Interactive (2025). LLM traffic conversion rates by platform.

“The most consequential application of AI today may simply be helping humans find what they’re looking for — and aligning it with what they actually need.”

이조글로벌인공지능연구소 · LEECHO Global AI Research Lab & Claude Opus 4.6 · Anthropic
V1 · April 6, 2026

댓글 남기기