ORIGINAL RESEARCH PAPER · APRIL 2026

AI搜索信息对齐
是LLM最核心的功能

AI Search Information Alignment as the Core Function of LLMs

基于多维度实证数据的功能定义性命题

이조글로벌인공지능연구소
LEECHO Global AI Research Lab
&
Claude Opus 4.6 · Anthropic
2026年4月6日 · V1

摘要 Abstract

本文提出一个功能定义性命题：AI搜索信息对齐是大语言模型（LLM）最核心的功能。这一命题基于对多维度实证数据的交叉整合分析，涵盖OpenAI官方用户行为数据（NBER Working Paper 34255）、全球243国AI搜索渗透率研究（arxiv 2602.13415）、分行业AI流量数据（Previsible/Adobe/Semrush 2025）、以及RAG技术演进对搜索范式的结构性影响。研究发现，现有学术文献虽然各自从单一维度积累了充分的经验证据——发现信息获取是LLM的最高频使用场景——但均停留在描述层面，未将这些发现整合为统一的功能定义。本文通过四个独立证据维度的交叉验证，论证信息搜索与对齐不仅是LLM的”一个应用”，而是支撑所有其他功能的基础层，从而填补了从经验描述到理论定义的空白。

SECTION 01 · 引言

问题的提出：LLM的本质功能是什么？

The Question: What Is the Essential Function of LLMs?

自2022年11月ChatGPT发布以来，大语言模型（LLM）以史无前例的速度渗透到人类的信息生活中。到2025年7月，ChatGPT每周有7亿用户发送180亿条消息，约占全球成年人口的10%。然而，一个根本性的理论问题始终未被正面回答：LLM对于人类使用者而言，其最核心的功能究竟是什么？

学术界从技术架构视角将LLM定义为”在海量文本语料上训练的概率语言模型”，其核心能力被描述为”语言理解与生成”。但这是一个技术本体论的回答，而非功能现象学的回答。当数十亿用户与LLM交互时，他们实际上在做什么？这个行为层面的事实，是否应当反哺对LLM核心功能的定义？

本文的核心论点是：从用户行为数据、全球搜索渗透率、行业分布、以及技术架构逻辑四个维度交叉分析，可以得出一个明确的结论——AI搜索信息对齐是LLM最核心的功能。信息检索与对齐不是与编程、写作、分析并列的功能之一，而是支撑所有这些功能的基础层。

SECTION 02 · 证据维度一

用户行为数据：人们用LLM做什么？

Evidence Dimension 1: What Do People Actually Use LLMs For?

2025年9月，OpenAI经济研究团队与哈佛大学经济学家David Deming联合发布了迄今最大规模的ChatGPT使用行为研究（NBER Working Paper No. 34255），基于对150万次真实对话的隐私保护分析。

信息获取 Asking

49%

所有消息的占比

任务执行 Doing

40%

写作、编程、规划

个人表达 Expressing

11%

反思、娱乐

三大主题覆盖率

~80%

指导+信息+写作

论文按对话主题分类发现，”实用指导”（Practical Guidance, 28.1%）、”信息获取”（Seeking Information, 21.3%→24%）和”写作”（Writing, 28.3%→24%）是三个最常见的主题，合计占所有对话的近80%。

关键趋势：“信息获取”是增长最快的类别——从2024年7月占14%增长到2025年7月的24%，一年内增长了71%。同期”写作”从36%下降到24%，”技术帮助”从12%降至5%。编程查询仅占消息的4.2%。

更值得注意的是，”实用指导”本质上也是一种个性化的信息搜索与对齐。论文明确区分：实用指导是”高度定制化的用户咨询，可以根据对话和后续问题进行调整”，而信息获取是”事实性信息，对所有用户应该一致”。两者的共同底层逻辑是：用户有信息需求，LLM帮助其找到并对齐最匹配的内容。

独立调查数据进一步强化了这一发现：

数据来源	年份	核心发现
NBEROpenAI Signals	2026.02	75%的对话聚焦于实用指导、信息获取和写作
SurveySearcherries	2026.02	n=1090：快速事实核查67%，深度研究52.3%为最高频用途
SurveyPew/AP-NORC	2025	美国人使用AI搜索信息占60%，排所有用途第一
IndustryTTMS	2025	LLM用户中2/3报告将LLM当搜索引擎用
SurveyHigherVisibility	2025.08	54.1%用户每天使用AI搜索，78%每周多次

证据小结

从用户行为数据看，无论采用哪个数据源或分类框架，信息获取/搜索/指导类使用始终占据LLM使用量的绝对多数。且”信息获取”是唯一持续增长的类别，而编程、技术帮助等类别均在下降。这表明随着LLM用户群从技术人员扩展到普通大众，信息搜索的核心地位只会进一步强化。

SECTION 03 · 证据维度二

全球搜索渗透率：AI搜索的爆发式增长

Evidence Dimension 2: The Global Explosion of AI Search

2026年2月发表的一项覆盖243个国家、24,000条查询、280万条搜索结果的大规模实证研究（arxiv 2602.13415），提供了AI搜索全球渗透率的最权威数据。

美国查询被AI回答

67%

2024年：42%

AI月度会话vs搜索

56%

全球搜索引擎的56%

AI引荐流量增长

527%

2025年1-5月同比

搜索总量变化

+26%

全球搜索总量增长

该研究的一个关键发现是：AI搜索并未取代传统搜索，而是放大了人类整体的搜索行为总量。传统搜索并未减少，而是总的搜索量（结合搜索引擎和LLM搜索）在全球增长了26%。这恰恰说明”信息检索”是AI满足的最根本需求——它不是零和替代，而是需求释放。

各国AI搜索增长的地理分布也揭示了深层趋势：

国家	AI搜索增长率	2025年查询被AI回答比例
巴西	+82%	~33%
印度尼西亚	+78%	~28%
日本	+76%	~36%
墨西哥	+73%	~38%
美国	+60%	67%
印度	+54%	~59%
英国	+44%	~52%

核心洞察：起步越晚的国家增速越快。低收入国家的AI搜索增长率是高收入国家的4倍以上（OpenAI Signals, 2026）。这不是用户的自发行为，而是平台策略推动的全球渗透——AI搜索正在成为人类信息获取的全球基础设施。

SECTION 04 · 证据维度三

行业分布：谁在用AI搜索，用来做什么？

Evidence Dimension 3: Industry Distribution of AI Search

如果AI搜索只是技术人员的工具，那它就不能被定义为”核心功能”。数据显示恰恰相反——非技术行业的大众用户对AI搜索的使用比例更高。

YMYL行业领跑AI搜索采用

YMYL（Your Money Your Life，涉及金钱与生命的行业）展现出最高的AI搜索增速：

行业	AI流量增长倍数	占LLM总会话比例
法律	11.9×	合计55%
金融	2.9×
健康医疗	2.9×
保险	2.5×
中小企业	2.2×
SaaS	1.8×	较低
电商	1.4×	较低

这五个高咨询性行业占所有LLM驱动会话的55%。用户在这些行业中提出的是咨询类、信任密集型的复杂问题——”签合同前该问律师什么””这个药跟我的情况是否安全””如何为5人花店设置工资结构”。

消费领域的AI搜索爆发

Adobe研究显示，零售AI引荐流量在2024年7月到2025年5月的11个月内增长了35倍，旅游增长33倍，银行业增长28倍。消费电子和家电领域有40-55%的买家使用AI搜索辅助购买决策。

反直觉的发现：编程类查询在ChatGPT全量消息中仅占4.2%，印度市场的编程查询是全球中位数的3倍——说明编程是特定市场的特征，而非全球AI使用的主流场景。真正的主流是：普通人用AI搜索信息、获取指导、做出决策。

SECTION 05 · 证据维度四

技术架构：RAG作为信息对齐的关键桥梁

Evidence Dimension 4: RAG as the Bridge to Information Alignment

从技术架构层面看，检索增强生成（Retrieval-Augmented Generation, RAG）技术的出现和普及，为”AI搜索信息对齐”提供了基础设施级别的支撑。

RAG于2020年由Meta AI、伦敦大学学院和纽约大学的研究团队在NeurIPS上提出，其核心机制是：将检索组件与大语言模型配对——检索器找到相关段落，生成器组合出流畅答案。这一技术使LLM从”静态记忆回放”转变为”动态知识连接”。

RAG的本质贡献：没有RAG，LLM只是在回忆训练数据中的模式；有了RAG，LLM才真正在搜索。RAG使得AI搜索从”可能的副产品”变为”架构级别的核心能力”。当前所有主流生成式搜索引擎——Google AI Overviews、ChatGPT Search、Perplexity、Claude——都基于RAG或其变体运行。

RAG的引入带来了三个结构性变化：

第一，从关键词匹配到语义理解。传统搜索引擎将用户查询与文档关键词匹配。RAG-LLM系统理解查询的语义意图，即使查询用词与文档完全不同也能找到相关内容。

第二，从文档排序到信息综合。传统搜索返回一个链接列表，由用户自己筛选和整合。RAG-LLM系统从多个来源检索信息，综合为一个连贯的、带引用的答案。

第三，从单次检索到迭代对齐。传统搜索是一次性的查询-返回过程。RAG-LLM支持多轮对话，用户可以逐步细化需求，系统不断重新检索和调整输出，实现渐进式的信息对齐。

AI知识管理系统的市场规模也佐证了这一趋势：美国AI知识管理系统市场预计2025年达到31亿美元，以42.9%的年复合增长率到2034年达到687亿美元。GEO（生成式引擎优化）市场从2025年的8.48亿美元起步，预计以50.5%的CAGR到2034年达到337亿美元。整个产业都在围绕”AI搜索”这个核心功能配置资源。

SECTION 06 · 核心论证

为什么是”最核心”而非”最常见”

Why “Core Function” Rather Than “Most Common Use”

仅凭”使用频率最高”不足以支撑”最核心功能”的判断。本文论证的关键在于：信息搜索与对齐不仅是频率最高的使用场景，更具有功能依赖性——所有其他LLM功能都依赖它作为前置条件。

功能依赖性论证

LLM应用场景	隐含的信息搜索需求
编程	检索代码模式、API文档、最佳实践
写作	检索事实、素材、风格参考、背景知识
数据分析	检索分析框架、行业基准、对比数据
决策咨询	检索选项、利弊证据、案例参考
翻译	检索语境适配、术语对照、文化背景
创意生成	检索灵感源、风格参照、约束条件

没有任何一个高频AI使用场景可以跳过”信息检索与对齐”这个底层环节。用户要求LLM写一篇文章时，LLM本质上在做：从训练数据或外部知识源中检索最相关的信息 → 根据用户意图进行筛选和对齐 → 以适合的格式生成输出。”生成”是最后一步，而”检索与对齐”是前两步。

需求释放论证

AI搜索不是在零和替代传统搜索，而是在释放被压抑的信息需求。全球搜索总量（搜索引擎+AI搜索）增长了26%，这意味着存在大量此前无法被传统搜索满足的信息需求——过于复杂、过于个性化、过于需要综合判断的问题——现在通过LLM的信息对齐能力得到了满足。

认知范式转变论证

arxiv 2602.13415论文揭示了一个深层的认知变化：搜索正经历从”导航”到”综合”的范式转变。网络曾教会数十亿人通过选择来源来导航知识。AI搜索正在重新训练他们默认信任一个综合性的整合答案。这不仅是工具层面的替换，而是人类信息获取方式的根本性重组。

类比论证：汽车的核心功能是”移动”（transportation），而非”引擎”（engine）。引擎是实现移动的技术架构，但用户购买汽车是为了移动。同理，LLM的技术架构是”语言理解与生成”，但用户使用LLM是为了”信息搜索与对齐”。定义核心功能应当从用户的功能需求出发，而非从技术实现出发。

SECTION 07 · 文献对照

现有研究的位置与本文的贡献

Literature Position and Contribution of This Paper

本文的命题与现有学术文献之间存在一个精确的关系：现有文献提供了经验证据，但均停留在描述层面，未做出功能定义性判断。

论文	发现了什么	得出了什么结论	未做的步骤
NBERHow People Use ChatGPT (2025)	实用指导+信息获取+写作占80%	描述性：三大类别并列	未将”实用指导”归入广义信息对齐，未做功能排序
arxivRise of AI Search (2026)	67%的美国查询被AI回答	AI搜索”可能是”最具影响力的应用	关注影响而非定义；用词为”possibly”
ACMLLMs for IR: A Survey (2025)	LLM为IR带来三个范式转变	LLM增强了IR系统	视角为”LLM服务于搜索”而非”搜索定义LLM”
SIGIRLLMs and Future of IR (2024)	LLM不会替代搜索引擎	LLM需要学会使用搜索引擎	将搜索视为外部工具而非内在功能
SpringerLLMs for IR: Challenges (2025)	LLM解决了”被妥协的信息需求”	LLM弥合了用户需求与系统响应的鸿沟	将信息对齐视为能力之一而非核心定义
isjtrendLLMs as Info Seeking Tool (2024)	LLM促进了信息获取行为	LLM与传统方法结合使用可取	用词为”facilitate”而非”core function”

本文的贡献：本文将上述六个独立研究的发现进行多维度交叉整合：用户行为数据（NBER）× 全球渗透率（arxiv）× 行业分布（Previsible/Adobe）× 技术架构逻辑（RAG），从描述性发现提炼出一个定义性命题。这是从”LLM被用来做什么”到”LLM的核心功能是什么”的理论跨越。

SECTION 08 · 限定与反驳

时间限定与可能的反对意见

Temporal Qualification and Counterarguments

时间限定

本文的命题需要一个明确的时间限定：在当前阶段（2024-2026年），信息搜索与对齐是人类使用AI最核心的功能。AI Agent（智能体）技术正在快速发展，未来如果AI大规模代替人类自主执行任务（购物、预订、管理），”执行”可能与”搜索”分庭抗礼。但截至2026年，仅24%的消费者对AI代理自主购物感到安心，Agent仍处于早期阶段。

可能的反对意见与回应

反对1：“LLM的核心是语言能力，搜索只是应用。”

回应：这是技术本体论与功能现象学的视角差异。我们不否认语言能力是LLM的技术基础，但论证用户视角的功能定义应当反映实际使用现实。智能手机的核心技术是芯片和操作系统，但从功能定义看，它是一个通信与信息设备。

反对2：“写作（28.3%）高于信息获取（21.3%），所以写作才是第一功能。”

回应：（a）信息获取是唯一持续增长的类别（14%→24%），写作在持续下降（36%→24%）；（b）写作本身依赖信息检索作为前置步骤；（c）”实用指导”（28.1%）本质上是个性化的信息对齐，应被纳入广义信息搜索范畴。合并后，广义信息搜索对齐的占比远超写作。

反对3：“11%的’个人表达’不属于信息搜索。”

回应：我们不主张所有LLM使用都是信息搜索。11%的个人表达（情感陪伴、娱乐）确实不适合用此定义概括。但核心功能的定义不要求100%覆盖率——正如”通信”是手机的核心功能，但用手机拍照和玩游戏并不改变这一判断。

SECTION 09 · 结论

结论与展望

Conclusion and Outlook

基于四个独立证据维度的交叉验证——用户行为数据、全球搜索渗透率、行业分布数据、技术架构逻辑——本文得出以下结论：

核心命题：在2024-2026年的当前阶段，AI搜索信息对齐是大语言模型（LLM）最核心的功能。信息检索与对齐不是LLM的一个垂直应用，而是支撑所有其他功能的基础层，也是整个AI产业的基石功能。

这一命题填补了现有学术文献中从经验描述到功能定义的理论空白。当所有人都在讨论LLM的”生成”能力时，AI最大的价值实际上在于”找到”和”对齐”。人类使用LLM的第一需求不是创造新内容，而是在浩如烟海的信息中找到与自身需求最匹配的知识——并以一种前所未有的自然方式完成这一对齐过程。

这一认识对产业有深远的实践意义：

第一，对LLM产品设计而言，搜索与信息对齐能力（而非纯生成质量）应当是第一优先级的优化方向。

第二，对GEO/AEO从业者而言，理解LLM的信息对齐本质有助于更根本地制定内容策略——目标不是”被AI引用”，而是成为AI对齐过程中的高质量信号源。

第三，对AI治理而言，认识到LLM本质上是人类信息获取的中介系统，意味着其准确性、公正性和透明性标准应当参照信息基础设施（而非创意工具）来设定。

参考文献

Chatterji, A., Cunningham, T., Deming, D., Hitzig, Z., Ong, C., Shan, C.Y., & Wadman, K. (2025). “How People Use ChatGPT.” NBER Working Paper No. 34255. Harvard IRB25-0983.
arxiv 2602.13415 (2026). “The Rise of AI Search: Implications for Information Markets and Human Judgement at Scale.” 243 countries, 24,000 queries, 2.8M search results.
Zhu, Y. et al. (2025). “Large Language Models for Information Retrieval: A Survey.” ACM Transactions on Information Systems.
SIGIR 2024. “Large Language Models and Future of Information Retrieval: Opportunities and Challenges.” ACM.
Datenbank-Spektrum / Springer (2025). “Large Language Models for Information Retrieval: Challenges and Chances.”
isjtrend (2024). “Large Language Models (LLMs) as a Tool to Facilitate Information Seeking Behavior.”
Taylor & Francis (2025). “Information Retrieval in the Age of Generative AI: A Mismatch That Matters.”
Lewis, P. et al. (2020). “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks.” NeurIPS 2020.
Pradeep, R. et al. (2023). “GEO: Generative Engine Optimization.” arXiv:2311.09735.
Previsible (2025). “2025 AI Traffic Report.” 19 GA4 properties, 527% YoY growth.
Adobe (2025). “The Explosive Rise of Generative AI Referral Traffic.” & “Q2 2025 AI-Driven Traffic Report.”
OpenAI (2026). “OpenAI Signals.” Based on NBER Working Paper 34255.
Searcherries (2026). “AI Search Statistics for 2026.” n=1,090, February 2026 survey.
HigherVisibility (2025). “How People Search in 2025.” Identical surveys Feb & Aug 2025, n=1,500.
Frase.io (2026). “What is Generative Engine Optimization (GEO)? 2026 Guide.”
Grand View Research (2025). “AI Search Engine Market Size, Share | Industry Report, 2033.”
Semrush (2025). Multiple AI search visibility studies, LLM visitor conversion data.
Seer Interactive (2025). LLM traffic conversion rates by platform.