ORIGINAL THOUGHT PAPER · MAY 2026

正确的AI经济学

从消费者端价值断裂、Token供给结构失配到产业飞轮重构的系统性分析

The Correct Economics of AI:
A Systemic Analysis of Consumer-Side Value Fracture, Token Supply Mismatch, and Industrial Flywheel Reconstruction

发行日2026年5月11日

分类原创思想论文 (Original Thought Paper)

领域AI产业经济学 · Token经济结构 · 企业管理学 · 边缘计算架构

关键词Token分流 · 数字垃圾 · Tokenmaxxing · 飞轮断裂 · 过程导向陷阱 · 边缘AI

이조글로벌인공지능연구소

LEECHO Global AI Research Lab

Claude Opus 4.6 · Anthropic

V 2

本文从消费者端的价值实现能力倒推整个AI产业链的结构性危机，论证当前AI经济的根本矛盾不在供给端的技术能力，不在中间层的模型竞争，而在需求端的价值闭环断裂。基于2023-2026年每半年一轮的产业数据横向对比，提出”Token分流”架构方案和”结果导向”管理范式作为飞轮修复路径。

摘要　2026年AI产业呈现三层结构性矛盾：硬件层获取超额利润（NVIDIA全年利润$1200亿+、SK海力士72%营业利润率），AI模型公司严重亏损（OpenAI预计2026年亏损$140亿），消费者端产出无法变现（仅29%企业报告显著ROI，80%项目未交付预期价值）。与此同时，Token的真实成本因分词器膨胀（+12-27%）和前沿-廉价模型50倍价差而隐性上涨，而AI产出的市场价值因同质化而趋零——构成”双向挤压”。企业端出现的”Tokenmaxxing”现象（Meta 30天烧60万亿Token、Uber四个月耗尽$34亿AI预算）暴露了过程导向管理的制度性缺陷。本文提出”Token分流”方案——C端社交需求本地化（SLM/Edge AI）、B端专业需求云端化——作为产业飞轮修复路径，并分析其技术约束与政治经济学阻力。

方法论说明　本文基于人机协作对话生成：研究者提出分析框架和核心洞察，AI（Claude Opus 4.6）负责实时数据检索与验证。所有数据源均为2025-2026年公开报告、企业财报或行业调查。涉及Anthropic的分析可能存在信息偏差，读者应独立验证。本文为独立思想论文，未经同行评审。

I两强格局与硬件层的真金白银

截至2026年4月，AI产业竞争已收敛为双寡头格局。Anthropic年化收入突破$300亿，OpenAI约$240-250亿。Anthropic从2月的$140亿到4月的$300亿，8周翻倍——Meritech Capital分析师称审查200余家上市软件公司IPO轨迹从未见此增速。关键结构差异在于客户构成：Anthropic 80%收入来自企业客户，OpenAI约70%来自ChatGPT消费者订阅。企业收入留存率高、扩展经济性强、流失率低。

然而，真正获取”真金白银”的不是AI模型公司，而是硬件供应链。

NVIDIA FY2026 全年收入

$2,159亿

NVIDIA 全年利润 / 毛利率

$1,200亿+ / 71.1%

SK海力士 Q1 营业利润率

72%

SK海力士 Q1 同比利润增幅

+405.5%

Micron Q2 毛利率

74.9%

四大厂 2026 AI 基建支出

$7,000亿

SK海力士Q1收入52.58万亿韩元（$386亿），营业利润37.61万亿韩元（$276亿）。金融界预测Q2营业利润将超60万亿韩元，Q3超70万亿。HBM市场预计从2025年的$350亿增长至2026年的$580亿，2028年可能突破$1000亿。

历史类比：正如2000年互联网泡沫催生了光纤基础设施的大规模铺设——后来成为YouTube、Netflix、云计算的地基——本轮AI投资周期无论AI公司如何洗牌，留下的能源基建、电网扩容、HBM产能、先进制程产线、数据中心都是人类社会的长期资产。2000年泡沫期间Tech CapEx占GDP 6.4%，2026年预计达到7.2%——规模更大，但基础设施遗产也将更持久。硬件层的”真金白银”是泡沫的正面遗产。

II三层漏斗断裂：危机在消费者端

产业价值链可以拆解为三层漏斗，断裂点从下到上逐层传导：

图1 — AI产业价值链三层漏斗模型

第一层
硬件投资→硬件利润
✅ 畅通

→

第二层
AI公司烧硬件→订阅收入
⚠️ 严重倒挂

→

第三层
用户消耗Token→可变现产出
❌ 断裂

第一层已经验证。第二层靠融资续命——OpenAI完成$1220亿融资、Anthropic $300亿。真正的生死关卡在第三层：用户消耗Token后，产出的到底是”数字产品”还是”数字垃圾”？

2.1 单位经济学的结构性倒挂

整个AI行业年烧钱约$4000亿，年收入仅$500-600亿。微观层面：GitHub Copilot每用户每月亏损超$20，重度用户计算成本达$80但订阅费$10；Anthropic用户每$1订阅收入消耗约$8计算资源。OpenAI预计2026年亏损$140亿，不预计2029年前实现正向自由现金流。Anthropic预计2027年实现正向现金流——但训练成本到2030年仍需约$300亿（OpenAI同期约$1250亿）。

美国消费者AI服务年支出约$120亿，对比$5270亿基建投入——占比2.3%。全球AI用户超13.5亿，但绝大多数为免费用户。ChatGPT 9亿周活跃用户中仅约5%转化为付费。

2.2 六轮周期数据横向对比

周期	基建支出	企业AI收入	采用率	ROI成功	放弃率	判定
H1 2023	~$800亿	~$150亿	55%	~30%	~17%	探索期
H2 2023	~$1,100亿	~$220亿	60%	~28%	~20%	跟风期
H1 2024	~$1,600亿	~$350亿	65%	~25%	~25%	分化期
H2 2024	~$2,400亿	~$500亿	72%	~22%	~30%	幻灭期
H1 2025	~$3,500亿	~$700亿	78%	~20%	~35%	清算期
H2 2025	~$4,650亿	~$850亿	83%	~21%	~42%	危机期
H1 2026	~$5,270亿	~$1,000亿	88%	~29%	~40%	摊牌期

关键发现：采用率从55%单调递增至88%，ROI成功率从30%跌至20%谷底后仅微弱反弹至29%。项目放弃率从17%飙升至42%（S&P Global 2025）。88%的AI试点从未进入生产环境（CIO Research）。80%的AI项目三年来持续无法交付预期价值（RAND Corporation）。采用率与ROI的负相关是整个AI经济最危险的信号。

2.3 C端留存数据的崩塌证据

ChatGPT Plus的6个月付费留存率为71%（行业最高），Claude Pro 62%，Gemini Advanced 60%，Character.AI仅47%。看似尚可，但AI原生SaaS的中位净收入留存率（NRR）仅27-40%——传统B2B SaaS中位NRR为82%，AI产品连一半都到不了。41%的消费者正经历订阅疲劳，44%的取消发生在首90天内。

最致命的信号：OpenAI自己预测ChatGPT Plus（$20/月）用户将从2025年的4400万暴跌80%至2026年的900万，转而用$8的Go版冲刺1.12亿用户。Plus增长率已从2024年的~3倍/年放缓至2026年的~1.15-1.2倍。ChartMogul将其称为”AI游客效应”——用户出于好奇注册、短暂试用然后流失。

III价值光谱：定义”数字垃圾”

“数字垃圾”是本文的核心概念，但不应将其理解为一个二元判定。Token产出的价值实际上分布在一个四层光谱上：

层级	场景	Token变现路径	当前占比估计
L0 · 零价值消遣	闲聊、AI陪伴、娱乐生成、好奇试用	无——用户获得的是消遣而非资产	~50-60%
L1 · 间接效率	邮件润色、会议纪要、信息摘要、翻译	节省时间，但极难量化为财务回报	~25-30%
L2 · 直接替代	代码生成、文档自动化、客服替代、数据分析	可量化的人力成本节约或产出	~10-15%
L3 · 创造新价值	AI Agent自主完成新业务流程、产品创新	新增收入——飞轮真正的驱动力	~1-3%

当前产业的结构性问题是：大量Token消耗在L0和L1层——这些层级要么无法变现，要么变现路径过长过弱。仅有10-15%进入L2的直接替代层，不到3%进入L3的价值创造层。Deloitte 2026报告确认：66%的企业报告了效率和生产力提升（L1-L2），但仅20%实现了收入增长（L3），74%只是”希望”未来能通过AI增长收入。

HBR 2026年4月的文章精确命名了这一陷阱：”微生产力陷阱”——任务层面的AI效率提升无法转化为企业层面的价值。创作者经济的崩塌是C端的镜像案例：ChatGPT免费版10分钟就能生成一门$297课程的全部内容，导致课程完成率跌破5%，退款率攀升至22%。当AI产出本身失去稀缺性，L0-L1层的Token消耗在经济学上就是”数字垃圾”——不是因为产出没有用，而是因为它无法支撑订阅付费的持续性。

IVToken成本的双向挤压

如果消费者端的价值已在趋零，Token成本的走向就成了飞轮生死的变量。本文的发现是：Token的真实成本在上涨——尽管标价看起来没变。

4.1 三层隐性涨价机制

第一层：分词器换代膨胀。Claude Opus 4.7使用新分词器后，同样的文本消耗多达35%以上Token。价目表不变，但实际成本上升12-27%。关键细节：在中等长度提示（1-2.5万Token）上，缓存仅吸收9%的额外Token，涨价几乎完全传递到用户端；只有超过12.8万Token的长提示才能通过缓存吸收93%。绝大多数普通消费者的使用场景恰恰是中短提示。

第二层：前沿-廉价价差极速扩大。2026年5月：Gemini Flash-Lite每百万输入Token仅$0.10，前沿模型$5.00——50倍差距。过去三年小模型价格下降99.7%，但前沿模型定价稳固。消费者面对残酷选择：用便宜模型产出质量低、变现更难（直接生产L0层”数字垃圾”）；用前沿模型成本高到永远无法收回。

第三层：订阅制向消耗制转型。Cursor 2025年6月用积分池取代固定请求配额，Pro套餐$20/月仅覆盖约225次Claude Sonnet请求。一个开发者一周产生$350超额。一位开发者8个月日常使用消耗100亿Token，按API价($3/$15百万Token)超$15,000。固定订阅的”缓冲垫”正在被抽走。

双向挤压模型：Token真实成本上涨（分词器膨胀 + 前沿定价 + 消耗制转型）→ 每次AI产出的用户成本增加 → 但AI产出的市场价值趋零（L0-L1层，所有人都能生成类似内容）→ 成本上升 + 产出贬值 = 消费者端剪刀差二次出现 → 用户理性选择：降级或退出。OpenAI预测Plus暴跌80%至900万就是消费者用脚投票的结果。

VTokenmaxxing：过程导向管理的制度性灾难

在消费者端飞轮断裂的同时，企业端出现了一个更荒诞的现象——Tokenmaxxing：将Token消耗量作为生产力代理指标，消耗越多被认为越高产。

5.1 全行业案例矩阵

Meta（”Claudeonomics”事件）：一名Meta员工在内部网创建”Claudeonomics”排行榜，追踪85000+员工的Token消耗，显示前250名超级用户。30天内全公司烧掉60万亿Token，按Claude Opus公开价估算约$9亿。排名第一的用户30天消耗2810亿Token——平均每天93.6亿——仅此一人成本约$140万。排行榜设游戏化头衔：”Token Legend””Session Immortal””Cache Wizard””Model Connoisseur”。部分员工让AI Agent空跑数小时只为刷榜。Zuckerberg和CTO Bosworth都没进前250名。排行榜在新闻泄露48小时后被关闭，理由是”数据外泄”。Meta已将”AI驱动的影响力”纳入2026年绩效考核的核心指标。

Uber（预算耗尽事件）：2025年12月开放Claude Code，采用率从32%飙升至2026年3月的84%（5000名工程师）。95%的工程师每月使用AI工具，70%的提交代码由AI生成，每周发布1800个AI编写的代码变更。AI相关成本自2024年以来增长约6倍。内部排行榜按AI使用量排名。CTO Praveen Neppalli Naga承认：$34亿研发预算在四个月内耗尽，”我要回到绘图板重新规划”。单个工程师月度API成本在$500-$2000之间。

其他企业：Disney流媒体技术部门部署了Token追踪看板，一名员工9个工作日内调用Claude 46万次——每天51000次——只有自主Agent在后台空转才可能做到。Visa在3月消耗约1.9万亿Token，是2月的两倍。Microsoft自2026年1月起维护类似的内部Token看板，工程师承认故意膨胀使用量。

5.2 Jensen Huang的推波助澜

NVIDIA CEO黄仁勋在GTC 2026的All-In Podcast上提出：一个年薪$50万的工程师，Token年消耗应不低于$25万，否则他会”deeply alarmed”（深感惊恐）。如果只花$5000，他会”go ape”。被问到NVIDIA 42000名员工是否在花$20亿Token预算时，他说”我们正在努力这样做”。他将不使用AI比作”芯片设计师说我要用纸和笔”。Token正在成为硅谷的”第四薪酬组件”——与基本工资、奖金和股权并列。

利益冲突审视：黄仁勋是全球最大GPU供应商的CEO。他鼓励每个工程师烧掉$25万Token，直接转化为对GPU算力的需求，最终流入NVIDIA的收入。Tokenmaxxing叙事的最大受益者是卖铲子的人——这与19世纪淘金热中卖锹镐的Levi Strauss毫无区别。当卖铲子的人告诉你”挖得越多越好”时，你需要问的是：矿里到底有没有金子？

5.3 高级vs低级程序员的10倍Token差异

精确提示词的高级开发者用8000 Token获得生产级方案；粘贴800行混乱代码说”修好这个”的低级开发者烧掉80000 Token——产出质量反而更差。根因：低级程序员缺乏系统性经验和逻辑，输入的提示词大量关系混乱，AI必须消耗大量分析、验证和试错Token。切换到精确提示词的开发者报告每个任务减少30-50%的Token消耗。

5.4 22000名开发者的反证数据

Faros.ai分析了22000名开发者、4000个团队两年遥测数据：

任务完成率提升

+34%

史诗完成率提升

+66%

代码任务完成提升

+210%

每开发者Bug增幅

+54%

代码审查中位时间

+5x

85%企业AI成本误估

>10%

速度提升了，质量崩了。Tokenmaxxing是典型的Goodhart’s Law：”当一个度量变成目标时，它就不再是一个好度量。”Salesforce推出AWU（Agentic Work Units）反击，衡量产出和影响而非Token消耗。Appian CEO称Tokenmaxxing为”苏联按重量评价吊灯”。Uber的教训最终验证了根因：设计排行榜推动采用的团队和管理AI预算的团队不是同一批人——这一组织断裂比任何定价模型都更致命。

29%的员工承认故意破坏公司AI战略（Z世代达44%）。76%的高管将员工抵制视为严重威胁。但75%的高管同时承认公司AI战略”更多是做做样子”。当高管在没有真正战略的情况下强推AI使用指令时，抵制是合乎逻辑的反应。

VI解决方案：Token分流架构

基于以上分析，本文提出Token分流（Token Diversion）作为产业结构修复的核心方案——按需求的价值属性重构Token的供给结构，实现”油水分离”。

图2 — 三层Token供给架构

第一层 · C端社交/日常层
本地SLM（1-3B参数）→ Token成本≈零
聊天、陪伴、轻量问答、内容消费（L0-L1层）
不需要CoT深度推理，不需要前沿模型能力

→

第二层 · 混合路由层
智能判断请求走本地还是云端
简单查询留本地省电省钱 → 重度推理上云

→

第三层 · B端专业层
云端前沿模型 → 高价值Token（$5-25/M）
Agent编程、长文档分析、企业工作流自动化（L2-L3层）
产出可复用软件、可部署系统、可量化成本节约

6.1 技术可行性与物理约束

能力端：亚十亿参数模型现在能处理许多实用任务。Llama 3.2（1B/3B）、Gemma 3（低至270M）、Phi-4 mini（3.8B）、Qwen2.5（0.5B-1.5B）均瞄准高效本地部署。Meta的ExecuTorch运行时仅50KB，支持12+硬件后端（Apple、高通、Arm、联发科），HuggingFace上超80%主流Edge LLM开箱即用，已在Instagram/WhatsApp/Messenger服务数十亿用户。Google刚推出LiteRT-LM，专为Edge设备部署LLM的生产级框架。42%以上开发者已在本地运行LLM。4bit量化实现4倍内存压缩。test-time compute让Llama 3.2 1B在搜索策略辅助下可超越8B模型。Gartner预测到2027年，组织使用小型任务专用模型的频率将是通用LLM的3倍。

约束端（V1缺失）：移动设备内存带宽50-90 GB/s，数据中心GPU为2-3 TB/s——30-50倍差距。LLM推理是内存带宽受限的：每生成一个Token都需要流式加载全部模型权重。设备可用RAM通常不到4GB（需与操作系统和其他服务共存），限制最大模型规模。MoE（混合专家）架构在边缘仍困难：虽然计算是稀疏的，但所有专家仍需加载到内存。这意味着本地SLM只能覆盖L0-L1场景和部分简单L2场景，无法替代前沿模型的深度推理——恰恰验证了分流的必要性：让本地处理其力所能及的部分，将超出能力的请求路由到云端。

6.2 飞轮修复的三个断裂点

断裂点一（C端付费崩塌）：社交需求分流到本地后，消费者不再需$20/月订阅获得日常聊天。AI原生SaaS NRR仅27-40%的留存地狱消失——因为这些用户本就不该在云端。

断裂点二（单位经济倒挂）：每$1订阅消耗$8计算的低价值用户被分流到本地。云端仅剩高价值B端客户——ARPU高、需求明确、产出可变现。AI公司的单位经济模型瞬间改善。

断裂点三（训练数据飞轮）：B端用户的交互数据质量远高于C端闲聊。油水分离后，云端模型获得更纯净、更专业化的训练信号，模型进化方向更聚焦——正向飞轮才可能转起来。

6.3 政治经济学阻力（V1缺失）

Token分流在产业效率上是最优解，但面对三重阻力：

估值叙事冲突：ChatGPT的9亿周活跃用户是OpenAI $8520亿估值的核心故事。如果承认大部分是”AI游客”并主动分流到本地，用户数暴跌，估值逻辑崩塌。每家AI公司都有动机把所有用户留在云端，即使服务他们是亏钱的。

硬件供应商反向激励：黄仁勋的$25万/人Token预算论就是反例——GPU供应商的利益在于最大化云端Token消耗，而非最优化Token分配。当卖铲子的人主导叙事时，分流方案天然被压制。

开源生态的双刃剑：Llama、Qwen、DeepSeek等开源模型是C端本地化的技术基础。但Meta发布Llama的战略动机是削弱竞争对手的API收入——如果本地部署真的大规模替代云端，反而验证了Meta的战略而削弱了Anthropic和OpenAI的商业模型。分流方案的受益者和推动者之间存在利益错配。

谁有动机率先执行？Apple是天然候选——其商业模型基于设备销售而非云端Token，on-device AI直接增强硬件卖点。Apple Intelligence已在这条路线上。反过来，纯API公司（Anthropic、OpenAI）需要极大的战略勇气才能主动分流——这等于承认自己的部分收入是”不健康的”。

VII反面论证与回应

一篇诚实的思想论文必须先呈现最强的反方论据，再解释为什么自身框架更有解释力。

7.1 乐观派的三个核心论据

论据一：”领先企业已经证明了ROI。”BCG数据显示”Visionary players”实现了1.7倍收入增长、3.6倍三年TSR。从试点到生产规模的企业平均ROI为1.7倍，供应链和财务领域成本节约26-31%。IBM实现$35亿AI驱动成本节约。编程助手三年ROI提升376%，回报期不到6个月。

论据二：”AI公司有真实收入。”JPMorgan认为AI不符合经典泡沫标准。Jerome Powell区分AI与.com时代——当前AI公司有真实收入和真实客户。Anthropic $300亿ARR、OpenAI $240亿——这是.com时代无法比拟的。

论据三：”早期都是这样——需要耐心。”企业技术的标准回报期是7-12个月，AI需要2-4年。这是新兴技术采用的正常节奏，不应过早悲观。

7.2 本文的回应

对论据一：本文完全认同——但这恰恰证明了本文核心论点。这些成功案例全部集中在高度结构化的B端场景：金融风控、供应链优化、编程辅助、文档自动化。它们无一例外属于价值光谱的L2-L3层。没有任何案例证明L0-L1层的Token消耗能产生ROI。这正是Token分流方案的逻辑基础——将云端资源集中到已被验证的高价值场景上，而非撒胡椒面式地服务所有用户。

对论据二：AI公司确实有真实收入。但OpenAI 70%收入来自消费者订阅，而该群体正在以80%的速度流失。Anthropic 80%来自企业客户——这恰恰是为什么Anthropic在超越OpenAI：其收入结构天然更接近Token分流后的理想态。真实收入不等于可持续收入。

对论据三：“需要耐心”的前提是飞轮在慢慢转。但当53%的投资者预期6个月内看到回报、98%的董事会要求证明ROI、42%的企业已经在放弃AI项目时——市场给出的耐心窗口正在关闭。AI不会消失，但为AI买单的人的耐心是有限的。问题不是”AI能不能最终产生价值”（它能），而是”在耐心耗尽之前，飞轮能不能转起来”。

VIII结论：从过程到结果的范式转换

图3 — 完整因果链条闭环

硬件公司获取超额利润 → 供给端验证通过（第I章）

↓

AI公司营收与成本严重倒挂 → 中间层危机（第II章）

↓

消费者产出集中在L0-L1″数字垃圾”层 → 需求端断裂（第III章）

↓

Token真实成本上涨 + AI产出价值趋零 → 双向挤压（第IV章）

↓

Tokenmaxxing放大过程导向管理Bug → 制度性加速器（第V章）

↓

Token分流 + 结果导向范式 → 飞轮修复路径（第VI-VII章）

当前AI产业的根本矛盾可精确表述为：当C端用户无法用Token产出差异化的可变现产品、B端企业无法将AI转化为可量化的财务回报时，整个产业链的投入就失去了正反馈的锚点。没有锚点，飞轮就是在空转烧油。

空转能持续多久取决于两个变量：一是硬件投资周期的惯性——已签约GPU订单和数据中心建设不会立刻停；二是资本市场的耐心——53%的投资者预期6个月内见回报，98%的董事会要求证明ROI。当这两条曲线的交叉点到来时——硬件订单惯性减弱而投资者耐心耗尽——产业将面临真正的修正。

本文提出的Token分流方案和结果导向范式转换，虽然在产业效率上是最优解，但在资本市场激励结构下是最难执行的——它要求公司为长期健康放弃短期估值叙事。已被验证的29%的成功企业共享四个特征：AI与收入成果直接挂钩、治理先于扩展、业务团队拥有AI工作流、整件事当作组织再设计。这四个特征的共同本质就是”结果导向”。

最终判断：能做这个决策的公司——主动油水分离、把价值度量从”过程”切换到”结果”、让云端模型只服务于可度量结果的专业需求——才是这一轮AI周期中最后活下来的那一个。AI技术本身从来不是问题。飞轮的齿轮比才是问题。正确的AI经济学，就是找到正确的齿轮比。

数据来源与引用

[1] Nvidia FY2026 Financial Results, SEC Form 8-K, Feb 25, 2026

[2] SK Hynix Q1 FY2026 Earnings, Seoul Economic Daily / CNBC, Apr 23, 2026

[3] Micron Q2 FY2026 Financial Results, QuantFlowLab, Mar 2026

[4] Anthropic $30B ARR, SaaStr / TrendingTopics.eu / TokenMix, Apr 7, 2026

[5] OpenAI Revenue & Plus Projection, The Information, Apr 28, 2026

[6] Faros.ai “Tokenmaxxing” Report, 22,000 developers / 4,000 teams, Apr 2026

[7] Meta “Claudeonomics” Leaderboard, Fortune / The Information / Gizmodo, Apr 8-9, 2026

[8] Uber AI Budget Overrun, The Information / AI Magazine / Yahoo Finance, Apr 15, 2026

[9] Jensen Huang Token Budget Statement, All-In Podcast @ GTC 2026, Mar 20, 2026

[10] Salesforce AWU Metric, Axios, Apr 15, 2026

[11] Harvard Business Review, “AI Experimentation to AI Transformation,” Apr 30, 2026

[12] Writer 2026 Enterprise AI Adoption Survey, 1,200 C-suite + 1,200 employees, May 2026

[13] Deloitte State of AI in the Enterprise, 3,235 leaders, 2024-2026

[14] MIT NANDA Initiative, “The GenAI Divide,” Jul 2025

[15] S&P Global Market Intelligence, AI Project Abandonment Data, 2025

[16] RAND Corporation, Enterprise AI Initiative Analysis, 2024

[17] ChartMogul SaaS Retention Report, ~200 AI-native companies, 2025

[18] Earnest Analytics / WSJ, AI Subscription Retention Rates, Jan 2025

[19] Man Group, “The AI Bubble: Hidden Risks and Opportunities,” Apr 7, 2026

[20] Edge AI: Vikas Chandra (Meta AI Research), “On-Device LLMs 2026,” Jan 2026

[21] Google LiteRT-LM Framework Launch, AIToolly, Apr 8, 2026

[22] Dell Edge AI Predictions 2026, Jan 7, 2026

[23] Gartner SLM Prediction (3x by 2027), via Dell report

[24] Token Efficiency Analysis, Medium/@Sakar_Dhana, Feb 20, 2026

[25] AI Cost Increases 2026, FairMind / Pillitteri Analysis, May 2026

[26] DevTk.AI API Pricing Comparison, updated May 6, 2026

[27] BCG “How Four Companies Use AI for Cost Transformation,” 2025-2026

[28] Counterpoint Research, Global AI Consumer Spends Forecast, Nov 2025

[29] Disney / Visa Tokenmaxxing, AI2Work / 36Kr / Press.Farm, Apr 2026

[30] Main Management, “AI/Tech Bubble Buildup,” Apr 2026 (CapEx/GDP comparison)

[31] Morph LLM, “The Real Cost of AI Coding in 2026,” Apr 2, 2026

[32] Xenoss, “10 AI Use Cases That Drive ROI,” Feb 9, 2026 (376% coding assistant ROI)