博客

2026OKX合约交易新手完整入门指南｜永续/交割合约、杠杆保证金、实操步骤详解

2026年OKX合约交易规则持续优化，梯度杠杆、资金费率、交割机制全面更新，很多新手因不懂基础规则、选错合约类型和杠杆倍数，频繁出现爆仓、亏损问题。本文贴合最新平台机制，从…
阅读更多

前言

合约交易是加密市场中最主流的衍生品交易方式，凭借双向交易、杠杆灵活、资金利用率高的特点，成为多数交易者的核心操作品类。2026年OKX持续迭代合约交易体系，优化梯度杠杆规则、升级保证金风控机制、完善交割清算逻辑，合约生态的稳定性和专业性稳居行业头部。

但对新手而言，合约交易和现货交易逻辑完全不同，没有弄懂永续与交割的区别、不会区分保证金模式、盲目使用高杠杆，是新手亏损、爆仓的核心原因。本文不堆砌理论，全部以2026年OKX最新实操规则为基准，从基础概念、品类差异、参数选择到完整交易步骤，一站式讲透合约入门核心内容，新手可直接对照实操。

一、OKX两大合约品类：永续合约VS交割合约（核心区别）

OKX目前主流合约分为永续合约和交割合约两大类，二者交易逻辑、持仓规则、盈亏机制差异极大，适配不同交易风格的用户，也是新手首先要分清的基础知识点。

1. 永续合约（新手首选）

永续合约是2026年平台交易量最高、用户适配性最强的合约品类，最大特点是无固定到期交割日、无强制清算时间。在保证金充足、未触发强平的前提下，用户可以无限持仓，自由控制持仓周期，完美适配波段交易、中长期趋势交易用户。

其核心定价机制为8小时资金费率调节，每天0点、8点、16点结算一次，通过多空资金流转让合约价格持续锚定现货指数价格，大幅减少插针、脱离行情的情况。简单来说，市场多头强势时，多单持有者支付费率给空单；空头强势时，空单支付费率给多单，平衡市场供需。

2. 交割合约（专业用户适配）

交割合约带有固定到期周期，2026年OKX保留四类标准周期：当周、次周、当季、次季合约，所有仓位到期后，系统会按照最后一小时指数均价自动差额交割平仓，无法长期持有。

交割合约无资金费率机制，价格依靠到期收敛现货价格，短期价差波动会大于永续合约。优势是无长期持仓成本，适合短期波段、事件性交易，缺点是存在到期强制交割风险，新手极易因忘记换仓、未及时平仓导致被动结算亏损，更适合有经验的专业交易者。

3. 新手选型总结

追求灵活持仓、低风险、适配日常交易，优先选择永续合约；有明确短期周期交易计划、规避资金费率磨损，可小仓位尝试交割合约。

二、核心参数详解：杠杆倍数与保证金模式

合约交易的风险和收益，完全由杠杆倍数和保证金模式决定，2026年OKX升级梯度杠杆规则，根据持仓量级动态限制最高杠杆，杜绝超大杠杆带来的极端爆仓风险，规则更规范、风控更严格。

1. 杠杆倍数选择逻辑

杠杆的本质是资金借用工具，作用是放大资金利用率和盈亏幅度。OKX主流币种支持1-125x灵活杠杆调节，新手核心铁律：杠杆越低、风险越小。

1-10x低杠杆适合新手练手、长线趋势持仓，爆仓风险极低，容错率高；20-50x中杠杆适合有交易经验的短线用户，兼顾收益与风险；50x以上高杠杆仅适合专业量化、超短线交易者，行情小幅波动即可触发爆仓，新手坚决规避。

2026年平台新增杠杆梯度保护机制，持仓量越大，系统自动限制最高杠杆，从机制上杜绝大户高杠杆重仓风险，引导用户理性交易。

2. 两大保证金模式实操区别

OKX提供逐仓、全仓两种保证金模式，新手务必按需选择，避免不必要的风险：

逐仓模式（新手推荐）：每一个交易对仓位独立占用保证金，单一仓位亏损不会波及账户其他资金，风险完全隔离，亏损上限可控，适合新手分仓试错、小额交易。

全仓模式（老手专用）：动用账户全部可用余额作为仓位保证金，盈利收益更高，但风险完全联动，一旦行情反向波动，全账户资金可能被强平，适合风控能力极强的职业交易者。

三、2026最新OKX合约开通+完整交易实操步骤

OKX合约交易无需复杂权限申请，完成基础实名认证即可一键开通，全程5分钟搞定，实操步骤如下：

第一步：账号准备。登录OKX官方APP/网页端，完成KYC实名认证，开启2FA安全验证，确保账号无风控限制。

第二步：开通合约权限。进入首页【交易】板块，点击【合约交易】，系统自动弹出开通协议，阅读并确认后，即可激活合约交易功能，无需额外审核。

第三步：转入保证金。将账户USDT、主流币种划转至【合约账户】，所有合约交易资金独立托管，和现货账户资金隔离，方便风控管理。

第四步：设置交易参数。选择合约类型（永续优先）、调节杠杆倍数、选择逐仓/全仓模式，新手固定选择低杠杆+逐仓模式。

第五步：开仓交易。看涨选择【做多】，看跌选择【做空】，输入开仓金额，选择市价或限价委托。市价适合即时成交，限价适合精准控制开仓成本。

第六步：风控止盈止损。开仓后务必第一时间设置止盈、止损点位，锁定收益、控制亏损，杜绝裸仓交易。

第七步：平仓离场。达到预期收益或止损点位后，手动平仓了结仓位，完成一次完整合约交易。

四、新手必避的合约高频误区（2026实操总结）

第一，杜绝高杠杆重仓。多数新手亏损并非方向判断错误，而是杠杆过高、仓位过重，小幅震荡即可触发爆仓。新手建议单仓仓位不超过账户总资金的10%。

第二，重视资金费率损耗。长期持仓永续合约，需关注8小时资金费率结算，高频正向费率会持续磨损持仓利润，不适合超长期无脑持有。

第三，杜绝交割合约忘换仓。交易交割合约需牢记到期时间，临近交割日及时平仓或切换周期，避免被动交割造成不必要亏损。

第四，禁止裸仓交易。不带止损、逆势加仓、扛单是合约交易三大致命陋习，也是新手快速亏损的核心原因。

写在最后

2026年OKX合约交易规则更规范、风控机制更完善，但合约本身属于高风险衍生品，收益与风险始终对等。新手入门的核心不是急于盈利，而是吃透永续与交割的机制差异、熟练掌握杠杆和保证金的风控逻辑、养成带止盈止损的交易习惯。

合约交易没有捷径，只有稳健的规则和严格的风控。从小杠杆、小仓位、永续合约练手，积累盘感与交易认知，才能逐步建立属于自己的合约交易体系。

风险提示：本文仅为OKX合约交易实操教学科普，不构成任何交易建议。虚拟货币合约交易波动极大、杠杆风险极高，不受法律保护，用户请理性交易、严控仓位、自行承担交易风险。

2026年5月25日
Claude Mythos 解禁：Anthropic 如何用安全AI“降维打击”GPT-5.5

2026年5月16日，Anthropic正式解禁业内号称“最强攻防AI”的Claude Mythos模型。这款主打防御性网络安全的垂直大模型，在卡内基梅隆大学权威实测中，对…
阅读更多

2026年，全球AI军备竞赛迎来关键拐点。行业持续数年的“通用参数内卷”正式落幕，取而代之的是垂直场景深耕、专业能力制胜的全新竞争格局。通用大模型的普适性红利见顶，聚焦细分领域、解决硬核专业问题的垂直大模型，正在成为新一轮技术突围的核心赛道。

5月16日，行业分水岭事件正式落地。在OpenAI官宣上市前最大规模组织架构重组、全力整合通用生态的同一天，Anthropic悄然在Google Cloud Console移除Claude Mythos的“预览版”标签，这款曾因“能力过强、风险极高”被长期封印的顶级安全AI模型，正式全面开放商业化落地。

这场无声的发布，彻底改写了AI安全赛道的竞争格局，也揭开了垂直大模型对通用大模型的范式级降维打击。

一、被长期封印的“顶级攻防AI”：解禁背后的安全底气

Claude Mythos的诞生与解禁，堪称近年AI行业最具戏剧性的技术故事。

2026年4月7日，Anthropic正式推出首款专为防御性网络安全量身打造的旗舰垂直大模型，主打漏洞挖掘、风险研判、攻防复现、安全研判等硬核能力。不同于通用大模型的多元场景适配，Mythos从训练底层就聚焦网络安全攻防，专项攻克零日漏洞挖掘、高危漏洞复现、恶意代码分析等行业难题。

正因攻防能力过于顶尖，上线初期Anthropic出于风险管控考量，将其严格锁定为Preview预览状态，对外限制开放。行业普遍担忧：若这款超强攻防AI被滥用，或将被用于批量扫描政企机构漏洞、批量生成攻击脚本，引发全域网络安全灾难。

仅仅一个多月后，Anthropic果断解除封印，背后是其完善的安全管控体系落地。据内部披露，Mythos在正式商用前，完成了数月全方位安全加固迭代，搭建起一套闭环风控体系：包含AI输出内容实时风控、高危操作二次人工核验、敏感行为动态拦截、主流安全工具深度联动等多重防护机制。

此次解禁绝非简单的权限放开，而是Anthropic在超强能力与可控风险之间找到精准平衡，标志着AI攻防技术正式进入可商用、可监管、可落地的规模化阶段。

二、权威实测数据：对GPT-5.5的断层式碾压

真正让Claude Mythos封神、震动整个AI与网安行业的，是卡内基梅隆大学（CMU）发布的ExploitBench权威攻防测试报告。报告基于41项真实浏览器高危漏洞开展全真场景测试，直面对标当前最强通用大模型GPT-5.5，交出了碾压级成绩单。

核心实测数据全面对比：

1、专家人工引导模式：Mythos平均分9.90/16，GPT-5.5仅5.51/16，性能差距近一倍；

2、最高T1级高危漏洞攻克量：Mythos成功破解21个，GPT-5.5仅完成2个，存在数量级差距；

3、全自主无人干预模式：Mythos平均分9.55/16，GPT-5.5仅4.30/16，自主作战能力遥遥领先；

4、模式切换性能衰减：Mythos从人工引导切换全自主后，分数衰减不足0.4分，性能极度稳定；GPT-5.5衰减超1.2分，自主适配能力短板突出。

整套测试数据直观印证：通用大模型在专业攻防场景下存在天然短板，而Claude Mythos不仅在有人工辅助的场景下战力拉满，更具备极强的全链路自主攻防能力，稳定性、精准度、深度全面碾压GPT-5.5。

其中一个标杆级案例，更凸显其颠覆性价值：Mythos成功完整复现了CVE-2024-0519高危漏洞。该漏洞复杂度极高，被全球顶尖安全研究员搁置一年之久、始终无法完成完整复现。而Mythos仅通过10轮迭代测试、129次LLM调用、154次工具调用，便独立完成根因分析、异常行为触发、T3沙箱原语获取的全流程闭环操作。

随后英国AI安全研究所（AISI）的独立复测，再次验证了Mythos的顶尖实力，同时点出其核心短板：极致能力的背后，是运行成本为GPT-5.5的12倍。在120轮以上的长效测试中，Mythos累计算力消耗达36428美元，而GPT-5.5仅需3075美元，二者性价比差异显著。

三、行业博弈新格局：OpenAI规模化内卷，Anthropic垂直化破局

将两款模型的迭代节奏，置入2026年AI行业的核心竞争格局中，能清晰看到两大头部厂商截然不同的战略路径与未来胜负手。

在Anthropic解禁Mythos的同一天，OpenAI官宣公司成立以来最大规模组织架构重组：整合ChatGPT、Codex、开发者API三大核心产品线，成立统一的“核心产品与平台团队”，由联合创始人Greg Brockman全权掌舵产品战略。同时披露关键数据：ChatGPT周活跃用户突破9亿，并加速推进“Super App”战略，整合对话、编程、浏览器三大能力，打造可自主执行复杂数字任务的全能桌面应用。

OpenAI的核心思路清晰：做大、做全、做规模，依托通用能力、海量用户、全场景覆盖，夯实生态壁垒，为IPO铺路。

反观Anthropic，始终坚持差异化战略：做专、做深、做极致。放弃通用赛道的同质化内卷，精准切入网络安全这一高壁垒、高价值垂直赛道，用专项技术深耕形成碾压式优势。

两种战略无绝对优劣，但Claude Mythos的落地，已经证明了一个全新行业事实：垂直专精大模型，可在专业场景下对顶级通用大模型形成降维打击。这并非简单的参数与算力差距，而是训练范式、知识沉淀、场景适配的全方位代差，是AI行业从“万能通用”走向“场景专精”的核心转折。

四、行业范式转移：垂直化是AI下一轮十年的核心主线

Claude Mythos的出圈并非偶然，而是AI产业迭代的必然结果。全球大模型竞赛，正在彻底告别持续数年的“参数越大越强”的粗放式增长逻辑。

过去的AI竞争，聚焦参数规模、上下文长度、多模态通用性，各大厂商疯狂堆算力、扩参数，打造“全能型通用模型”。但行业痛点日益凸显：通用模型看似无所不能，却在金融、安全、医疗、工业等专业细分场景中，深度不足、精度不够、落地困难，难以解决行业硬核问题。

而Claude Mythos的核心优势，源于垂直领域的先天深耕。训练阶段深度接入全网漏洞数据库、海量恶意代码样本、历年攻防安全报告、权威安全赛事数据，完成网络安全领域的专属知识沉淀与专项能力迭代。这种垂直领域的深度积累，是通用大模型无法通过简单微调弥补的核心壁垒。

中信证券2026年中期AI行业研报明确指出：5-6月将开启新一轮大模型密集迭代窗口，但迭代方向已彻底切换，从盲目参数膨胀，转向长程智能体、场景垂直化、精准落地化的高质量竞争。AI产业正式告别粗放增长，进入精细化、专业化、场景化的全新发展周期。

五、成本与价值的双向博弈：高端定位的市场取舍

高能力必然对应高成本，Claude Mythos的商用落地，也带来了行业核心的价值取舍难题。

如AISI测试所示，Mythos的算力运行成本是GPT-5.5的12倍，长效复杂场景下的使用成本差距更为悬殊。这也决定了它的市场定位极具针对性，呈现明显的分层适配特征。

对政企机构、专业安全厂商、大型企业安全运营中心而言，Mythos的高成本完全可控。一次高危零日漏洞的提前挖掘、一次重大网络攻击的提前拦截，可挽回数百万甚至上千万的经济损失，相较于极致的安全价值，算力成本几乎可以忽略不计。

但对中小微企业、独立安全研究员而言，低成本、高性价比的GPT-5.5，仍是日常安全研判、基础漏洞检测的最优选择。

Anthropic此次的战略选择十分明确：放弃大众化性价比市场，抢占高端专业安全市场，以极致能力构建独家壁垒，实现差异化竞争，避开与OpenAI通用赛道的正面内卷。

六、重塑行业生态：AI安全的下一个十年变局

Claude Mythos的全面解禁，不仅是一款模型的落地，更将彻底重塑网络安全行业的技术形态、人才结构与行业规则，开启AI安全的全新十年。

首先，重构安全人才协作模式。未来的网络安全防护，将彻底告别“纯人工研判”或“纯AI自动化”的单一模式，形成人类专家+AI智能体的全新协作体系。AI负责海量资产扫描、重复性漏洞检测、高危漏洞自动复现、批量数据分析等机械性工作，人类专家聚焦战略研判、风险决策、攻防创新、体系搭建等高阶工作，人机协同将大幅提升全网安全运营效率。

其次，加速网安行业AI原生迭代。传统防火墙、入侵检测、漏洞扫描等传统安全工具，迭代速度慢、误报率高、适配性差，短板日益凸显。而Mythos证明，AI原生安全方案可实现全自主攻防研判，能力远超传统工具，未来将逐步替代传统安全设备，成为网络防护的核心基础设施。

最后，抛出全球AI安全治理的终极命题。当AI具备自主挖掘、复现、利用高危漏洞的超强能力，如何规避技术滥用、防范网络攻击泛滥、守住AI安全底线，成为全球监管的核心难题。目前全球AI与网络安全监管框架，已严重滞后于技术迭代速度。业内普遍预判，未来全球或将出台统一的AI安全约束规则，类似“核不扩散机制”，规范高阶攻防AI的研发与商用落地。

结语

Claude Mythos的解禁，是2026年全球AI行业最具里程碑意义的事件之一。它标志着AI竞争逻辑的根本性颠覆：规模红利落幕，垂直价值崛起；通用内卷终结，专业制胜来临。

当OpenAI深陷通用生态整合、冲刺IPO的规模化赛道时，Anthropic凭借一款极致垂直的安全AI，撕开了行业差异化竞争的全新缺口，证明AI的核心竞争力从不在于“参数更大、功能更多”，而在于“解决问题更精准、更专业、更深入”。

未来的AI竞赛，不再是单一维度的算力与参数比拼，而是场景深耕、技术落地、价值创造的综合博弈。Claude Mythos的出圈已然预示：真正的AI终极竞争力，从来不是无所不能的广度，而是解决硬核问题的深度。

2026年5月25日
新能源汽车续航突破1500公里？气固电池或将成为新选择

中科院大连化物所发布全新气固电池技术，能量密度超过1000Wh/kg，是传统锂电池的4-5倍，可实现新能源汽车续航1500公里。该技术采用镁和氢气替代昂贵锂钴材料，常温常压…
阅读更多

想象一下，从上海一路开到北京，全程超过1200公里，中途不需要任何补能。这不是科幻小说，而是2026年5月真实发生的技术突破——中国科学院大连化物所陈萍团队发布的气固电池，用一种全新的技术路线，将新能源汽车续航推向了1500公里的新高度。

一、为什么我们需要气固电池

新能源汽车的渗透率在2026年已经突破70%，马路上挂绿牌的车早已不稀奇。但真正让消费者犹豫的，始终是那两个核心问题：续航够不够用和充电够不够快。

锂电池技术经过二十多年迭代，磷酸铁锂能量密度已经到了200Wh/kg左右的水平，三元锂好一点，能摸到250Wh/kg。这几年车企疯狂内卷，100度大电池逐渐成为高端车型标配，700公里续航成了”及格线”。但继续往上走，物理瓶颈开始显现——液态电解质体系能承载的锂离子迁移能力有上限，再想提升要么堆更多电池增加重量，要么在材料化学上找到新出路。

更让人头疼的是安全隐患。锂电池的热失控问题至今没有彻底解决方案。针刺、挤压、高温环境，都可能触发连锁反应。去年某品牌电动车在碰撞后起火的视频在网络上引发轩然大波，让不少消费者对电动车多了一层心理阴影。厂家不得不花大量成本在电池热管理系统上，这又反过来压缩了续航提升的空间。

这就是气固电池诞生的背景：新能源汽车行业太需要一场技术革命了。

二、氢电共储：一条从未有人走过的路

陈萍团队的突破之所以引发轰动，关键在于他们没有在现有技术框架里小修小补，而是从底层原理上重新设计了一套储能机制。

气固电池的核心概念叫”氢电共储”，这四个字精准概括了它的创新本质。传统锂电池靠锂离子在正负极之间来回迁移存储电能，固态电池在此基础上用固态电解质替代液态电解质，提升了安全性但本质上还是同一套逻辑。气固电池完全不一样——它用镁金属负极配合固态氢化物正极，充放电过程涉及氢气的吸脱附与镁氢化物的可逆转化。

听不懂没关系，你可以把它想象成一个更精密的”氢电池加锂电池的组合体”。氢气作为能量载体，储存密度极高；镁金属作为反应基底，稳定性极好。两者结合，产生了1+1>2的效果。

根据大连化物所公布的测试数据，气固电池的能量密度实测超过了1000Wh/kg。这个数字是什么概念？拿特斯拉Model 3搭载的磷酸铁锂电池包做个对比：其系统能量密度大约在160Wh/kg左右，即使算上整包重量也有很大差距。换句话说，气固电池的能量密度是现有主流动力电池的6倍以上。

理论上，搭载这种电池的新能源汽车，续航1500公里是保守数字。如果配合轻量化车身设计和高效电驱系统，实际行驶里程还有进一步上探的空间。

三、为什么是镁和氢

选择镁和氢气作为核心材料，不是拍脑袋的决定，而是基于对安全性、成本和供应链的综合考量。

先说锂的问题。 全球锂资源储量并不算稀缺，但开采和加工高度集中——南美”锂三角”、澳大利亚皮尔巴拉矿、中国的盐湖，各有各的地缘政治博弈。碳酸锂价格这两年坐过山车，从5万一吨涨到60万又跌回来，车企和电池厂商被折腾得够呛。钴更麻烦，70%以上的储量在刚果（金），童工开采和供应链伦理问题一直是行业痛点。

镁就不一样了。地壳中镁的丰度是锂的上千倍，我国是全球最大的镁生产国，陕西、山西、宁夏的镁厂技术成熟，产能充足。选择镁作为负极材料，既能绕开锂钴的供应链风险，又能在成本上形成显著优势。

再来看氢气。 很多人对氢能的印象还停留在”易燃易爆”四个字。实际上，氢气在常温常压下的燃爆范围（4%-75%体积浓度）比天然气更宽，换句话说，要达到燃爆条件需要更大比例的泄漏，这在客观上提高了安全性阈值。更重要的是，气固电池里的氢气是以固态形式储存的，不是高压气瓶也不是液态储罐。氢原子被”锁”在镁金属形成的晶格结构里，形成稳定的氢化镁（MgH₂）。想要释放能量？让氢气在特定条件下脱附出来参与反应就行。

大连化物所的测试视频里，科研人员对气固电池做了针刺实验——钢针直接穿透电池外壳。传统锂电池此时早就冒烟起火，而气固电池安静得像什么都没发生。撞击实验同样如此，剧烈冲击下电池依然稳定。这种本质安全的特性，是液态锂电永远无法企及的优势。

四、从实验室到上路还有多远

看到这里你可能会问：这么牛的技术，什么时候能买得到？

客观地说，气固电池目前还处于实验室验证阶段，离量产装车有相当距离。根据业内专家的判断，乐观估计需要5-8年的工程化验证周期。

第一道坎是功率密度。 能量密度和功率密度往往是一对矛盾。气固电池在能量密度上碾压液态锂电，但放电倍率和快充能力目前还不理想。现有测试数据中，电池在1C充放电条件下表现优异，但想要支持15分钟快充80%这种场景，还需要进一步优化电极结构和反应动力学。

第二道坎是循环寿命。 锂电池现在循环3000次以上已经稀松平常，固态电池也在向2000次迈进。气固电池目前的循环数据尚未公开，但参考其他新型储能技术的经验，从几百次循环提升到几千次，往往需要数年时间。

第三道坎是规模化制造。 实验室做出一颗完美的扣式电池是一回事，建成GWh级别的产线是另一回事。镁粉的制备、氢化工艺的控制、电池装配的精密要求，每一个环节都需要重新摸索工程化路径。

但即便如此，气固电池的发布仍然意义重大。它为动力电池技术指明了一个全新的方向，证明了氢能+固态储氢+金属负极这条路走得通。一旦某个技术路线被验证可行，后续的资本和人才会快速涌入，工程化速度往往会超出预期。

五、会取代锂电池吗

每逢新技术亮相，媒体总要问一句”能不能取代旧技术”。这个问题本身就有问题——技术替代从来不是非此即彼的零和游戏。

锂电池技术本身也还在进化。固态电池预计在2027-2028年实现规模化量产，能量密度有望突破500Wh/kg。锂硫电池、锂空气电池等更长远的技术路线也在同步推进。多种技术并行发展、相互竞争，最终谁主沉浮，由市场和用户说了算。

气固电池真正的竞争对手，可能不是锂电池，而是同代的其他新技术。谁能率先解决工程化难题、谁能建成低成本量产线、谁能获得整车厂的认可，才是决定市场份额的关键变量。

对消费者来说，技术路线之争是远在天边的新闻。但有一件事是确定的：驾驶电动车”里程焦虑”的日子，正在进入倒计时。

六、写在最后

回顾人类能源史，每一次重大突破都伴随着”不可能”的打破。石油从”危险燃料”到”工业血液”花了五十年，核能从”原子弹”到”清洁电源”花了三十年，锂电池从”索尼便携设备”到”汽车动力”花了二十年。每一次变革初期，都有人嘲笑”不可能”，也有更多人选择相信。

气固电池的出现，让我们看到了另一种可能性：用全新的化学体系，从根本上解决续航与安全的矛盾。当然，路还很长，但方向是对的。

当续航不再是问题，当充电速度追平加油体验，当电池安全不再需要担心——电动车的最后一块短板就被补齐了。届时，新能源取代燃油车，将不再是一个需要讨论的议题，而是自然而然发生的事实。

也许在十年后的某个清晨，你坐进一辆安静的新能源车里，仪表盘显示续航里程”1500+公里”。你想起2026年看到的那条新闻，想起当时还在讨论”电动车能走多远”。嘴角微微上扬，按下启动键，车子平稳地驶向远方。

那一天，也许并不遥远。

本文基于2026年5月中国科学院大连化物所公开发布的技术成果及实测数据撰写。

2026年5月24日
B7-H3靶向CAR-Vδ1T细胞：CAR-T治疗实体瘤的破局者

CAR-T细胞疗法在血液肿瘤领域已创造无数奇迹，但面对肺癌、肝癌、胃癌等实体瘤却一直束手无策。2026年5月，国际权威期刊《临床癌症研究》发表重磅研究，科学家通过换用Vδ1…
阅读更多
很多人知道CAR-T治疗淋巴瘤、白血病很厉害。2012年，7岁的艾米丽·怀特黑德成为全球首位被CAR-T疗法治愈的孩子，至今已无癌生存超过13年。此后，CAR-T在血液肿瘤领域一路高歌猛进，FDA已批准超过6款CAR-T产品，无数晚期血液肿瘤患者因此重获新生。

但一到肺癌、肝癌、胃癌这些实体肿瘤，CAR-T就“哑火”了。

CAR-T为何打不动实体瘤

这个问题困扰了科学家们整整十年。要回答它，得先了解实体瘤的三道“护甲”。

第一道：物理屏障。 实体肿瘤像一颗硬壳的果实，外面裹着厚厚的纤维基质和异常增生的血管。普通T细胞根本钻不进肿瘤内部，治疗药物也很难抵达核心区域。就像攻城部队被城墙挡在外面，连门都摸不到。

第二道：免疫抑制微环境。 即便T细胞千辛万苦挤进去了，肿瘤微环境里充满了抑制性信号——TGF-β、IL-10、腺苷等“免疫刹车”分子，会让CAR-T细胞迅速“躺平”，失去战斗力。有研究显示，进入实体瘤的CAR-T细胞在24小时内就会丧失超过80%的杀伤活性。

第三道：靶点异质性。 同一个肿瘤里，不同癌细胞的靶点表达差异巨大。有的表达这个抗原，有的表达那个抗原，杀掉一部分，剩下的继续疯狂生长。这就是所谓的“靶点逃逸”，也是实体瘤复发的主要机制之一。

这三条，条条要命。十年间，无数临床试验试图攻克这些障碍，却始终未能取得实质性突破。CAR-T治疗实体瘤，似乎成了一道“不可解”的方程式。

三招破解实体瘤困境

2026年5月15日，《临床癌症研究》在线发表了一项重磅研究。科学家没有在传统CAR结构上继续死磕，而是从两个更底层的地方动刀，给出了一套全新的解决方案。

第一招：换一种T细胞。

传统CAR-T使用的是αβ T细胞——这是我们体内最常见的T细胞类型。但这次，科学家选择了一种更“特种兵”属性的细胞：Vδ1 T细胞。

这是γδ T细胞的一个特殊亚群，约占所有γδ T细胞的10%-50%。与αβ T细胞相比，Vδ1 T细胞有几个显著优势：

首先，它天然更“认”肿瘤。γδ T细胞不依赖MHC（主要组织相容性复合体）呈递抗原，而是通过NKG2D等受体直接感知肿瘤细胞的应激信号。这种“直觉式”识别让Vδ1 T细胞更容易找到并浸润实体肿瘤。

其次，它更耐受恶劣环境。肿瘤微环境里的低氧、低pH、高氧化应激对普通T细胞是致命打击，但Vδ1 T细胞在这样的条件下依然能保持较高的活性。

第三，异体使用风险更低。Vδ1 T细胞不太容易引发移植物抗宿主病（GVHD），这为开发“现货型”异体CAR-T产品扫清了障碍。

第二招：换一个靶点。

传统CAR-T治疗血液肿瘤常用的靶点是CD19——这是一种只在B细胞表面表达的蛋白，非常“专一”。但实体肿瘤没有CD19，科学家需要找到新的靶点。

经过多年探索，B7-H3（CD276）进入了视野。

这是一种免疫检查点分子，在多种实体肿瘤表面高度表达，包括肺癌、乳腺癌、结直肠癌、胰腺癌、肝癌、胃癌等。而在正常组织中，B7-H3的表达水平相对较低。这意味着它是一个理想的肿瘤相关抗原——既能有效区分肿瘤和正常组织，又能覆盖尽可能多的患者群体。

更重要的是，B7-H3与肿瘤的恶性程度正相关。表达越高，肿瘤侵袭性越强，预后越差。这反而成了一个优势：那些最难治的晚期实体瘤，恰恰是B7-H3表达最高的。

第三招：做“现货型”产品。

传统CAR-T是“私人定制”的：先从患者身上抽血，分离T细胞，基因工程改造，扩增培养，最后回输体内。整个过程需要两到三周，耗资数十万美元。很多晚期患者根本等不起，身体也扛不住。

这次研究开发的B7-H3 CAR-Vδ1T是“异体”的——来自健康供体，提前生产好，患者来了直接用。这就像从血库调血一样方便，大大缩短了等待时间，降低了治疗门槛。

临床数据揭示了什么

这项研究是一项概念验证性临床试验，纳入的受试者均为经过标准治疗失败或不耐受的晚期实体瘤患者，包括肺癌、胃癌、胰腺癌等多种类型。

结果令人振奋：

安全性数据理想。 没有观察到高移植物抗宿主病（GVHD）风险，也没有出现严重不可控的免疫风暴——这是异体细胞治疗最担心的两大问题。细胞因子释放综合征（CRS）的发生率和严重程度都在可接受范围内。

观察到明确的抗肿瘤活性。 在多种实体瘤中，研究者观察到了肿瘤退缩或疾病稳定的案例。这意味着CAR-Vδ1T细胞确实在患者体内发挥了作用。

当然，这是早期临床研究，样本量还比较有限，后续需要更大规模的数据来确认疗效。但关键在于——这是实体瘤！不是血液肿瘤！这是CAR-T技术诞生以来，首次在实体瘤中观察到令人信服的治疗信号。

一场迟到十年的突破

回顾CAR-T技术的发展历程，这项研究的意义怎么强调都不为过。

2017年，FDA批准了全球首款CAR-T产品Kymriah，开启了细胞治疗的新纪元。此后几年，CAR-T在血液肿瘤领域一路高歌：完全缓解率从30%提升到90%以上，长期生存数据不断刷新，许多原本无药可用的晚期患者获得了治愈的可能。

但实体瘤始终是那道迈不过去的坎。据统计，全球约90%的癌症死亡来自实体瘤，而CAR-T在实体瘤领域的临床试验成功率长期低于5%。无数药企在这个方向投入巨资，却一次次铩羽而归。

这次B7-H3 CAR-Vδ1T的研究之所以重要，不是因为它治愈了实体瘤，而是因为它证明了这条路走得通。

它告诉我们：CAR-T打不动实体瘤，不是因为CAR-T这个技术方向错了，而是之前用的“武器”和“打法”不对。换用Vδ1T细胞、选择B7-H3靶点、开发异体产品——这三招组合拳，从根本上重构了CAR-T与实体瘤博弈的逻辑。

对患者意味着什么

对于正在经历实体瘤治疗耐药的晚期患者来说，这项研究带来了新的希望。

传统的治疗路径通常是：手术→化疗→放疗→靶向治疗→免疫检查点抑制剂。一路打下来，等到所有选项都用尽，很多患者和家属会陷入深深的绝望。

B7-H3 CAR-Vδ1T疗法提供了一种全新的可能性。与其等待，不如先做一件事：了解自己的肿瘤有没有B7-H3高表达。

基因检测和免疫组化检测可以帮助判断肿瘤的靶点表达情况。如果检测结果显示B7-H3高表达，患者可能从这种靶向治疗中获益。越早检测，越早准备，就越有机会抓住这个新的治疗窗口。

当然，新药的研发和审批需要时间。从概念验证到上市，可能还需要三到五年。但对于晚期患者来说，保持希望、关注前沿、积极检测，就是在为未来争取机会。

技术进化的启示

从更宏观的视角看，这项研究折射出生物医药技术进化的一些规律。

第一，跨界融合越来越重要。 B7-H3 CAR-Vδ1T的成功，不是单纯的免疫学突破，而是免疫学、肿瘤生物学、基因工程多学科交叉的结果。Vδ1 T细胞的优势，来自对γδ T细胞亚群的深入理解；B7-H3靶点的选择，来自对肿瘤免疫微环境的系统分析；异体产品的开发，则借鉴了器官移植领域的经验。

第二，“小众”技术有时比“主流”更有潜力。 Vδ1 T细胞在整个人体T细胞库中只占很小的比例，一直不是免疫治疗的主流方向。但正是这个“边缘选手”，解决了αβ T细胞解决不了的问题。科学创新往往就是这样：最有效的解决方案，有时藏在最不起眼的地方。

第三，“现货型”产品是趋势。 个体化定制CAR-T疗效确切，但成本高昂、等待漫长，难以惠及大多数患者。开发通用型产品是行业共识，但GVHD风险一直是拦路虎。Vδ1 T细胞的低GVHD特性，为解决这个问题提供了新的可能。

展望：实体瘤CAR-T的下一个五年

B7-H3 CAR-Vδ1T的突破，为实体瘤CAR-T赛道注入了强大信心。可以预见，未来五年，这个领域将迎来快速发展。

靶点开发会持续深化。 除了B7-H3，科学家还在探索其他有潜力的靶点，如GPC3（NKG2D配体）、EGFR、HER2等。多靶点联合、CAR-T与免疫检查点抑制剂联用，可能进一步提升疗效。

细胞来源会更加多元。 除了Vδ1 T细胞，CAR-NK、CAR-γδ T、CAR-M（巨噬细胞）等新型细胞疗法也在快速发展，未来可能出现多种技术路线并存的局面。

适应症会不断拓展。 当前研究主要集中在肺癌、胃癌、胰腺癌等消化道肿瘤，未来可能拓展到脑肿瘤、骨肉瘤等其他实体瘤类型。

治疗模式会更加灵活。 不同于传统CAR-T的单次大剂量回输，新型CAR-T可能会采用多次、联合、低剂量的“节拍式”治疗策略，更好地与肿瘤“周旋”。

癌症治疗走到今天，已经从“无可奈何”变成了“希望渐显”。B7-H3 CAR-Vδ1T细胞的出现，不是终点，而是新的起点。

对于晚期实体瘤患者来说，活着就有希望。每一次技术突破，都在为这个希望增加砝码。

参考资料：
1. Clinical Cancer Research, “B7-H3 targeted CAR-Vδ1 T cells for advanced solid tumors”, Published May 15, 2026
2. AACR 2026 Annual Meeting Research Abstracts
3. ASGCT Annual Meeting 2026 – CAR-T Cell Therapy Advances
2026年5月23日
多智能体”美第奇效应”：AI群体智能如何重塑企业竞争格局

深入解析AI多智能体系统的”美第奇效应”概念，探讨从单打独斗到群体智能的演进路径，以及企业如何借助数据飞轮构建难以逾越的竞争壁垒。
阅读更多
引言：当AI学会”组队”

2026年的AI领域，一个深刻的变化正在发生：AI智能体不再满足于”单打独斗”，而是开始组建”团队”、形成”联盟”，共同完成复杂任务。这一转变的核心，是多智能体系统（Multi-Agent System）的崛起。

5月20日，在超聚变探索者大会上，零一万物CEO李开复首次将艺术史上著名的”美第奇效应”引入AI世界，用以描述这种多智能体协同所释放的创新能量。在他看来，当不同专长的AI Agent被放在一起协作、互补乃至对抗时，一种远超单体智能的集体智慧正在涌现——这可能才是AI真正改变商业世界的关键转折点。

一、从”辅助工具”到”超级员工”：AI的两次跃迁

要理解多智能体的意义，我们需要先回顾AI在企业中的角色演变。

第一次跃迁：从工具到助手。以ChatGPT为代表的大语言模型，让AI从”搜索工具”进化为”对话助手”，能够理解自然语言、生成内容、解答问题。这一阶段，AI扮演的是”顾问”角色，人类仍是决策主体。

第二次跃迁：从助手到执行者。2025年开始，以Claude Code、OpenAI Codex为代表的AI编程智能体，展示了AI不仅能”说”，更能”做”——它们可以自主规划任务、调用工具、编写代码、调试bug。AI开始从顾问升级为能够独立完成端到端任务的”数字员工”。

第三次跃迁正在发生：多智能体时代。李开复在演讲中描绘了这个新阶段的核心特征——多个AI Agent针对人类给定的目标，自动形成子任务集群，有机互联，构建出一张AI智能体网络。这种”群体智能”，不是简单的一加一等于二，而是在协同中产生”美第奇效应”。

二、”美第奇效应”：跨领域碰撞的创新加速器

“美第奇效应”源自文艺复兴时期的佛罗伦萨美第奇家族。这个家族资助了大量来自不同领域、具有不同背景的艺术家、科学家和思想家——达芬奇与米开朗基罗在同一个屋檐下工作，波提切利与布鲁内莱斯基相互启发。这种跨领域的思想碰撞，催生了人类历史上最辉煌的艺术与科学革命。

李开复将这个概念引入AI多智能体系统，其核心洞察是：认知多样性才能产生真正的创造力。

在传统的单体AI架构中，一个强大的模型试图”通才”，但在面对复杂问题时，它的推理路径往往是线性的、收敛的。而在多智能体架构中，不同专长的Agent被组织在一起：
- 有的Agent擅长数据分析，能够快速从海量数据中提取规律
- 有的Agent擅长代码生成，能够将分析结果转化为可执行方案
- 有的Agent扮演”魔鬼代言人”，专门质疑和挑战其他Agent的结论
- 有的Agent负责整合输出，确保最终方案的质量和一致性
当这些Agent在同一个任务中”辩论”、”协作”、”对抗”时，创新的火花更容易迸发。这就像一个投资委员会——单个投资经理可能有盲点，但一群背景各异的专业投资者相互制衡，往往能做出更可靠的判断。

三、多智能体协同的三个阶段

多智能体并非一夜之间出现，而是经历了三个清晰的演进阶段：

阶段一：工作流自动化

最早的AI智能体采用”工作流”模式——人类预先设计好流程，AI按部就班执行。典型的应用场景包括：RPA机器人按照既定规则处理发票、客服聊天机器人按照脚本回复客户。

这一阶段的局限很明显：AI没有真正的”思考”，只是在执行人类预设的分支逻辑。

阶段二：强推理能力

2025年，以OpenAI o1、Claude Opus为代表的新一代模型，展现了强大的推理能力。AI不再仅仅执行指令，而是能够自主规划复杂任务、调用多种工具、在执行中动态调整策略。

在这个阶段，单个Agent的能力边界被大幅拓展——它可以自主完成”分析需求→制定方案→编写代码→测试验证→修复bug”的完整开发流程。但核心问题仍然存在：单体Agent的智能存在上限，当任务复杂度超过一定阈值，单一模型的”思维”就会陷入局部最优。

阶段三：多智能体协同

第三阶段的核心突破，是多Agent协作框架的成熟。2026年，几个关键技术支撑这一跃迁：

AgentBFT协议：一种去中心化的多Agent共识协议，支持500+异构Agent的自治协同。不同于传统的主从式调度，AgentBFT让每个Agent都能独立决策，同时通过拜占庭容错机制确保整体一致性。

跨模态工具生态：Model Context Protocol（MCP）等标准化协议，让不同Agent能够无缝调用彼此的工具和服务。一个Agent可以”召唤”另一个Agent的帮助，就像人类专家之间的协作一样自然。

长期记忆与上下文共享：现代多智能体系统配备了分布式向量-图混合记忆库，不同Agent可以共享历史经验、积累集体智慧。这意味着每次任务的执行结果，都能成为组织”知识资产”的一部分。

四、企业数据飞轮：竞争壁垒的新来源

多智能体最深远的影响，可能不在技术层面，而在商业竞争层面。

李开复提出了一个颇具洞察力的观点：当企业将多智能体嵌入核心业务流程后，分散在各个环节的智能体会共享同一套企业数据，并在协同中不断把执行结果反馈给彼此。一个环节产出的反馈，会成为另一个环节优化决策的依据。数据由此转动起来，形成一个企业内部的专有数据飞轮。

这个飞轮的关键在于专属性。

未来，每一家企业都会部署基座模型和智能体，市场上会有成熟的解决方案。但一家公司在自己业务里沉淀出的数据和协同经验，将是最大的差异化壁垒。就像字节跳动的推荐算法之所以难以复制，不是因为算法本身有多复杂，而是因为它积累了海量的用户行为数据和实时反馈。

多智能体系统可以加速这个飞轮的形成。当AI Agent在供应链管理、客户服务、财务审核、产品研发等环节协同工作时，每一次执行都在生成有价值的业务数据，每一次反馈都在训练更精准的决策模型。随着时间推移，这套系统对企业的理解越来越深，效率越来越高，新进入者复制的成本也越来越高。

李开复甚至断言：”多智能体时代企业数据飞轮一旦启动，就会成为企业最深的护城河。”

五、AI编程临界点：99%的代码将由AI生成

支撑多智能体快速落地的，有一个关键技术背景：AI编程能力正在跨越临界点。

在2026年的SWE-bench验证通过率测试中，AI已经可以超越人类工程师的平均水平。与此同时，推理成本却在快速下降——每百万tokens的综合成本已降至数年前的十分之一。

李开复给出了明确预测：AI代码生成将很快超过人类，最终99%的代码将由AI编写。

这听起来有些激进，但背后的逻辑很清晰。编码不仅是AI能完成的任务，更是自动化数字行动的技术基石。当AI能够稳定地生成代码、调用工具、操作软件，它就具备了将人类意图直接转化为行动的能力。

更重要的是，编程能力的突破会反过来加速多智能体的进化。多智能体之间需要协调，而协调需要精确的数字指令——代码。把这个能力交给AI，人类只需要定义目标，AI就能自主完成从规划到执行的完整闭环。

六、CEO必修课：组织变革的深层挑战

多智能体的落地，不仅仅是技术问题，更是组织变革问题。

李开复在演讲中反复强调：”企业AI数智化转型是一把手工程，需要由CEO从顶层设计出发。”这并非危言耸听。

首先，多智能体改变了组织的权力结构。当AI能够自主完成端到端任务时，中层管理者的”上传下达”职能将被大幅削弱。组织架构可能需要从层级制向网络制转变，每个智能体都是一个独立的生产力节点，直接与其他节点协同，绕过传统的信息传递链条。

其次，多智能体带来了新的治理挑战。当AI开始自主做决策时，如何确保这些决策符合企业利益？当多个Agent之间出现分歧时，谁来做最终裁决？当系统出现错误时，责任如何界定？这些问题没有标准答案，需要CEO从战略层面做出抉择。

第三，多智能体需要新的评估体系。传统的KPI考核基于个人贡献，但多智能体的价值在于协同效应——1+1>2的部分如何衡量？李开复提到的”美第奇效应”，本质上是团队认知多样性带来的增量价值，但这种增量很难被传统的绩效考核体系捕捉。

七、从概念到落地：多智能体的现实应用

理论之外，多智能体已经开始在真实场景中证明价值。

金融投资领域：零一万物的多智能体平台组建了”模拟投资委员会”——多个Agent分别扮演宏观经济分析师、行业研究员、风险评估师、量化策略师，在投资决策中相互制衡、相互补充。同时，系统还引入了”红蓝对抗”机制，专门有一个Agent扮演”怀疑论者”，挑战其他Agent的投资逻辑。

企业服务领域：招商银行接入蚂蚁AaaS平台后，财报分析耗时从3人日压缩至8秒。这背后是多个专业Agent的协同——数据提取Agent负责解析PDF财报，财务分析Agent计算关键指标，风险评估Agent生成风险评级，报告生成Agent输出结构化结论。

制造业领域：富士康郑州工厂引入基于Hermes-3框架的质检机器人，实现了”缺陷识别+自动分拣+报告生成”的全自主流程。这个系统由多个专业Agent组成——视觉感知Agent负责图像分析，决策Agent负责判断产品是否合格，动作控制Agent负责机械臂操作，数据记录Agent负责质量追溯。

八、挑战与展望：群体智能的边界

多智能体系统并非完美无缺。几个核心挑战仍然存在：

协调成本：当Agent数量增加时，它们之间的通信和协调成本会指数级上升。如何设计高效的协作协议，避免”议而不决”或”过度讨论”，是一个工程难题。

可解释性：当多个Agent共同做出一个决策时，如何解释这个决策的成因？当结果出错时，如何追溯是哪个Agent的问题？传统的”可解释AI”方法在多智能体场景下面临更大挑战。

安全与对齐：多个Agent协同时，单个Agent的安全漏洞可能被放大利用。2026年Anthropic Claude Code源代码泄露事件，为整个行业敲响了警钟——如何确保多智能体系统的整体安全性，需要系统性思考。

人机边界：当AI Agent能够自主完成越来越多任务时，人类的角色应该如何定位？李开复的观点是，人类应该专注于”设定目标”和”判断价值”，而将”执行细节”交给AI。但这需要一个认知转变——许多人可能难以接受从”执行者”到”监督者”的角色转换。

结语：站在群体智能的起点

多智能体系统的发展，让我想起了人类进化史上的一个关键时刻：当早期人类从独居动物进化为社会性动物，群体协作带来的生存优势，最终造就了人类文明的辉煌。

AI正在经历类似的转变。从单体智能到群体智能，不仅是技术架构的升级，更是一种范式的跃迁——AI不再是孤立的工具，而是能够协同、互补、对抗、学习的”数字生命体”。

李开复将这种转变比作”美第奇效应”，或许有些浪漫，但它指向的洞察是真实的：认知多样性产生创造力，协同放大个体价值，数据飞轮构建竞争壁垒。

对于企业和个人而言，多智能体时代的生存法则正在改变。企业的竞争，不再仅仅是”谁拥有更强的AI模型”，而是”谁更能有效组织和协调多个AI Agent”；个人的价值，不再是”执行重复性任务的效率”，而是”定义目标、评判价值、创造性解决问题”的能力。

这或许才是AI真正改变世界的时刻——不是某一项技术突破，而是一种新的”智能组织形式”的出现。就像人类通过群体协作征服了自然，AI通过群体协同，或许正在开启一个全新的智能文明。

相关阅读：
本文分析了多智能体系统的”美第奇效应”与群体智能的最新发展趋势，为企业AI转型提供参考。文章内容仅供参考，不构成投资建议。

配图alt描述：多智能体AI系统可视化——多个发光节点组成的协作网络，代表不同AI智能体之间的信息交互与协同决策，体现群体智能的科技感。
2026年5月22日
ASML新一代EUV光刻机量产：芯片制造跨入1.8nm埃米纪元

2026年5月，荷兰光刻机巨头ASML宣布新一代High-NA EUV光刻机进入稳定量产阶段。这一里程碑事件标志着芯片制造正式从2nm时代跨入1.8nm、1.4nm的埃米级…
阅读更多
2026年5月20日，荷兰光刻机巨头ASML在比利时imec行业峰会上扔下一颗重磅炸弹：新一代High-NA EUV光刻机（型号Twinscan EXE:5200B）正式进入稳定量产阶段。这意味着，人类制造芯片的精度再次跃升，芯片产业正式跨入所谓的“埃米时代”。

从”纳米”到”埃米”：0.22的跨越意味着什么

在聊High-NA EUV之前，先得搞清楚一件事——光刻机到底是干什么的。芯片的本质，是在硅片上刻画出几十亿甚至上百亿个微小的晶体管。光刻机就是这个“刻画”过程的核心设备，用极紫外光（EUV）在硅片上“画”出电路图案。精度越高，画出来的晶体管就越小，芯片性能越强、功耗越低。

ASML目前是全球唯一能量产EUV光刻机的企业，没有之一。而这次量产的High-NA EUV，堪称EUV的“超级升级版”。

这台机器最关键的突破，是把光学系统的数值孔径（NA）从上一代EUV的0.33大幅提升到0.55。表面看只是0.22的数值增长，但它带来的却是质的改变：

分辨率提升：单次曝光就能刻出8nm的特征尺寸，比上一代小了1.7倍。这意味着同样面积的芯片上，晶体管密度理论上可以提升2.9倍。

工艺简化：过去制造3nm、2nm芯片，需要多次曝光、几十道复杂工序。现在有了High-NA EUV，关键层一次曝光就能搞定，工序减少超过30%，芯片良率大幅提升。

性能飞跃：同等面积下，芯片性能提升约60%，功耗降低约45%。这对于当前AI算力芯片、高端存储芯片来说，简直是久旱逢甘霖。

量产数据：不是实验室概念，已实战验证

ASML官方公布的量产数据，全部基于50万片晶圆的实际加工验证，绝非纸上谈兵：
- 稼动率：当前稳定在80%，2026年底目标提升到90%，已达到大规模量产的成熟标准
- 产能效率：每小时处理175-185片晶圆，比上一代EUV提升明显，单台年产能可支撑数百万片高端芯片
- 稳定性：累计加工超50万片晶圆，套刻精度达到0.7nm，各项指标全部达标
但这台机器的造价同样令人瞠目：单台约4亿美元，折合人民币约27.25亿元，相当于27架波音737的价格。由于技术复杂度极高、供应链要求极严，ASML 2026年全年计划仅出货5-6台，2027年才会逐步提升产能。全球顶尖芯片厂商都在争抢这有限的产能，谁先拿到、拿到更多，谁就能抢占2nm以下制程的先机。

谁先用上：三大巨头已率先布局

ASML从2025年底开始向核心客户交付High-NA EUV，目前三家巨头已经装机并进入试产阶段。

英特尔：首家验收，主攻1.4nm制程。2025年12月，英特尔完成全球首台High-NA EUV的验收，在美国波特兰工厂装机，主要用于Intel 14A工艺（等效1.4nm），目标2027-2028年大规模量产。目前已累计处理超3万片晶圆，进入试产爬坡阶段。

SK海力士：存储芯片领域的首家部署者。2025年9月在韩国DRAM工厂完成安装，用于下一代HBM（高带宽内存）和先进DRAM，解决AI大模型对高速存储的瓶颈问题。首批HBM芯片预计2026年Q3-Q4正式交付，直接供应英伟达、AMD等AI芯片厂商。

三星：2026年上半年接收第二台High-NA EUV，部署在美国得克萨斯州泰勒的2nm GAA晶圆厂，用于2nm及以下先进逻辑芯片，与英特尔、台积电正面竞争。

有意思的是，全球最大芯片代工厂台积电目前明确表示暂不采购High-NA EUV。台积电认为，现有Low-NA EUV通过工艺优化还能支撑到A16制程，暂时不需要花4亿美元买新设备。等未来产能提升、成本下降后，再考虑大规模导入。这种“按需采购”的务实态度，倒是很符合台积电一贯的风格。

三大变革：全球芯片格局彻底改写

High-NA EUV的量产，绝不是简单的设备升级，而是从芯片性能、产业分工、竞争格局三个层面，带来颠覆性改变。

芯片性能：AI算力迎来质变

对于当前火热的AI产业来说，High-NA EUV的意义非凡。1.4nm制程能让AI芯片塞进更多晶体管，AI训练速度提升50%以上，推理功耗降低一半，直接缓解当前AI大模型“算力不够、功耗太高”的痛点。

高端存储领域同样受益匪浅。HBM用High-NA EUV制造后，带宽提升30%-50%，延迟大幅降低，成为AI服务器、数据中心的标配。这将彻底解决AI大模型的存储瓶颈问题。

对普通消费者而言，未来1-2年高端手机、笔记本用上1.4nm芯片后，同样电池容量续航多2-3小时，同样体积性能提升50%，发热控制更好。

产业分工：马太效应加剧

先进制程的门槛被进一步拉高。目前全球只有英特尔、三星、SK海力士、台积电四家有实力玩2nm以下制程，其他厂商基本被排除在外。加上单台4亿美元的高昂成本、一条2nm产线超200亿美元的投资，中小芯片厂彻底与先进制程无缘。

这也意味着，全球芯片代工格局将加速分化：台积电靠现有EUV守住2nm市场，英特尔、三星靠High-NA EUV冲击1.4nm，形成“2nm vs 1.4nm”的双线竞争格局。

供应链博弈：技术封锁更严

需要清醒看到的是，High-NA EUV作为当前最顶尖的半导体制造技术，完全禁止向中国大陆出口，连相关零部件、技术服务都被严格限制。这意味着，中国大陆先进制程芯片的自主研发，短期内难以突破2nm以下瓶颈，只能在成熟制程（28nm及以上）持续深耕。

差距虽然客观存在，但也不必过于悲观。在成熟制程、先进封装、特定芯片设计等领域，中国半导体产业仍有广阔的发展空间。这台机器的量产既是挑战，也是倒逼自主创新的动力。

理性看待：不是万能神器

尽管High-NA EUV意义重大，我们也要客观看待它的局限性。

成本极高，短期难以普及。单台4亿美元，加上良率爬坡、工艺磨合，首批1.4nm芯片的价格注定不菲，只会用在AI服务器、高端HBM等领域，消费电子普及至少要到2028年以后。

产能有限，供不应求。2026年仅5-6台的出货量，面对全球巨大的需求，产能缺口明显，高端芯片短缺的情况还会持续1-2年。

工艺复杂，良率提升需要时间。1.4nm制程对工艺控制、材料、环境要求极高，良率从当前的60%-70%提升到90%以上，需要至少1-2年的时间。

写在最后

ASML High-NA EUV光刻机的量产，标志着全球芯片制造正式进入埃米级时代。这是半导体产业发展的必然结果，也是AI算力需求爆发的必然选择。

对全球产业而言，这是一次技术跃迁，也是一次格局洗牌。对中国半导体而言，这既是挑战，也是机遇。我们既要看到差距，也要保持信心，在成熟制程、先进封装、芯片设计等领域持续突破，走出一条适合自己的发展道路。

毕竟，芯片产业的竞争从来不是百米冲刺，而是一场漫长的马拉松。每一个技术突破，最终都会转化为普通人能感受到的科技进步。

本文信息来源：ASML官方公告、imec行业峰会公开数据、英特尔/SK海力士/三星官方报道。
2026年5月21日
Google I/O 2026：Gemini Omni世界模型发布，AI从”预测下一个词”跃迁到”预测世界下一状态”

北京时间5月20日凌晨，谷歌在年度开发者大会Google I/O 2026上正式发布Gemini Omni世界模型，标志着人工智能从”预测下一个词”向”预测世界下一状态”的…
阅读更多

2026年5月20日，谷歌在加州山景城举办的Google I/O 2026开发者大会，成为全球AI产业的历史性时刻。谷歌CEO桑达尔·皮查伊在主题演讲中正式宣布：”我们已经进入了Gemini时代。”更重磅的是，全新亮相的Gemini Omni世界模型，以一种全新的技术哲学，重新定义了人工智能的认知边界。

这不仅仅是一次产品迭代，而是AI范式的根本性转变。

从”预测下一个词”到”预测世界下一状态”：什么是世界模型

理解世界模型的意义，首先要搞清楚它与传统大语言模型的核心差异。

我们人类能够预判扔出去的球会落在哪里，知道杯子掉地上会碎，是因为大脑里有一个对物理世界的”模拟系统”。传统大语言模型靠的是”预测下一个词”——它根据海量文本的统计规律来回答问题，并不真正”懂”物理世界。比如你问”杯子从桌子上掉下来会怎样”，大模型会说”会碎”，那是因为它在文本里见过这句话，而并非真正理解了重力、碰撞和碎裂的因果关系。

世界模型则完全不同。它做的是”预测下一个世界状态”——它会在内部模拟杯子掉落的全过程，计算出落地时间、破碎角度、碎片飞溅的方向，让AI第一次具备了理解空间、时间、因果和物理规律的能力。

用更学术的话说，世界模型的核心目标是实现”Next-State Prediction”（下一个状态预测），让AI掌握时空连续性与因果关系，而非仅仅是语言统计规律。这一方向已被杨立昆、Yann LeCun等顶级AI科学家视为通往通用人工智能（AGI）的必由之路。

三大技术路线：像素生成、抽象预测与空间智能

截至2026年初，全球主要玩家在世界模型领域已经形成了三条截然不同的技术路线，代表了完全不同的技术哲学，目前尚无收敛趋势。

像素生成派：”世界即视频”

这一派的核心逻辑是通过视频生成技术来模拟世界演化，认为”能够生成逼真视频就意味着理解了物理规律”。代表玩家包括OpenAI Sora、Google Genie 3、阿里HappyOyster。其技术特点是采用Diffusion Transformer架构，强调时序连贯性和画面质量，追求长时长视频生成。这一路线的优势在于直观易懂，直接面向内容创作场景。但短板同样明显：对物理规律的理解停留在表象，难以支撑机器人训练等硬核场景。

抽象预测派：”世界即因果”

这一派的代表是Meta V-JEPA 2，由Meta首席AI科学家Yann LeCun主导。其核心逻辑是反对像素级重建，主张学习世界的抽象表征和因果逻辑。V-JEPA 2采用JEPA架构，在潜在空间进行预测而非像素空间，强调因果推理和可解释性，运行速度是英伟达Cosmos的30倍。LeCun认为”真正的世界模型应该是预测未来的抽象大脑”——不预测画面细节，只在潜在空间预测未来的抽象结构。

空间智能派：”世界即3D”

这一派的核心观点是真正的世界模型必须理解三维空间和物体关系，能够生成可编辑、可导出的3D资产。代表玩家包括斯坦福World Labs、腾讯HY-World 2.0、NVIDIA Omniverse。腾讯HY-World 2.0的核心差异化在于”可导出性”——生成的3D资产文件可直接用于游戏开发；群核科技则拥有全球最大的空间数据集，推出SpatialLM空间语言模型。这一路线的优势在于可直接用于游戏开发、机器人仿真，工程化落地最快。

Gemini Omni的颠覆性突破：原生全模态与物理世界理解

在Google I/O 2026上发布的Gemini Omni，代表了世界模型发展的新高度。谷歌并未将其简单定义为”多模态模型”，而是定位为真正意义上的”世界模型”——能够将任何输入模态（文本、图像、视频、音频）转化为统一的世界表征。Gemini Omni Flash不仅能完美理解各种视听信号，更具备了对物理世界的直观感知能力。

在大会现场演示中，Gemini Omni已经能够理解动力学规律、动能转换与重力效应——这意味着它不仅”看过”物理现象，而且真正”理解”了物理规律。谷歌直接将该模型应用于前沿机器人的训练中，实现了从”看懂”到”看懂并行动”的跨越。

更具颠覆性的是，Gemini Omni Flash将推理与内容生成的边界彻底模糊。用户仅通过自然对话，就能让模型将一段氨基酸定格动画短片进行精准编辑——无论是替换背景、调整分镜还是改变角色的物理运动轨迹，模型均能实时渲染输出高品质视频。从技术架构看，Gemini Omni实现了”原生全模态”——通过统一Token化技术，将所有模态映射到同一语义空间，解决了传统多模态模型”模态割裂””交互卡顿””生成失真”的痛点。

基础设施支撑：TPU 8t与TPU 8i的”双芯片策略”

Gemini Omni的强大能力背后，是谷歌史无前例的基础设施投入。皮查伊透露，2022年谷歌的资本支出为310亿美元，2026年这一数字将达到1800-1900亿美元，增长了近6倍。

支撑这一切的是谷歌首次推出的”双芯片策略”：专门用于大规模预训练的TPU 8t，以及针对高并发推理极限优化的TPU 8i。TPU 8t带来了较上一代接近三倍的算力提升，更关键的是，通过底层分布式框架JAX与Pathways的深度重构，谷歌成功在全球范围内无缝串联起超过100万个TPU，实现了跨越多个物理站点的协同训练。这意味着超大规模模型的训练周期从过去的数月缩短至数周。TPU 8i则一击切中了商业化落地的最大痛点——延迟，为上层智能体的实时响应提供了可能。

应用场景：从视频生成到具身智能

世界模型的产业价值，正在从实验室走向大规模落地。

视频生成领域，Sora、Genie 3等已能生成物理一致的长视频，再也不会出现”六根手指””穿模”的bug。自动驾驶领域，特斯拉、Waymo用世界模型模拟极端路况，每天训练相当于人类500年的驾驶经验，提前5-10秒预判路况变化，无干预行驶成功率提升至95%以上。人形机器人领域，在虚拟世界中训练上亿次再迁移到真实机器人，成功率提升81%。工业数字孪生领域，世界模型可模拟工厂产线运行，使故障率降低30%。

未来展望：万亿级市场的黄金窗口

从技术突破到产业落地，2026年标志着AI从”会思考”向”能实干”的关键转折。世界模型与具身大脑的融合，正在重新定义AI的终极形态。

根据智源研究院在《2026十大AI技术趋势》中的判断，行业共识正从语言模型转向能理解物理规律的多模态世界模型。这一转变不仅解决了传统模型的”幻觉”痛点，更通过自动驾驶技术的迁移和工业场景的验证，开启了万亿级市场的历史窗口。

更重要的是，世界模型正在重构AI的底层逻辑。过去AI靠”堆数据、堆算力”，现在靠”理解规律、推演未来”。它让AI从”只会聊天的工具”，变成了”能在真实世界干活的智能体”。

当AI真正理解了这个世界，我们的生活和工作方式，都将被彻底改变。而Gemini Omni的发布，只是这场变革的开始。

2026年5月20日
核聚变装置突破百秒大关：托卡马克升级如何筑起能源终极方案

2026年5月，国内托卡马克核聚变实验装置实现重大技术突破：等离子体约束时间历史性突破100秒，聚变反应温度达到1.5亿摄氏度，远超太阳核心温度1500万摄氏度。与此同时，…
阅读更多

当人类第一次在实验室里观察到核聚变反应释放的能量时，就意识到这是一把打开能源宝库的钥匙。核聚变的原理并不复杂——模仿太阳内部将氢的同位素氘和氚融合成氦，释放出巨大能量。但要在地球上复刻恒星的炼狱环境并实现可控输出，却让科学家们奋斗了七十余年。2026年5月，这个梦想终于迈出了关键一步。

一、等离子体约束：托卡马克的百年难题

核聚变反应需要在极高温度（超过1亿摄氏度）下进行，此时氘氚燃料会变成等离子体状态。如何将这些滚烫的等离子体约束在有限空间内足够长的时间，是核聚变研究的核心挑战。托卡马克装置的解决思路是用磁场编织一张无形的“牢笼”——超强磁场形成的环形真空室，将等离子体与任何物质壁面隔离，避免装置被高温熔毁。

2026年5月的这轮技术突破，核心成就在于等离子体约束时间的量级跃升。国内托卡马克装置已成功实现等离子体约束时间突破100秒，聚变反应温度达到1.5亿摄氏度。这意味着等离子体在磁场“牢笼”中稳定存在的时长首次跨过百秒门槛，为后续向“稳态运行”——即持续不断的能量输出——奠定了物理基础。

约束时间突破百秒的意义远超数字本身。在核聚变领域有一个专业术语叫“能量约束时间”，它衡量的是等离子体能量衰减的快慢。约束时间越长，意味着等离子体在高温状态维持得越久，碰撞发生聚变的概率就越高。百秒大关的突破，标志着等离子体物理研究从“瞬间闪光”走向“持续燃烧”的关键转折。

温度指标的突破同样震撼。1.5亿摄氏度是太阳核心温度的10倍，足以使任何已知材料瞬间化为蒸汽。托卡马克装置能够在这种极端温度下维持等离子体稳定，依赖的是超导磁体产生的强大磁场。低温超导技术的进步让磁体可以在接近绝对零度（-269℃）下无电阻运行，产生稳定的高强度磁场，成为约束高温等离子体的“定海神针”。

二、仿星器：另辟蹊径的竞争者

就在托卡马克路线高歌猛进之际，另一条技术路线也在悄然崛起。与托卡马克用磁场“动态约束”等离子体不同，仿星器采用了更为复杂的立体扭曲磁场设计，从根本上避免了等离子体不稳定性这一困扰托卡马克多年的难题。

仿星器的概念可以追溯到上世纪50年代，由美国物理学家斯必泽提出。其核心思想是让磁场线在三维空间中形成闭合的螺旋结构，等离子体被这些复杂的磁力线“编织”成稳定的拓扑形态。与托卡马克相比，仿星器不需要强大的等离子体电流来维持约束，这意味着它天然更易于实现稳态运行。

国内仿星器装置已完成初步调试，在等离子体约束效果上展现出独特优势。尽管目前的技术成熟度仍落后于托卡马克路线，但仿星器在“稳态运行”这一终极目标上的潜力不容忽视。两种技术路线的竞争与互补，正在加速推动核聚变从实验室走向商业堆。

值得关注的是，仿星器在过去几年获得了大量私人资本的青睐。马斯克支持的Commonwealth Fusion Systems、贝索斯投资的General Fusion等明星项目，都将仿星器作为主攻方向。这种“明星效应”正在为仿星器路线带来前所未有的资源投入。

三、商业化进程：从“永远还有三十年”到2030年倒计时

“核聚变永远还有三十年”——这是能源界流传甚广的调侃。但2026年的种种迹象表明，这个玩笑可能真的要变成历史了。

过去五年，全球聚变商业化投资总额年均复合增长率高达50%。2026年，这一趋势愈发明显。国内企业正在构建“核聚变实验—装置研发—商业化应用”的完整产业链，技术成果向产业转化的速度明显加快。

等离子体约束、聚变反应控制等关键技术逐步成熟，设备成本在过去五年间降低了40%。成本下降的驱动力来自多个方面：超导材料国产化大幅降低了磁体成本；AI辅助设计让装置优化迭代周期从数年缩短到数月；制造工艺的进步使得精密部件的良率显著提升。

安全监管体系的完善同样至关重要。作为一种全新类别的能源设施，核聚变电站的安全标准此前几乎是空白。近年来，监管部门与科研机构密切协作，正在建立涵盖辐射防护、核材料管理、聚变产物处理等环节的完整规范体系。这为未来的商业化扫清了制度障碍。

业内专家的预测正在变得具体而可期：2030年前后，全球首座商业化核聚变电站将建成投产。这个时间节点并非凭空臆想，而是基于当前技术成熟度、产业链完备程度和投资强度的综合判断。三十年魔咒正在被打破。

四、能源格局的重塑：从电力到工业

核聚变能的应用场景远超普通人的想象。一旦商业化成功，它将深刻重塑全球能源格局。

电力领域是最直接的应用场景。核聚变电站可实现大规模、稳定的基本负荷发电，供电可靠性远超风电、光伏等间歇性可再生能源。更重要的是，聚变反应不产生二氧化碳、PM2.5等污染物，也不存在核裂变的放射性废料问题。一座1000兆瓦的聚变电站，每年可以满足数百万家庭的用电需求，同时减排数百万吨二氧化碳。

工业领域的变革同样深远。高温等离子体产生的热量可以直接用于工业加热、化工生产等高耗能行业。传统工业大量依赖化石能源燃烧提供热能，碳排放占全球总排放的相当比例。核聚变提供的清洁高温热源，有望将这些行业从“碳锁定”中解放出来。

交通领域的潜力更令人期待。核聚变能可以用于氢燃料电池的绿氢生产。电解水制氢需要大量电力，聚变电站提供的清洁电力可以让“绿氢”真正实现零碳排放。这将彻底改变氢能源汽车的经济性，使其与燃油车、电动车形成三足鼎立的竞争格局。

更深远的意义在于资源格局的重塑。当核聚变实现商业化，能源将变得近乎“取之不尽”。地球海洋中蕴藏的氘资源足够人类使用数百亿年，彻底终结化石能源的地缘博弈。能源贫困将不再是问题，人类文明的发展上限将被大幅抬高。

五、技术瓶颈与现实挑战

乐观之余，仍需正视核聚变商业化面临的严峻挑战。

第一是能量增益问题。目前的实验装置消耗的能量仍然大于聚变产生的能量，即Q值小于1。虽然实验已实现了重要的物理突破，但要实现商业化所需的Q值（通常认为需要超过10），还需要在等离子体密度、温度、约束时间三个维度同步提升。

第二是材料难题。聚变装置内部壁面需要承受极端的中子轰击和热应力。聚变反应产生的高能中子携带巨大动能，会使壁面材料发生嬗变、脆化和肿胀。开发能够承受这种极端环境的材料，是核聚变工程化的长期课题。

第三是氚的自持供应。氚是聚变反应的燃料之一，但自然界中氚的储量极微，几乎全部需要人工生产。聚变装置可以用锂与中子反应产氚，但如果要实现燃料的自给自足，需要在装置设计中充分考虑氚增殖区的布置。

第四是经济性门槛。即使技术上可行，核聚变电力的成本仍需与传统能源和可再生能源竞争。乐观估计商业聚变电站的发电成本可能在每度电0.1-0.2美元区间，但仍需通过规模化来验证这一目标。

六、从追赶到引领：中国核聚变的跃迁之路

值得注意的是，在这轮核聚变技术突破中，中国的身影格外显眼。国内托卡马克装置的技术指标已达国际领先水平，仿星器研究也在加速追赶。在全球核聚变专利申请量排名中，中国机构已占据重要位置。

更值得关注的是产业链的完整布局。从超导线材、超导磁体到真空系统、诊断仪器，国内已形成覆盖核聚变装置关键部件的产业链。这意味着即使面对外部技术封锁，中国核聚变发展也拥有足够的自主可控能力。

国际合作与竞争并存也是当前格局的特点。ITER（国际热核聚变实验堆）项目正在推进，中国作为重要参与方承担了多个关键部件的研发制造。与此同时，中、美、欧、日等主要经济体都在加速本国核聚变商业化进程，一场围绕“终极能源”的竞赛已经展开。

结语

一百秒，听起来转瞬即逝。但对于核聚变研究而言，2026年5月的这“一百秒”承载着人类对能源终极梦想的百年追寻。从托卡马克到仿星器，从实验装置到商业堆，从追逐“永远还有三十年”到锚定2030年倒计时，核聚变正在从“科学奇迹”变为“工程必然”。

当然，通往商业化的道路依然漫长而艰难。技术瓶颈、成本压力、材料挑战——每一道难题都需要时间去攻克。但正如一位聚变科学家所言：“我们已经看到了隧道的尽头。”当清洁、无限、安全的能源终极方案成为现实，人类文明将迎来真正的能源自由。

2026年5月19日
光子芯片换道超车：薄膜铌酸锂国产化如何重写半导体规则

2026年5月，中国在光子芯片领域密集传来好消息——华为联合中科院推出全球首款量产光子AI芯片”太极III”，算力提升10倍、能耗降至传统芯片千分之一；国家信息光电子创新中…
阅读更多
从硅的困境到光的突围

当全球芯片产业仍在硅基制程的纳米级竞赛中焦灼时，一场静悄悄的”换道”革命正在光学领域上演。

2026年5月，中国科研团队在光子芯片领域取得的系列突破，被外媒评价为”换道超车”——在传统硅基芯片受制于EUV光刻机供应的背景下，中国选择了一条完全不同的技术路径：用光子代替电子，用光速重新定义算力竞赛的规则。

太极III：华为的光子AI野心

5月中旬，华为联合中科院正式推出全球首款量产光子AI芯片”太极III”。这款芯片的核心性能数据令人震惊——在特定AI推理任务中，算力提升达到10倍，能耗却降至传统芯片的千分之一。

以当下最火的AI大模型推理为例，传统GPU集群每秒处理数亿次矩阵运算，代价是数兆瓦的功耗和庞大的散热系统。而太极III用光子传输替代电子计算，光速级别的运算让同样的任务可以在更短时间内完成，功耗却只有原来的千分之一。换算成实际场景：一个需要10台服务器机柜的AI推理任务，未来可能只需要一个巴掌大小的光子计算模块。

太极III的核心材料是铌酸锂晶体——一种被称为”光学硅”的特殊介质。华为选择这条路，背后是长达五年的技术布局。一位参与研发的工程师透露，太极III的研制难点不在于电路设计，而在于”光路的雕刻”——如何在毫米尺度的芯片上精确操控光信号的传输、调制和路由，光的波长比电子的最小通道还要精细1000倍。

薄膜铌酸锂：被卡脖子的”光学硅”

如果说太极III是光子芯片的”心脏”，那薄膜铌酸锂就是制造这颗心脏的”特殊钢材”。

铌酸锂是一种非线性光学材料，对光信号的调制效率远超传统硅基材料，被业界视为光子芯片的核心衬底。然而，高端铌酸锂晶圆长期被法国立晶（NLM）和日本光子公司垄断，中国在此领域起步较晚。

2026年，这个局面被彻底打破。

光库科技宣布其高端薄膜铌酸锂调制器实现量产，成为国内唯一能够供应这一核心材料的企业，打破了海外企业长达二十年的技术垄断。

更关键的是超晶科技的突破——这家企业实现了从晶体生长、研磨抛光到薄膜制备的全流程工艺闭环，成为全球唯一可规模化量产8英寸高端薄膜铌酸锂晶圆的IDM企业，良率超过95% ，成本却比海外竞争对手低60% 。

天通股份则在国内率先实现8英寸铌酸锂晶圆量产，其光学级晶圆产品已经供不应求，交付周期已经排到2027年——这或许是近年来最甜蜜的”产能焦虑”。

从跟跑到领跑：跨越二十年的追光之旅

回顾中国光子芯片的发展历程，是一段从追赶到并跑、再到部分领域领跑的典型样本。

2000年代初，当西方国家开始布局光子集成技术时，中国还处于”光通信”时代的初级阶段，主要精力放在光纤铺设和设备组装上。转折点出现在2015年前后，武汉光电国家研究中心、华中科技大学光谷实验室、上海交通大学等一批科研机构开始系统性布局薄膜铌酸锂技术。

中国团队采取了一种”农村包围城市”的策略：不追求一步到位的完整技术链，而是先在某个细分环节突破，建立信心，再逐步向上下游延伸。

2022年，华中科技大学团队率先在薄膜铌酸锂制备工艺上取得突破；2024年，国家信息光电子创新中心实现250GHz带宽调制器的批量交付；2026年，太极III的量产标志着中国光子芯片正式从”能用”进入”好用”阶段。

带宽破纪录：光纤通信的新里程碑

在太极III之外，5月还有一项技术突破值得关注：国家信息光电子创新中心自主研发的超宽带光子芯片，以250GHz带宽刷新了同类器件的世界纪录。

目前商用最高规格的硅基调制器带宽大约在60-80GHz左右，这意味着国家信息光电子创新中心的成果在性能上领先了3-4倍。在光纤通信场景中，该芯片实现了单通道传输速度512Gbps的惊人成绩，太赫兹无线传输单通道速度也达到400Gbps，可以同时为86个用户提供8K超高清视频流。

三维光子神经网络：6554TOPS的算力狂想

光子技术的突破不限于AI和通信领域。华中科技大学光谷实验室张新亮、董建绩教授团队联合上海交通大学唐豪团队，研制出全球首款可编程三维光子神经网络芯片。

研究团队采用飞秒激光直写技术，在玻璃内部直接”雕刻”出三维波导网络，并集成74个微型加热器实现可编程控制。张新亮教授将这一结构比喻为”光路立交桥”——光信号可以在三层互通的空间中自由穿梭，使得芯片面积只需随通道数线性增长，突破了传统平面结构的限制。

性能数据显示，这款芯片的理论计算吞吐量高达6554TOPS（每秒万亿次操作），在手写数字识别测试中准确率超过93% 。更重要的是”可编程”特性带来的灵活性——传统光子芯片往往是针对特定任务优化的专用芯片，可编程三维光子神经网络则可以通过软件配置实现不同功能，大幅降低了光子计算的门槛。

换道超车的底层逻辑

为什么光子芯片对中国如此重要？

答案在于一个被反复讨论却始终无解的困境：EUV光刻机。目前全球能够制造7nm以下芯片的厂商，都离不开荷兰阿斯麦的EUV光刻机。由于美国的技术封锁，中国企业获取EUV设备的渠道长期受阻。

光子芯片的价值在于，它根本不需要EUV光刻机。光子芯片的核心工艺是光波导的刻蚀和调制器的制备，这些工艺在普通的深紫外（DUV）光刻机上就能完成。更重要的是，光子芯片对制程的要求远低于电子芯片——130nm甚至更宽的线宽，已经足够支撑高性能光子器件的制造。

当然，这并不意味着光子芯片会完全替代硅基芯片。两种技术各有优势和适用场景：硅基芯片在通用计算、存储等领域仍是绝对主力，光子芯片则在AI推理、通信传输、传感计算等场景展现出独特价值。未来的芯片竞争，更可能呈现”光电融合”的格局——硅基处理基础计算，光子加速特定任务，两种技术协同配合。

产业化前夜的挑战与机遇

尽管进展喜人，中国光子芯片产业仍面临现实挑战。

首先是产能问题。 目前太极III虽然实现了量产，但产能规模与传统GPU相比仍有数量级的差距。要真正支撑起AI算力的需求，产能爬坡是关键。

其次是生态建设。 光子芯片的编程模型、工具链与传统的电子芯片完全不同，需要从底层重新构建软件生态。

第三是标准制定。 目前光子芯片领域尚无统一的技术标准，不同厂商的芯片在接口、封装等方面存在差异，限制了产业链的协同效率。

但挑战的另一面，往往就是机遇。2026年被业内视为薄膜铌酸锂和光子AI芯片的产业化元年。从材料供应商光库科技、超晶科技的订单暴增，到华为太极III的正式量产，这条原本小众的技术赛道正在加速走向主流。

结语

回望2026年5月的这波光子芯片突破，最让人印象深刻的，或许不是某一项具体的技术成果，而是一种战略方向的笃定。

当全球芯片产业在硅基制程的”纳米战争”中陷入内卷时，中国选择了光子这个新方向——不是因为它更容易，而是因为它更有可能带来根本性的突破。

这条路能否走通，现在下结论还为时尚早。但有一点可以确定：那些曾经认为”中国芯片永远落后西方”的人，需要重新审视这个判断了。

在光子芯片这个赛道上，胜负未定。而中国，已经拿到了入场券。

延伸阅读
相关阅读
- 《量子计算三大技术路线并进：2026年中国量子产业正式步入商业化周期》
- 《光子AI芯片商用元年：如何用光速重新定义算力竞赛》
2026年5月18日
推理时计算革命：多智能体协同如何突破AI推理天花板

2026年，AI推理能力提升的核心战场正从训练阶段转向推理阶段。以TMAS、EDO、SPCT为代表的多项重磅研究相继突破，揭示了“推理时计算扩展”的全新路径——通过多智能体…
阅读更多
2026年5月，一系列重磅研究的密集发布，让“测试时计算扩展”（Test-time Compute Scaling）从一个学术概念，迅速跃升为决定大模型竞争格局的核心战场。OpenAI的o1已经证明了“让模型在推理时停下来思考”的巨大价值，而最新的研究正在将这一思路推向更深处：不再是简单的链式推理，而是多智能体协同、探索驱动的优化、以及生成式奖励模型的引入。

这不只是一场技术迭代，更是一次范式革命。

一、从“记忆”到“思考”：推理时扩展的本质

理解推理时计算扩展的价值，首先要理解传统大模型的局限性。

长期以来，大语言模型的工作方式可以被类比为“超级图书馆管理员”：它存储了海量的知识，能够根据用户的提问快速检索并输出答案。这种模式的优势在于速度快、成本低，但问题同样明显——它缺乏真正的推理能力。面对需要多步推导、假设验证、错误回溯的复杂问题时，模型往往只能基于“直觉”给出答案，容易陷入幻觉和逻辑谬误。

测试时计算扩展的核心思路，是将部分计算任务从训练阶段转移到推理阶段。具体而言，当模型面对复杂问题时，它不再直接输出答案，而是生成显式的推理路径，通过自我问答、路径规划、错误回溯来验证逻辑。这个过程类似于人类的“慢思考”——系统性地分析问题、尝试不同解法、纠正错误、最终得出可靠结论。

卡内基梅隆大学的研究明确指出，这种从“快思考”到“慢思考”的范式转换，本质上是将模型的“记忆能力”升级为“思考能力”。模型不再是“被动的知识存储器”，而是“主动的任务求解器”。

二、TMAS：多智能体协同的推理新范式

在推理时计算扩展的道路上，多智能体协同是一个极具前景的方向。2026年5月11日发表于arXiv的论文《TMAS: Scaling Test-Time Compute via Multi-Agent Synergy》提出了一个创新框架，将推理过程组织为多个专业化智能体的协作。

2.1 现有方法的局限

传统的测试时计算方法面临一个根本性矛盾：推理时方法受益于从相对平滑的概率分布中进行多样化采样，而基于强化学习的后训练本质上会锐化这些分布。这导致了一个两难困境——推理时需要保持探索的多样性，而后训练却在强化正确答案的同时压制了探索空间。

现有方法要么无法有效协调并行推理轨迹，要么依赖有噪声的历史信息而没有明确决定应该保留和重用什么，这限制了它们在探索和利用之间取得平衡的能力。

2.2 TMAS的核心架构

TMAS的解决方案是将推理过程组织为协作式多智能体系统。其核心创新包括：

层级记忆机制：TMAS引入了两层记忆结构——经验银行（Experience Bank）和指南银行（Guideline Bank）。经验银行重用低层次的可靠中间结论和局部反馈，而指南银行记录先前探索过的高层策略，用于引导后续推理远离冗余的推理模式。

混合奖励强化学习方案：针对TMAS设计的混合奖励方案，联合保持基础推理能力、增强经验利用、并鼓励探索超越先前尝试的解决策略。这解决了探索-利用平衡的核心问题。

实验结果令人振奋：在具有挑战性的推理基准测试中，TMAS实现了比现有测试时计算基线更强的迭代扩展能力。混合奖励训练进一步提高了迭代扩展的有效性和稳定性。

三、EDO：探索驱动的推理优化

同一天，另一项重要研究《Exploration-Driven Optimization for Test-Time Large Language Model Reasoning》提出了探索驱动优化（EDO）方法，进一步推动了推理时计算扩展的边界。

3.1 核心问题

该研究指出，虽然推理时方法在复杂推理任务上取得了显著进展，但推理-训练矛盾的问题依然存在：推理时的方法受益于多样化采样，而基于强化学习的后训练却会锐化分布。

EDO的核心创新是将探索性目标扩展到迭代后训练中，并将其整合到标准强化学习目标中，鼓励在采样解决方案时保持更大的多样性，同时促进更有效的推理时计算利用。

3.2 技术方案

EDO被整合到迭代直接偏好优化（iDPO）和组相对策略优化（GRPO）中，产生了两个变体：ED-iDPO和ED-GRPO。实验表明，这两个变体都表现出更大的解决方案多样性，特别是在与自洽性等推理时计算技术结合使用时。

关键数据：在三个分布内推理基准测试中，EDO比最强基线提升了1.0-1.3%，在五个分布外任务上额外获得了1.5%的平均提升。除了准确性，EDO还保持了模型熵并稳定了强化学习训练动态，有效防止了过度优化导致的崩溃。

四、DeepSeek SPCT：生成式奖励模型的推理时扩展

在商业研究领域，DeepSeek与清华大学合作提出的SPCT方法同样引人注目。这项研究首次提出通过在线强化学习优化原则和批判生成，实现推理时扩展。

4.1 为什么需要新的奖励模型

现有的奖励模型（RM）在通用领域表现出局限性，特别是在面对复杂、多样化任务时。核心挑战有两个方面：通用RM需要跨领域的高质量奖励，既要灵活性也要准确性；现有RM在推理时扩展性差，无法通过增加计算资源显著提升性能。

4.2 SPCT的三层架构

生成式奖励模型：采用点式生成奖励模型，通过生成文本形式的奖励（如critiques）而非单一标量值，支持灵活输入（单响应、多响应）和推理时扩展。

在线强化学习优化的SPCT：通过两阶段过程训练GRM（生成式奖励模型）：
- 拒绝式微调：冷启动阶段，通过采样和拒绝策略生成初始数据
- 基于规则的在线RL：使用规则化奖励函数优化原则和批判的生成
推理时扩展技术：通过多次采样生成多样化的原则和批判，投票聚合最终奖励，扩展奖励空间。同时训练辅助模型过滤低质量输出，确保推理效率。

五、实测验证：推理时扩展的真实效果

理论框架需要实验数据的支撑。综合多项研究的实验结果，我们可以清晰地看到推理时计算扩展带来的能力跃升。

5.1 复杂推理任务的突破

在数学推理领域，配备推理时计算扩展的模型在AIME等高难度基准测试中取得了突破性进展。OpenAI o1的实验表明，通过让模型在推理时“停下来思考”，其数学能力从上一代模型的约40%提升到了超过80%。

更值得关注的是，这种提升并非来自模型规模的扩大，而是来自推理策略的优化。这意味着，即使是小规模的模型，如果配备了高效的推理时计算机制，也可能在特定任务上超越超大规模模型。

5.2 跨领域泛化能力

EDO的实验结果显示，在分布外任务上，推理时计算扩展同样能够带来稳定提升。五个分布外任务平均获得了1.5%的额外提升，表明这种技术具有良好的泛化能力，而非仅仅对特定基准测试的过拟合。

5.3 效率与效果的平衡

TMAS的实验表明，通过层级记忆机制，模型可以在保持推理质量的同时显著提升效率。经验银行避免了重复计算，指南银行引导推理走向更有前景的方向，整体效率提升可达数倍。

六、产业影响：从技术突破到商业落地

推理时计算扩展的价值不仅体现在学术研究上，更在于其对产业格局的深远影响。

6.1 重新定义模型竞争维度

过去，大模型的竞争主要聚焦于三个维度：参数规模、训练数据量、算力投入。推理时计算扩展引入了一个全新的竞争维度——推理策略的智能程度。这意味着，即使没有最强大的算力资源，通过更聪明的推理机制，小模型也可以在特定场景下与大模型竞争。

这种变化对整个AI产业格局具有深远影响。中小型AI企业看到了通过算法创新弯道超车的可能，而大厂则需要同时在多个维度保持领先，竞争压力骤然增大。

6.2 企业级应用的成本重构

对于企业用户而言，推理时计算扩展带来了成本结构的重构。传统的模式是：训练阶段一次性投入大量算力，推理阶段相对低成本。而新模式则将部分算力消耗从训练转移到推理阶段。

这意味着，企业需要重新评估“模型选择”的成本-效益分析。一个参数规模较小但推理策略更智能的模型，可能比一个超大规模模型更具商业价值，特别是在需要复杂推理能力的场景中。

6.3 新一代AI产品的基础设施

从更长远的视角看，推理时计算扩展将成为下一代AI产品的基础设施。想象一个能够系统性分析复杂商业问题、进行多步财务规划、执行需要数百个子任务的软件项目开发的AI助手——这些场景对推理能力的要求远超当前模型的极限。

推理时计算扩展正是解决这一挑战的关键路径。它让模型能够在推理过程中动态分配算力，对简单问题快速响应，对复杂问题深入思考，实现真正的“智能弹性”。

七、挑战与局限：并非银弹

尽管推理时计算扩展展现出巨大潜力，但我们也需要清醒地认识到其局限性。

7.1 推理长度偏见

2026年5月的最新研究揭示了一个令人担忧的现象：更长的推理轨迹与增加的位置偏见之间存在正相关。在13个具有推理能力的模型配置中，12个表现出推理长度与位置偏见分数之间的正相关，数值从0.11到0.41不等。

这意味着，当模型“思考”更长时间时，它可能更容易受到与内容无关的因素（如答案位置）的影响，而非做出更理性的判断。如何设计有效的去偏策略，是推理时计算扩展需要解决的重要问题。

7.2 创造力限制

另一项研究在CreativityBench基准上评估发现，即使是最先进的模型，在需要创意工具使用的任务上也表现出明显局限性。虽然模型通常能够为创意任务选择合理的物体，但它们在识别正确部件、功能和潜在物理机制方面仍然失败。

这表明，推理时计算扩展主要提升的是“系统性思考”能力，而非“创造性跳跃”能力。对于需要突破性创新的任务，当前的方法仍有局限。

7.3 算力成本的双刃剑

推理时计算的核心思想是用更多推理阶段算力换取更好的结果，但这也意味着推理成本的增加。在大规模部署场景中，如何平衡推理质量和成本效益，仍需要工程层面的持续优化。

八、未来展望：走向通用推理智能

推理时计算扩展的突破，让我们得以窥见AI推理能力的未来轮廓。

从短期看，2026年的重点将是将这些新技术整合到生产级系统中。TMAS、EDO、SPCT等框架的工程化落地，将决定推理时计算扩展能否真正从实验室走向千家万户。

从中期看，多智能体协同推理将成为主流范式。未来的AI系统可能不再是一个单一的“全能模型”，而是由多个专业化智能体组成的“推理团队”，各司其职、协同工作、高效解决复杂问题。

从长期看，推理时计算扩展指向的是一个更宏大的目标——通用推理智能。如果能够将人类的“系统性思考”能力完整地迁移到AI系统中，那么AGI的实现或许不再遥远。

当然，这条道路仍然漫长。推理长度偏见、创造力局限、算力成本——每一个挑战都需要持续的研究和工程努力来解决。但可以确定的是，推理时计算扩展已经证明了自己是一条可行且有价值的路径。

结语

当大模型的参数规模增长开始触及物理极限，当“暴力堆算力”的模式显现出边际效益递减，整个行业开始意识到：AI的下一场革命，可能不在于模型变得更大，而在于模型变得“更聪明”。

推理时计算扩展正是这一趋势的缩影。它不追求更大的参数规模，而是探索更智能的推理策略；不依赖更多的训练数据，而是释放推理阶段的计算潜力；不满足于“快速回答”，而是追求“深度思考”。

这场静悄悄的革命，正在重新定义AI的能力边界。当模型学会“停下来思考”，当多智能体协同解决复杂问题，当推理过程本身成为提升智能的关键——我们正在见证AI从“超级图书馆”向“通用问题解决者”的蜕变。

而这，或许才是人工智能真正的未来。

延伸阅读
- 论文原文：TMAS (arXiv:2605.10344)
- 论文原文：EDO (arXiv:2605.09853)
- DeepSeek SPCT: Inference-Time Scaling for Generalist Reward Modeling
相关术语
- 测试时计算扩展（Test-time Compute Scaling） ：在推理阶段动态分配计算资源以提升模型推理能力的技术范式
- 多智能体协同（Multi-Agent Synergy） ：多个专业化AI智能体协作完成复杂推理任务的方法
- 链式推理（Chain-of-Thought） ：让模型生成显式推理步骤而非直接输出答案的技术
- 探索-利用平衡（Exploration-Exploitation Tradeoff） ：在推理过程中平衡尝试新路径与利用已知有效策略的挑战
2026年5月17日