博客

  • 2026OKX合约交易新手完整入门指南|永续/交割合约、杠杆保证金、实操步骤详解

    2026OKX合约交易新手完整入门指南|永续/交割合约、杠杆保证金、实操步骤详解

    2026年OKX合约交易规则持续优化,梯度杠杆、资金费率、交割机制全面更新,很多新手因不懂基础规则、选错合约类型和杠杆倍数,频繁出现爆仓、亏损问题。本文贴合最新平台机制,从…

    阅读更多

    前言

    合约交易是加密市场中最主流的衍生品交易方式,凭借双向交易、杠杆灵活、资金利用率高的特点,成为多数交易者的核心操作品类。2026年OKX持续迭代合约交易体系,优化梯度杠杆规则、升级保证金风控机制、完善交割清算逻辑,合约生态的稳定性和专业性稳居行业头部。

    但对新手而言,合约交易和现货交易逻辑完全不同,没有弄懂永续与交割的区别、不会区分保证金模式、盲目使用高杠杆,是新手亏损、爆仓的核心原因。本文不堆砌理论,全部以2026年OKX最新实操规则为基准,从基础概念、品类差异、参数选择到完整交易步骤,一站式讲透合约入门核心内容,新手可直接对照实操。

    一、OKX两大合约品类:永续合约VS交割合约(核心区别)

    OKX目前主流合约分为永续合约交割合约两大类,二者交易逻辑、持仓规则、盈亏机制差异极大,适配不同交易风格的用户,也是新手首先要分清的基础知识点。

    1. 永续合约(新手首选)

    永续合约是2026年平台交易量最高、用户适配性最强的合约品类,最大特点是无固定到期交割日、无强制清算时间。在保证金充足、未触发强平的前提下,用户可以无限持仓,自由控制持仓周期,完美适配波段交易、中长期趋势交易用户。

    其核心定价机制为8小时资金费率调节,每天0点、8点、16点结算一次,通过多空资金流转让合约价格持续锚定现货指数价格,大幅减少插针、脱离行情的情况。简单来说,市场多头强势时,多单持有者支付费率给空单;空头强势时,空单支付费率给多单,平衡市场供需。

    2. 交割合约(专业用户适配)

    交割合约带有固定到期周期,2026年OKX保留四类标准周期:当周、次周、当季、次季合约,所有仓位到期后,系统会按照最后一小时指数均价自动差额交割平仓,无法长期持有。

    交割合约无资金费率机制,价格依靠到期收敛现货价格,短期价差波动会大于永续合约。优势是无长期持仓成本,适合短期波段、事件性交易,缺点是存在到期强制交割风险,新手极易因忘记换仓、未及时平仓导致被动结算亏损,更适合有经验的专业交易者。

    3. 新手选型总结

    追求灵活持仓、低风险、适配日常交易,优先选择永续合约;有明确短期周期交易计划、规避资金费率磨损,可小仓位尝试交割合约。

    二、核心参数详解:杠杆倍数与保证金模式

    合约交易的风险和收益,完全由杠杆倍数和保证金模式决定,2026年OKX升级梯度杠杆规则,根据持仓量级动态限制最高杠杆,杜绝超大杠杆带来的极端爆仓风险,规则更规范、风控更严格。

    1. 杠杆倍数选择逻辑

    杠杆的本质是资金借用工具,作用是放大资金利用率和盈亏幅度。OKX主流币种支持1-125x灵活杠杆调节,新手核心铁律:杠杆越低、风险越小

    1-10x低杠杆适合新手练手、长线趋势持仓,爆仓风险极低,容错率高;20-50x中杠杆适合有交易经验的短线用户,兼顾收益与风险;50x以上高杠杆仅适合专业量化、超短线交易者,行情小幅波动即可触发爆仓,新手坚决规避。

    2026年平台新增杠杆梯度保护机制,持仓量越大,系统自动限制最高杠杆,从机制上杜绝大户高杠杆重仓风险,引导用户理性交易。

    2. 两大保证金模式实操区别

    OKX提供逐仓、全仓两种保证金模式,新手务必按需选择,避免不必要的风险:

    逐仓模式(新手推荐):每一个交易对仓位独立占用保证金,单一仓位亏损不会波及账户其他资金,风险完全隔离,亏损上限可控,适合新手分仓试错、小额交易。

    全仓模式(老手专用):动用账户全部可用余额作为仓位保证金,盈利收益更高,但风险完全联动,一旦行情反向波动,全账户资金可能被强平,适合风控能力极强的职业交易者。

    三、2026最新OKX合约开通+完整交易实操步骤

    OKX合约交易无需复杂权限申请,完成基础实名认证即可一键开通,全程5分钟搞定,实操步骤如下:

    第一步:账号准备。登录OKX官方APP/网页端,完成KYC实名认证,开启2FA安全验证,确保账号无风控限制。

    第二步:开通合约权限。进入首页【交易】板块,点击【合约交易】,系统自动弹出开通协议,阅读并确认后,即可激活合约交易功能,无需额外审核。

    第三步:转入保证金。将账户USDT、主流币种划转至【合约账户】,所有合约交易资金独立托管,和现货账户资金隔离,方便风控管理。

    第四步:设置交易参数。选择合约类型(永续优先)、调节杠杆倍数、选择逐仓/全仓模式,新手固定选择低杠杆+逐仓模式。

    第五步:开仓交易。看涨选择【做多】,看跌选择【做空】,输入开仓金额,选择市价或限价委托。市价适合即时成交,限价适合精准控制开仓成本。

    第六步:风控止盈止损。开仓后务必第一时间设置止盈、止损点位,锁定收益、控制亏损,杜绝裸仓交易。

    第七步:平仓离场。达到预期收益或止损点位后,手动平仓了结仓位,完成一次完整合约交易。

    OKX合约交易开通至平仓七步实操流程

    四、新手必避的合约高频误区(2026实操总结)

    第一,杜绝高杠杆重仓。多数新手亏损并非方向判断错误,而是杠杆过高、仓位过重,小幅震荡即可触发爆仓。新手建议单仓仓位不超过账户总资金的10%。

    第二,重视资金费率损耗。长期持仓永续合约,需关注8小时资金费率结算,高频正向费率会持续磨损持仓利润,不适合超长期无脑持有。

    第三,杜绝交割合约忘换仓。交易交割合约需牢记到期时间,临近交割日及时平仓或切换周期,避免被动交割造成不必要亏损。

    第四,禁止裸仓交易。不带止损、逆势加仓、扛单是合约交易三大致命陋习,也是新手快速亏损的核心原因。

    写在最后

    2026年OKX合约交易规则更规范、风控机制更完善,但合约本身属于高风险衍生品,收益与风险始终对等。新手入门的核心不是急于盈利,而是吃透永续与交割的机制差异、熟练掌握杠杆和保证金的风控逻辑、养成带止盈止损的交易习惯。

    合约交易没有捷径,只有稳健的规则和严格的风控。从小杠杆、小仓位、永续合约练手,积累盘感与交易认知,才能逐步建立属于自己的合约交易体系。

    风险提示:本文仅为OKX合约交易实操教学科普,不构成任何交易建议。虚拟货币合约交易波动极大、杠杆风险极高,不受法律保护,用户请理性交易、严控仓位、自行承担交易风险。

  • Claude Mythos 解禁:Anthropic 如何用安全AI“降维打击”GPT-5.5

    Claude Mythos 解禁:Anthropic 如何用安全AI“降维打击”GPT-5.5

    2026年5月16日,Anthropic正式解禁业内号称“最强攻防AI”的Claude Mythos模型。这款主打防御性网络安全的垂直大模型,在卡内基梅隆大学权威实测中,对…

    阅读更多

    2026年,全球AI军备竞赛迎来关键拐点。行业持续数年的“通用参数内卷”正式落幕,取而代之的是垂直场景深耕、专业能力制胜的全新竞争格局。通用大模型的普适性红利见顶,聚焦细分领域、解决硬核专业问题的垂直大模型,正在成为新一轮技术突围的核心赛道。

    5月16日,行业分水岭事件正式落地。在OpenAI官宣上市前最大规模组织架构重组、全力整合通用生态的同一天,Anthropic悄然在Google Cloud Console移除Claude Mythos的“预览版”标签,这款曾因“能力过强、风险极高”被长期封印的顶级安全AI模型,正式全面开放商业化落地。

    这场无声的发布,彻底改写了AI安全赛道的竞争格局,也揭开了垂直大模型对通用大模型的范式级降维打击

    一、被长期封印的“顶级攻防AI”:解禁背后的安全底气

    Claude Mythos的诞生与解禁,堪称近年AI行业最具戏剧性的技术故事。

    2026年4月7日,Anthropic正式推出首款专为防御性网络安全量身打造的旗舰垂直大模型,主打漏洞挖掘、风险研判、攻防复现、安全研判等硬核能力。不同于通用大模型的多元场景适配,Mythos从训练底层就聚焦网络安全攻防,专项攻克零日漏洞挖掘、高危漏洞复现、恶意代码分析等行业难题。

    正因攻防能力过于顶尖,上线初期Anthropic出于风险管控考量,将其严格锁定为Preview预览状态,对外限制开放。行业普遍担忧:若这款超强攻防AI被滥用,或将被用于批量扫描政企机构漏洞、批量生成攻击脚本,引发全域网络安全灾难。

    仅仅一个多月后,Anthropic果断解除封印,背后是其完善的安全管控体系落地。据内部披露,Mythos在正式商用前,完成了数月全方位安全加固迭代,搭建起一套闭环风控体系:包含AI输出内容实时风控、高危操作二次人工核验、敏感行为动态拦截、主流安全工具深度联动等多重防护机制。

    此次解禁绝非简单的权限放开,而是Anthropic在超强能力与可控风险之间找到精准平衡,标志着AI攻防技术正式进入可商用、可监管、可落地的规模化阶段。

    一张解释 AI 安全人才协作新模式的插图

    二、权威实测数据:对GPT-5.5的断层式碾压

    真正让Claude Mythos封神、震动整个AI与网安行业的,是卡内基梅隆大学(CMU)发布的ExploitBench权威攻防测试报告。报告基于41项真实浏览器高危漏洞开展全真场景测试,直面对标当前最强通用大模型GPT-5.5,交出了碾压级成绩单。

    核心实测数据全面对比:

    1、专家人工引导模式:Mythos平均分9.90/16,GPT-5.5仅5.51/16,性能差距近一倍;

    2、最高T1级高危漏洞攻克量:Mythos成功破解21个,GPT-5.5仅完成2个,存在数量级差距;

    3、全自主无人干预模式:Mythos平均分9.55/16,GPT-5.5仅4.30/16,自主作战能力遥遥领先;

    4、模式切换性能衰减:Mythos从人工引导切换全自主后,分数衰减不足0.4分,性能极度稳定;GPT-5.5衰减超1.2分,自主适配能力短板突出。

    整套测试数据直观印证:通用大模型在专业攻防场景下存在天然短板,而Claude Mythos不仅在有人工辅助的场景下战力拉满,更具备极强的全链路自主攻防能力,稳定性、精准度、深度全面碾压GPT-5.5。

    其中一个标杆级案例,更凸显其颠覆性价值:Mythos成功完整复现了CVE-2024-0519高危漏洞。该漏洞复杂度极高,被全球顶尖安全研究员搁置一年之久、始终无法完成完整复现。而Mythos仅通过10轮迭代测试、129次LLM调用、154次工具调用,便独立完成根因分析、异常行为触发、T3沙箱原语获取的全流程闭环操作。

    随后英国AI安全研究所(AISI)的独立复测,再次验证了Mythos的顶尖实力,同时点出其核心短板:极致能力的背后,是运行成本为GPT-5.5的12倍。在120轮以上的长效测试中,Mythos累计算力消耗达36428美元,而GPT-5.5仅需3075美元,二者性价比差异显著。

    三、行业博弈新格局:OpenAI规模化内卷,Anthropic垂直化破局

    将两款模型的迭代节奏,置入2026年AI行业的核心竞争格局中,能清晰看到两大头部厂商截然不同的战略路径与未来胜负手。

    在Anthropic解禁Mythos的同一天,OpenAI官宣公司成立以来最大规模组织架构重组:整合ChatGPT、Codex、开发者API三大核心产品线,成立统一的“核心产品与平台团队”,由联合创始人Greg Brockman全权掌舵产品战略。同时披露关键数据:ChatGPT周活跃用户突破9亿,并加速推进“Super App”战略,整合对话、编程、浏览器三大能力,打造可自主执行复杂数字任务的全能桌面应用。

    OpenAI的核心思路清晰:做大、做全、做规模,依托通用能力、海量用户、全场景覆盖,夯实生态壁垒,为IPO铺路。

    反观Anthropic,始终坚持差异化战略:做专、做深、做极致。放弃通用赛道的同质化内卷,精准切入网络安全这一高壁垒、高价值垂直赛道,用专项技术深耕形成碾压式优势。

    两种战略无绝对优劣,但Claude Mythos的落地,已经证明了一个全新行业事实:垂直专精大模型,可在专业场景下对顶级通用大模型形成降维打击。这并非简单的参数与算力差距,而是训练范式、知识沉淀、场景适配的全方位代差,是AI行业从“万能通用”走向“场景专精”的核心转折。

    四、行业范式转移:垂直化是AI下一轮十年的核心主线

    Claude Mythos的出圈并非偶然,而是AI产业迭代的必然结果。全球大模型竞赛,正在彻底告别持续数年的“参数越大越强”的粗放式增长逻辑。

    过去的AI竞争,聚焦参数规模、上下文长度、多模态通用性,各大厂商疯狂堆算力、扩参数,打造“全能型通用模型”。但行业痛点日益凸显:通用模型看似无所不能,却在金融、安全、医疗、工业等专业细分场景中,深度不足、精度不够、落地困难,难以解决行业硬核问题。

    而Claude Mythos的核心优势,源于垂直领域的先天深耕。训练阶段深度接入全网漏洞数据库、海量恶意代码样本、历年攻防安全报告、权威安全赛事数据,完成网络安全领域的专属知识沉淀与专项能力迭代。这种垂直领域的深度积累,是通用大模型无法通过简单微调弥补的核心壁垒。

    中信证券2026年中期AI行业研报明确指出:5-6月将开启新一轮大模型密集迭代窗口,但迭代方向已彻底切换,从盲目参数膨胀,转向长程智能体、场景垂直化、精准落地化的高质量竞争。AI产业正式告别粗放增长,进入精细化、专业化、场景化的全新发展周期。

    五、成本与价值的双向博弈:高端定位的市场取舍

    高能力必然对应高成本,Claude Mythos的商用落地,也带来了行业核心的价值取舍难题。

    如AISI测试所示,Mythos的算力运行成本是GPT-5.5的12倍,长效复杂场景下的使用成本差距更为悬殊。这也决定了它的市场定位极具针对性,呈现明显的分层适配特征。

    对政企机构、专业安全厂商、大型企业安全运营中心而言,Mythos的高成本完全可控。一次高危零日漏洞的提前挖掘、一次重大网络攻击的提前拦截,可挽回数百万甚至上千万的经济损失,相较于极致的安全价值,算力成本几乎可以忽略不计。

    但对中小微企业、独立安全研究员而言,低成本、高性价比的GPT-5.5,仍是日常安全研判、基础漏洞检测的最优选择。

    Anthropic此次的战略选择十分明确:放弃大众化性价比市场,抢占高端专业安全市场,以极致能力构建独家壁垒,实现差异化竞争,避开与OpenAI通用赛道的正面内卷。

    六、重塑行业生态:AI安全的下一个十年变局

    Claude Mythos的全面解禁,不仅是一款模型的落地,更将彻底重塑网络安全行业的技术形态、人才结构与行业规则,开启AI安全的全新十年。

    首先,重构安全人才协作模式。未来的网络安全防护,将彻底告别“纯人工研判”或“纯AI自动化”的单一模式,形成人类专家+AI智能体的全新协作体系。AI负责海量资产扫描、重复性漏洞检测、高危漏洞自动复现、批量数据分析等机械性工作,人类专家聚焦战略研判、风险决策、攻防创新、体系搭建等高阶工作,人机协同将大幅提升全网安全运营效率。

    其次,加速网安行业AI原生迭代。传统防火墙、入侵检测、漏洞扫描等传统安全工具,迭代速度慢、误报率高、适配性差,短板日益凸显。而Mythos证明,AI原生安全方案可实现全自主攻防研判,能力远超传统工具,未来将逐步替代传统安全设备,成为网络防护的核心基础设施。

    最后,抛出全球AI安全治理的终极命题。当AI具备自主挖掘、复现、利用高危漏洞的超强能力,如何规避技术滥用、防范网络攻击泛滥、守住AI安全底线,成为全球监管的核心难题。目前全球AI与网络安全监管框架,已严重滞后于技术迭代速度。业内普遍预判,未来全球或将出台统一的AI安全约束规则,类似“核不扩散机制”,规范高阶攻防AI的研发与商用落地。

    结语

    Claude Mythos的解禁,是2026年全球AI行业最具里程碑意义的事件之一。它标志着AI竞争逻辑的根本性颠覆:规模红利落幕,垂直价值崛起;通用内卷终结,专业制胜来临

    当OpenAI深陷通用生态整合、冲刺IPO的规模化赛道时,Anthropic凭借一款极致垂直的安全AI,撕开了行业差异化竞争的全新缺口,证明AI的核心竞争力从不在于“参数更大、功能更多”,而在于“解决问题更精准、更专业、更深入”。

    未来的AI竞赛,不再是单一维度的算力与参数比拼,而是场景深耕、技术落地、价值创造的综合博弈。Claude Mythos的出圈已然预示:真正的AI终极竞争力,从来不是无所不能的广度,而是解决硬核问题的深度。

  • 新能源汽车续航突破1500公里?气固电池或将成为新选择

    新能源汽车续航突破1500公里?气固电池或将成为新选择

    中科院大连化物所发布全新气固电池技术,能量密度超过1000Wh/kg,是传统锂电池的4-5倍,可实现新能源汽车续航1500公里。该技术采用镁和氢气替代昂贵锂钴材料,常温常压…

    阅读更多

    想象一下,从上海一路开到北京,全程超过1200公里,中途不需要任何补能。这不是科幻小说,而是2026年5月真实发生的技术突破——中国科学院大连化物所陈萍团队发布的气固电池,用一种全新的技术路线,将新能源汽车续航推向了1500公里的新高度。

    一、为什么我们需要气固电池

    新能源汽车的渗透率在2026年已经突破70%,马路上挂绿牌的车早已不稀奇。但真正让消费者犹豫的,始终是那两个核心问题:续航够不够用充电够不够快

    锂电池技术经过二十多年迭代,磷酸铁锂能量密度已经到了200Wh/kg左右的水平,三元锂好一点,能摸到250Wh/kg。这几年车企疯狂内卷,100度大电池逐渐成为高端车型标配,700公里续航成了”及格线”。但继续往上走,物理瓶颈开始显现——液态电解质体系能承载的锂离子迁移能力有上限,再想提升要么堆更多电池增加重量,要么在材料化学上找到新出路。

    更让人头疼的是安全隐患。锂电池的热失控问题至今没有彻底解决方案。针刺、挤压、高温环境,都可能触发连锁反应。去年某品牌电动车在碰撞后起火的视频在网络上引发轩然大波,让不少消费者对电动车多了一层心理阴影。厂家不得不花大量成本在电池热管理系统上,这又反过来压缩了续航提升的空间。

    这就是气固电池诞生的背景:新能源汽车行业太需要一场技术革命了。

    二、氢电共储:一条从未有人走过的路

    陈萍团队的突破之所以引发轰动,关键在于他们没有在现有技术框架里小修小补,而是从底层原理上重新设计了一套储能机制。

    气固电池的核心概念叫”氢电共储”,这四个字精准概括了它的创新本质。传统锂电池靠锂离子在正负极之间来回迁移存储电能,固态电池在此基础上用固态电解质替代液态电解质,提升了安全性但本质上还是同一套逻辑。气固电池完全不一样——它用镁金属负极配合固态氢化物正极,充放电过程涉及氢气的吸脱附与镁氢化物的可逆转化。

    听不懂没关系,你可以把它想象成一个更精密的”氢电池加锂电池的组合体”。氢气作为能量载体,储存密度极高;镁金属作为反应基底,稳定性极好。两者结合,产生了1+1>2的效果。

    根据大连化物所公布的测试数据,气固电池的能量密度实测超过了1000Wh/kg。这个数字是什么概念?拿特斯拉Model 3搭载的磷酸铁锂电池包做个对比:其系统能量密度大约在160Wh/kg左右,即使算上整包重量也有很大差距。换句话说,气固电池的能量密度是现有主流动力电池的6倍以上

    理论上,搭载这种电池的新能源汽车,续航1500公里是保守数字。如果配合轻量化车身设计和高效电驱系统,实际行驶里程还有进一步上探的空间。

    三、为什么是镁和氢

    选择镁和氢气作为核心材料,不是拍脑袋的决定,而是基于对安全性、成本和供应链的综合考量。

    先说锂的问题。 全球锂资源储量并不算稀缺,但开采和加工高度集中——南美”锂三角”、澳大利亚皮尔巴拉矿、中国的盐湖,各有各的地缘政治博弈。碳酸锂价格这两年坐过山车,从5万一吨涨到60万又跌回来,车企和电池厂商被折腾得够呛。钴更麻烦,70%以上的储量在刚果(金),童工开采和供应链伦理问题一直是行业痛点。

    镁就不一样了。地壳中镁的丰度是锂的上千倍,我国是全球最大的镁生产国,陕西、山西、宁夏的镁厂技术成熟,产能充足。选择镁作为负极材料,既能绕开锂钴的供应链风险,又能在成本上形成显著优势。

    再来看氢气。 很多人对氢能的印象还停留在”易燃易爆”四个字。实际上,氢气在常温常压下的燃爆范围(4%-75%体积浓度)比天然气更宽,换句话说,要达到燃爆条件需要更大比例的泄漏,这在客观上提高了安全性阈值。更重要的是,气固电池里的氢气是以固态形式储存的,不是高压气瓶也不是液态储罐。氢原子被”锁”在镁金属形成的晶格结构里,形成稳定的氢化镁(MgH₂)。想要释放能量?让氢气在特定条件下脱附出来参与反应就行。

    大连化物所的测试视频里,科研人员对气固电池做了针刺实验——钢针直接穿透电池外壳。传统锂电池此时早就冒烟起火,而气固电池安静得像什么都没发生。撞击实验同样如此,剧烈冲击下电池依然稳定。这种本质安全的特性,是液态锂电永远无法企及的优势。

    镁氢材料能量密度突破

    四、从实验室到上路还有多远

    看到这里你可能会问:这么牛的技术,什么时候能买得到?

    客观地说,气固电池目前还处于实验室验证阶段,离量产装车有相当距离。根据业内专家的判断,乐观估计需要5-8年的工程化验证周期。

    第一道坎是功率密度。 能量密度和功率密度往往是一对矛盾。气固电池在能量密度上碾压液态锂电,但放电倍率和快充能力目前还不理想。现有测试数据中,电池在1C充放电条件下表现优异,但想要支持15分钟快充80%这种场景,还需要进一步优化电极结构和反应动力学。

    第二道坎是循环寿命。 锂电池现在循环3000次以上已经稀松平常,固态电池也在向2000次迈进。气固电池目前的循环数据尚未公开,但参考其他新型储能技术的经验,从几百次循环提升到几千次,往往需要数年时间。

    第三道坎是规模化制造。 实验室做出一颗完美的扣式电池是一回事,建成GWh级别的产线是另一回事。镁粉的制备、氢化工艺的控制、电池装配的精密要求,每一个环节都需要重新摸索工程化路径。

    但即便如此,气固电池的发布仍然意义重大。它为动力电池技术指明了一个全新的方向,证明了氢能+固态储氢+金属负极这条路走得通。一旦某个技术路线被验证可行,后续的资本和人才会快速涌入,工程化速度往往会超出预期。

    五、会取代锂电池吗

    每逢新技术亮相,媒体总要问一句”能不能取代旧技术”。这个问题本身就有问题——技术替代从来不是非此即彼的零和游戏。

    锂电池技术本身也还在进化。固态电池预计在2027-2028年实现规模化量产,能量密度有望突破500Wh/kg。锂硫电池、锂空气电池等更长远的技术路线也在同步推进。多种技术并行发展、相互竞争,最终谁主沉浮,由市场和用户说了算。

    气固电池真正的竞争对手,可能不是锂电池,而是同代的其他新技术。谁能率先解决工程化难题、谁能建成低成本量产线、谁能获得整车厂的认可,才是决定市场份额的关键变量。

    对消费者来说,技术路线之争是远在天边的新闻。但有一件事是确定的:驾驶电动车”里程焦虑”的日子,正在进入倒计时。

    六、写在最后

    回顾人类能源史,每一次重大突破都伴随着”不可能”的打破。石油从”危险燃料”到”工业血液”花了五十年,核能从”原子弹”到”清洁电源”花了三十年,锂电池从”索尼便携设备”到”汽车动力”花了二十年。每一次变革初期,都有人嘲笑”不可能”,也有更多人选择相信。

    气固电池的出现,让我们看到了另一种可能性:用全新的化学体系,从根本上解决续航与安全的矛盾。当然,路还很长,但方向是对的。

    当续航不再是问题,当充电速度追平加油体验,当电池安全不再需要担心——电动车的最后一块短板就被补齐了。届时,新能源取代燃油车,将不再是一个需要讨论的议题,而是自然而然发生的事实。

    也许在十年后的某个清晨,你坐进一辆安静的新能源车里,仪表盘显示续航里程”1500+公里”。你想起2026年看到的那条新闻,想起当时还在讨论”电动车能走多远”。嘴角微微上扬,按下启动键,车子平稳地驶向远方。

    那一天,也许并不遥远。

    本文基于2026年5月中国科学院大连化物所公开发布的技术成果及实测数据撰写。

  • B7-H3靶向CAR-Vδ1T细胞:CAR-T治疗实体瘤的破局者

    B7-H3靶向CAR-Vδ1T细胞:CAR-T治疗实体瘤的破局者

    CAR-T细胞疗法在血液肿瘤领域已创造无数奇迹,但面对肺癌、肝癌、胃癌等实体瘤却一直束手无策。2026年5月,国际权威期刊《临床癌症研究》发表重磅研究,科学家通过换用Vδ1…

    阅读更多

    很多人知道CAR-T治疗淋巴瘤、白血病很厉害。2012年,7岁的艾米丽·怀特黑德成为全球首位被CAR-T疗法治愈的孩子,至今已无癌生存超过13年。此后,CAR-T在血液肿瘤领域一路高歌猛进,FDA已批准超过6款CAR-T产品,无数晚期血液肿瘤患者因此重获新生。

    但一到肺癌、肝癌、胃癌这些实体肿瘤,CAR-T就“哑火”了。

    CAR-T为何打不动实体瘤

    这个问题困扰了科学家们整整十年。要回答它,得先了解实体瘤的三道“护甲”。

    第一道:物理屏障。 实体肿瘤像一颗硬壳的果实,外面裹着厚厚的纤维基质和异常增生的血管。普通T细胞根本钻不进肿瘤内部,治疗药物也很难抵达核心区域。就像攻城部队被城墙挡在外面,连门都摸不到。

    第二道:免疫抑制微环境。 即便T细胞千辛万苦挤进去了,肿瘤微环境里充满了抑制性信号——TGF-β、IL-10、腺苷等“免疫刹车”分子,会让CAR-T细胞迅速“躺平”,失去战斗力。有研究显示,进入实体瘤的CAR-T细胞在24小时内就会丧失超过80%的杀伤活性。

    第三道:靶点异质性。 同一个肿瘤里,不同癌细胞的靶点表达差异巨大。有的表达这个抗原,有的表达那个抗原,杀掉一部分,剩下的继续疯狂生长。这就是所谓的“靶点逃逸”,也是实体瘤复发的主要机制之一。

    这三条,条条要命。十年间,无数临床试验试图攻克这些障碍,却始终未能取得实质性突破。CAR-T治疗实体瘤,似乎成了一道“不可解”的方程式。

    三招破解实体瘤困境

    2026年5月15日,《临床癌症研究》在线发表了一项重磅研究。科学家没有在传统CAR结构上继续死磕,而是从两个更底层的地方动刀,给出了一套全新的解决方案。

    第一招:换一种T细胞。

    传统CAR-T使用的是αβ T细胞——这是我们体内最常见的T细胞类型。但这次,科学家选择了一种更“特种兵”属性的细胞:Vδ1 T细胞。

    这是γδ T细胞的一个特殊亚群,约占所有γδ T细胞的10%-50%。与αβ T细胞相比,Vδ1 T细胞有几个显著优势:

    首先,它天然更“认”肿瘤。γδ T细胞不依赖MHC(主要组织相容性复合体)呈递抗原,而是通过NKG2D等受体直接感知肿瘤细胞的应激信号。这种“直觉式”识别让Vδ1 T细胞更容易找到并浸润实体肿瘤。

    其次,它更耐受恶劣环境。肿瘤微环境里的低氧、低pH、高氧化应激对普通T细胞是致命打击,但Vδ1 T细胞在这样的条件下依然能保持较高的活性。

    第三,异体使用风险更低。Vδ1 T细胞不太容易引发移植物抗宿主病(GVHD),这为开发“现货型”异体CAR-T产品扫清了障碍。

    第二招:换一个靶点。

    传统CAR-T治疗血液肿瘤常用的靶点是CD19——这是一种只在B细胞表面表达的蛋白,非常“专一”。但实体肿瘤没有CD19,科学家需要找到新的靶点。

    经过多年探索,B7-H3(CD276)进入了视野。

    这是一种免疫检查点分子,在多种实体肿瘤表面高度表达,包括肺癌、乳腺癌、结直肠癌、胰腺癌、肝癌、胃癌等。而在正常组织中,B7-H3的表达水平相对较低。这意味着它是一个理想的肿瘤相关抗原——既能有效区分肿瘤和正常组织,又能覆盖尽可能多的患者群体。

    更重要的是,B7-H3与肿瘤的恶性程度正相关。表达越高,肿瘤侵袭性越强,预后越差。这反而成了一个优势:那些最难治的晚期实体瘤,恰恰是B7-H3表达最高的。

    第三招:做“现货型”产品。

    传统CAR-T是“私人定制”的:先从患者身上抽血,分离T细胞,基因工程改造,扩增培养,最后回输体内。整个过程需要两到三周,耗资数十万美元。很多晚期患者根本等不起,身体也扛不住。

    这次研究开发的B7-H3 CAR-Vδ1T是“异体”的——来自健康供体,提前生产好,患者来了直接用。这就像从血库调血一样方便,大大缩短了等待时间,降低了治疗门槛。

    三招组合拳攻克实体瘤三道护甲

    临床数据揭示了什么

    这项研究是一项概念验证性临床试验,纳入的受试者均为经过标准治疗失败或不耐受的晚期实体瘤患者,包括肺癌、胃癌、胰腺癌等多种类型。

    结果令人振奋:

    安全性数据理想。 没有观察到高移植物抗宿主病(GVHD)风险,也没有出现严重不可控的免疫风暴——这是异体细胞治疗最担心的两大问题。细胞因子释放综合征(CRS)的发生率和严重程度都在可接受范围内。

    观察到明确的抗肿瘤活性。 在多种实体瘤中,研究者观察到了肿瘤退缩或疾病稳定的案例。这意味着CAR-Vδ1T细胞确实在患者体内发挥了作用。

    当然,这是早期临床研究,样本量还比较有限,后续需要更大规模的数据来确认疗效。但关键在于——这是实体瘤!不是血液肿瘤!这是CAR-T技术诞生以来,首次在实体瘤中观察到令人信服的治疗信号。

    一场迟到十年的突破

    回顾CAR-T技术的发展历程,这项研究的意义怎么强调都不为过。

    2017年,FDA批准了全球首款CAR-T产品Kymriah,开启了细胞治疗的新纪元。此后几年,CAR-T在血液肿瘤领域一路高歌:完全缓解率从30%提升到90%以上,长期生存数据不断刷新,许多原本无药可用的晚期患者获得了治愈的可能。

    但实体瘤始终是那道迈不过去的坎。据统计,全球约90%的癌症死亡来自实体瘤,而CAR-T在实体瘤领域的临床试验成功率长期低于5%。无数药企在这个方向投入巨资,却一次次铩羽而归。

    这次B7-H3 CAR-Vδ1T的研究之所以重要,不是因为它治愈了实体瘤,而是因为它证明了这条路走得通

    它告诉我们:CAR-T打不动实体瘤,不是因为CAR-T这个技术方向错了,而是之前用的“武器”和“打法”不对。换用Vδ1T细胞、选择B7-H3靶点、开发异体产品——这三招组合拳,从根本上重构了CAR-T与实体瘤博弈的逻辑。

    对患者意味着什么

    对于正在经历实体瘤治疗耐药的晚期患者来说,这项研究带来了新的希望。

    传统的治疗路径通常是:手术→化疗→放疗→靶向治疗→免疫检查点抑制剂。一路打下来,等到所有选项都用尽,很多患者和家属会陷入深深的绝望。

    B7-H3 CAR-Vδ1T疗法提供了一种全新的可能性。与其等待,不如先做一件事:了解自己的肿瘤有没有B7-H3高表达。

    基因检测和免疫组化检测可以帮助判断肿瘤的靶点表达情况。如果检测结果显示B7-H3高表达,患者可能从这种靶向治疗中获益。越早检测,越早准备,就越有机会抓住这个新的治疗窗口。

    当然,新药的研发和审批需要时间。从概念验证到上市,可能还需要三到五年。但对于晚期患者来说,保持希望、关注前沿、积极检测,就是在为未来争取机会。

    技术进化的启示

    从更宏观的视角看,这项研究折射出生物医药技术进化的一些规律。

    第一,跨界融合越来越重要。 B7-H3 CAR-Vδ1T的成功,不是单纯的免疫学突破,而是免疫学、肿瘤生物学、基因工程多学科交叉的结果。Vδ1 T细胞的优势,来自对γδ T细胞亚群的深入理解;B7-H3靶点的选择,来自对肿瘤免疫微环境的系统分析;异体产品的开发,则借鉴了器官移植领域的经验。

    第二,“小众”技术有时比“主流”更有潜力。 Vδ1 T细胞在整个人体T细胞库中只占很小的比例,一直不是免疫治疗的主流方向。但正是这个“边缘选手”,解决了αβ T细胞解决不了的问题。科学创新往往就是这样:最有效的解决方案,有时藏在最不起眼的地方。

    第三,“现货型”产品是趋势。 个体化定制CAR-T疗效确切,但成本高昂、等待漫长,难以惠及大多数患者。开发通用型产品是行业共识,但GVHD风险一直是拦路虎。Vδ1 T细胞的低GVHD特性,为解决这个问题提供了新的可能。

    展望:实体瘤CAR-T的下一个五年

    B7-H3 CAR-Vδ1T的突破,为实体瘤CAR-T赛道注入了强大信心。可以预见,未来五年,这个领域将迎来快速发展。

    靶点开发会持续深化。 除了B7-H3,科学家还在探索其他有潜力的靶点,如GPC3(NKG2D配体)、EGFR、HER2等。多靶点联合、CAR-T与免疫检查点抑制剂联用,可能进一步提升疗效。

    细胞来源会更加多元。 除了Vδ1 T细胞,CAR-NK、CAR-γδ T、CAR-M(巨噬细胞)等新型细胞疗法也在快速发展,未来可能出现多种技术路线并存的局面。

    适应症会不断拓展。 当前研究主要集中在肺癌、胃癌、胰腺癌等消化道肿瘤,未来可能拓展到脑肿瘤、骨肉瘤等其他实体瘤类型。

    治疗模式会更加灵活。 不同于传统CAR-T的单次大剂量回输,新型CAR-T可能会采用多次、联合、低剂量的“节拍式”治疗策略,更好地与肿瘤“周旋”。

    癌症治疗走到今天,已经从“无可奈何”变成了“希望渐显”。B7-H3 CAR-Vδ1T细胞的出现,不是终点,而是新的起点。

    对于晚期实体瘤患者来说,活着就有希望。每一次技术突破,都在为这个希望增加砝码。

    参考资料:

    1. Clinical Cancer Research, “B7-H3 targeted CAR-Vδ1 T cells for advanced solid tumors”, Published May 15, 2026
    2. AACR 2026 Annual Meeting Research Abstracts
    3. ASGCT Annual Meeting 2026 – CAR-T Cell Therapy Advances

  • 多智能体”美第奇效应”:AI群体智能如何重塑企业竞争格局

    多智能体”美第奇效应”:AI群体智能如何重塑企业竞争格局

    深入解析AI多智能体系统的”美第奇效应”概念,探讨从单打独斗到群体智能的演进路径,以及企业如何借助数据飞轮构建难以逾越的竞争壁垒。

    阅读更多

    引言:当AI学会”组队”

    2026年的AI领域,一个深刻的变化正在发生:AI智能体不再满足于”单打独斗”,而是开始组建”团队”、形成”联盟”,共同完成复杂任务。这一转变的核心,是多智能体系统(Multi-Agent System)的崛起。

    5月20日,在超聚变探索者大会上,零一万物CEO李开复首次将艺术史上著名的”美第奇效应”引入AI世界,用以描述这种多智能体协同所释放的创新能量。在他看来,当不同专长的AI Agent被放在一起协作、互补乃至对抗时,一种远超单体智能的集体智慧正在涌现——这可能才是AI真正改变商业世界的关键转折点。

    一、从”辅助工具”到”超级员工”:AI的两次跃迁

    要理解多智能体的意义,我们需要先回顾AI在企业中的角色演变。

    第一次跃迁:从工具到助手。以ChatGPT为代表的大语言模型,让AI从”搜索工具”进化为”对话助手”,能够理解自然语言、生成内容、解答问题。这一阶段,AI扮演的是”顾问”角色,人类仍是决策主体。

    第二次跃迁:从助手到执行者。2025年开始,以Claude Code、OpenAI Codex为代表的AI编程智能体,展示了AI不仅能”说”,更能”做”——它们可以自主规划任务、调用工具、编写代码、调试bug。AI开始从顾问升级为能够独立完成端到端任务的”数字员工”。

    第三次跃迁正在发生:多智能体时代。李开复在演讲中描绘了这个新阶段的核心特征——多个AI Agent针对人类给定的目标,自动形成子任务集群,有机互联,构建出一张AI智能体网络。这种”群体智能”,不是简单的一加一等于二,而是在协同中产生”美第奇效应”。

    二、”美第奇效应”:跨领域碰撞的创新加速器

    “美第奇效应”源自文艺复兴时期的佛罗伦萨美第奇家族。这个家族资助了大量来自不同领域、具有不同背景的艺术家、科学家和思想家——达芬奇与米开朗基罗在同一个屋檐下工作,波提切利与布鲁内莱斯基相互启发。这种跨领域的思想碰撞,催生了人类历史上最辉煌的艺术与科学革命。

    李开复将这个概念引入AI多智能体系统,其核心洞察是:认知多样性才能产生真正的创造力

    在传统的单体AI架构中,一个强大的模型试图”通才”,但在面对复杂问题时,它的推理路径往往是线性的、收敛的。而在多智能体架构中,不同专长的Agent被组织在一起:

    • 有的Agent擅长数据分析,能够快速从海量数据中提取规律
    • 有的Agent擅长代码生成,能够将分析结果转化为可执行方案
    • 有的Agent扮演”魔鬼代言人”,专门质疑和挑战其他Agent的结论
    • 有的Agent负责整合输出,确保最终方案的质量和一致性

    当这些Agent在同一个任务中”辩论”、”协作”、”对抗”时,创新的火花更容易迸发。这就像一个投资委员会——单个投资经理可能有盲点,但一群背景各异的专业投资者相互制衡,往往能做出更可靠的判断。

    企业数据飞轮插图 AI协同

    三、多智能体协同的三个阶段

    多智能体并非一夜之间出现,而是经历了三个清晰的演进阶段:

    阶段一:工作流自动化

    最早的AI智能体采用”工作流”模式——人类预先设计好流程,AI按部就班执行。典型的应用场景包括:RPA机器人按照既定规则处理发票、客服聊天机器人按照脚本回复客户。

    这一阶段的局限很明显:AI没有真正的”思考”,只是在执行人类预设的分支逻辑。

    阶段二:强推理能力

    2025年,以OpenAI o1、Claude Opus为代表的新一代模型,展现了强大的推理能力。AI不再仅仅执行指令,而是能够自主规划复杂任务、调用多种工具、在执行中动态调整策略。

    在这个阶段,单个Agent的能力边界被大幅拓展——它可以自主完成”分析需求→制定方案→编写代码→测试验证→修复bug”的完整开发流程。但核心问题仍然存在:单体Agent的智能存在上限,当任务复杂度超过一定阈值,单一模型的”思维”就会陷入局部最优。

    阶段三:多智能体协同

    第三阶段的核心突破,是多Agent协作框架的成熟。2026年,几个关键技术支撑这一跃迁:

    AgentBFT协议:一种去中心化的多Agent共识协议,支持500+异构Agent的自治协同。不同于传统的主从式调度,AgentBFT让每个Agent都能独立决策,同时通过拜占庭容错机制确保整体一致性。

    跨模态工具生态:Model Context Protocol(MCP)等标准化协议,让不同Agent能够无缝调用彼此的工具和服务。一个Agent可以”召唤”另一个Agent的帮助,就像人类专家之间的协作一样自然。

    长期记忆与上下文共享:现代多智能体系统配备了分布式向量-图混合记忆库,不同Agent可以共享历史经验、积累集体智慧。这意味着每次任务的执行结果,都能成为组织”知识资产”的一部分。

    四、企业数据飞轮:竞争壁垒的新来源

    多智能体最深远的影响,可能不在技术层面,而在商业竞争层面。

    李开复提出了一个颇具洞察力的观点:当企业将多智能体嵌入核心业务流程后,分散在各个环节的智能体会共享同一套企业数据,并在协同中不断把执行结果反馈给彼此。一个环节产出的反馈,会成为另一个环节优化决策的依据。数据由此转动起来,形成一个企业内部的专有数据飞轮

    这个飞轮的关键在于专属性

    未来,每一家企业都会部署基座模型和智能体,市场上会有成熟的解决方案。但一家公司在自己业务里沉淀出的数据和协同经验,将是最大的差异化壁垒。就像字节跳动的推荐算法之所以难以复制,不是因为算法本身有多复杂,而是因为它积累了海量的用户行为数据和实时反馈。

    多智能体系统可以加速这个飞轮的形成。当AI Agent在供应链管理、客户服务、财务审核、产品研发等环节协同工作时,每一次执行都在生成有价值的业务数据,每一次反馈都在训练更精准的决策模型。随着时间推移,这套系统对企业的理解越来越深,效率越来越高,新进入者复制的成本也越来越高。

    李开复甚至断言:”多智能体时代企业数据飞轮一旦启动,就会成为企业最深的护城河。”

    五、AI编程临界点:99%的代码将由AI生成

    支撑多智能体快速落地的,有一个关键技术背景:AI编程能力正在跨越临界点。

    在2026年的SWE-bench验证通过率测试中,AI已经可以超越人类工程师的平均水平。与此同时,推理成本却在快速下降——每百万tokens的综合成本已降至数年前的十分之一。

    李开复给出了明确预测:AI代码生成将很快超过人类,最终99%的代码将由AI编写。

    这听起来有些激进,但背后的逻辑很清晰。编码不仅是AI能完成的任务,更是自动化数字行动的技术基石。当AI能够稳定地生成代码、调用工具、操作软件,它就具备了将人类意图直接转化为行动的能力。

    更重要的是,编程能力的突破会反过来加速多智能体的进化。多智能体之间需要协调,而协调需要精确的数字指令——代码。把这个能力交给AI,人类只需要定义目标,AI就能自主完成从规划到执行的完整闭环。

    六、CEO必修课:组织变革的深层挑战

    多智能体的落地,不仅仅是技术问题,更是组织变革问题。

    李开复在演讲中反复强调:”企业AI数智化转型是一把手工程,需要由CEO从顶层设计出发。”这并非危言耸听。

    首先,多智能体改变了组织的权力结构。当AI能够自主完成端到端任务时,中层管理者的”上传下达”职能将被大幅削弱。组织架构可能需要从层级制向网络制转变,每个智能体都是一个独立的生产力节点,直接与其他节点协同,绕过传统的信息传递链条。

    其次,多智能体带来了新的治理挑战。当AI开始自主做决策时,如何确保这些决策符合企业利益?当多个Agent之间出现分歧时,谁来做最终裁决?当系统出现错误时,责任如何界定?这些问题没有标准答案,需要CEO从战略层面做出抉择。

    第三,多智能体需要新的评估体系。传统的KPI考核基于个人贡献,但多智能体的价值在于协同效应——1+1>2的部分如何衡量?李开复提到的”美第奇效应”,本质上是团队认知多样性带来的增量价值,但这种增量很难被传统的绩效考核体系捕捉。

    七、从概念到落地:多智能体的现实应用

    理论之外,多智能体已经开始在真实场景中证明价值。

    金融投资领域:零一万物的多智能体平台组建了”模拟投资委员会”——多个Agent分别扮演宏观经济分析师、行业研究员、风险评估师、量化策略师,在投资决策中相互制衡、相互补充。同时,系统还引入了”红蓝对抗”机制,专门有一个Agent扮演”怀疑论者”,挑战其他Agent的投资逻辑。

    企业服务领域:招商银行接入蚂蚁AaaS平台后,财报分析耗时从3人日压缩至8秒。这背后是多个专业Agent的协同——数据提取Agent负责解析PDF财报,财务分析Agent计算关键指标,风险评估Agent生成风险评级,报告生成Agent输出结构化结论。

    制造业领域:富士康郑州工厂引入基于Hermes-3框架的质检机器人,实现了”缺陷识别+自动分拣+报告生成”的全自主流程。这个系统由多个专业Agent组成——视觉感知Agent负责图像分析,决策Agent负责判断产品是否合格,动作控制Agent负责机械臂操作,数据记录Agent负责质量追溯。

    八、挑战与展望:群体智能的边界

    多智能体系统并非完美无缺。几个核心挑战仍然存在:

    协调成本:当Agent数量增加时,它们之间的通信和协调成本会指数级上升。如何设计高效的协作协议,避免”议而不决”或”过度讨论”,是一个工程难题。

    可解释性:当多个Agent共同做出一个决策时,如何解释这个决策的成因?当结果出错时,如何追溯是哪个Agent的问题?传统的”可解释AI”方法在多智能体场景下面临更大挑战。

    安全与对齐:多个Agent协同时,单个Agent的安全漏洞可能被放大利用。2026年Anthropic Claude Code源代码泄露事件,为整个行业敲响了警钟——如何确保多智能体系统的整体安全性,需要系统性思考。

    人机边界:当AI Agent能够自主完成越来越多任务时,人类的角色应该如何定位?李开复的观点是,人类应该专注于”设定目标”和”判断价值”,而将”执行细节”交给AI。但这需要一个认知转变——许多人可能难以接受从”执行者”到”监督者”的角色转换。

    结语:站在群体智能的起点

    多智能体系统的发展,让我想起了人类进化史上的一个关键时刻:当早期人类从独居动物进化为社会性动物,群体协作带来的生存优势,最终造就了人类文明的辉煌。

    AI正在经历类似的转变。从单体智能到群体智能,不仅是技术架构的升级,更是一种范式的跃迁——AI不再是孤立的工具,而是能够协同、互补、对抗、学习的”数字生命体”。

    李开复将这种转变比作”美第奇效应”,或许有些浪漫,但它指向的洞察是真实的:认知多样性产生创造力,协同放大个体价值,数据飞轮构建竞争壁垒。

    对于企业和个人而言,多智能体时代的生存法则正在改变。企业的竞争,不再仅仅是”谁拥有更强的AI模型”,而是”谁更能有效组织和协调多个AI Agent”;个人的价值,不再是”执行重复性任务的效率”,而是”定义目标、评判价值、创造性解决问题”的能力。

    这或许才是AI真正改变世界的时刻——不是某一项技术突破,而是一种新的”智能组织形式”的出现。就像人类通过群体协作征服了自然,AI通过群体协同,或许正在开启一个全新的智能文明。

    相关阅读

    本文分析了多智能体系统的”美第奇效应”与群体智能的最新发展趋势,为企业AI转型提供参考。文章内容仅供参考,不构成投资建议。

    配图alt描述:多智能体AI系统可视化——多个发光节点组成的协作网络,代表不同AI智能体之间的信息交互与协同决策,体现群体智能的科技感。

  • ASML新一代EUV光刻机量产:芯片制造跨入1.8nm埃米纪元

    ASML新一代EUV光刻机量产:芯片制造跨入1.8nm埃米纪元

    2026年5月,荷兰光刻机巨头ASML宣布新一代High-NA EUV光刻机进入稳定量产阶段。这一里程碑事件标志着芯片制造正式从2nm时代跨入1.8nm、1.4nm的埃米级…

    阅读更多

    2026年5月20日,荷兰光刻机巨头ASML在比利时imec行业峰会上扔下一颗重磅炸弹:新一代High-NA EUV光刻机(型号Twinscan EXE:5200B)正式进入稳定量产阶段。这意味着,人类制造芯片的精度再次跃升,芯片产业正式跨入所谓的“埃米时代”。

    从”纳米”到”埃米”:0.22的跨越意味着什么

    在聊High-NA EUV之前,先得搞清楚一件事——光刻机到底是干什么的。芯片的本质,是在硅片上刻画出几十亿甚至上百亿个微小的晶体管。光刻机就是这个“刻画”过程的核心设备,用极紫外光(EUV)在硅片上“画”出电路图案。精度越高,画出来的晶体管就越小,芯片性能越强、功耗越低。

    ASML目前是全球唯一能量产EUV光刻机的企业,没有之一。而这次量产的High-NA EUV,堪称EUV的“超级升级版”。

    这台机器最关键的突破,是把光学系统的数值孔径(NA)从上一代EUV的0.33大幅提升到0.55。表面看只是0.22的数值增长,但它带来的却是质的改变:

    分辨率提升:单次曝光就能刻出8nm的特征尺寸,比上一代小了1.7倍。这意味着同样面积的芯片上,晶体管密度理论上可以提升2.9倍。

    工艺简化:过去制造3nm、2nm芯片,需要多次曝光、几十道复杂工序。现在有了High-NA EUV,关键层一次曝光就能搞定,工序减少超过30%,芯片良率大幅提升。

    性能飞跃:同等面积下,芯片性能提升约60%,功耗降低约45%。这对于当前AI算力芯片、高端存储芯片来说,简直是久旱逢甘霖。

    0.33到0.55NA数值跃升,三栏直观展现制程飞跃与巨头布局

    量产数据:不是实验室概念,已实战验证

    ASML官方公布的量产数据,全部基于50万片晶圆的实际加工验证,绝非纸上谈兵:

    • 稼动率:当前稳定在80%,2026年底目标提升到90%,已达到大规模量产的成熟标准
    • 产能效率:每小时处理175-185片晶圆,比上一代EUV提升明显,单台年产能可支撑数百万片高端芯片
    • 稳定性:累计加工超50万片晶圆,套刻精度达到0.7nm,各项指标全部达标

    但这台机器的造价同样令人瞠目:单台约4亿美元,折合人民币约27.25亿元,相当于27架波音737的价格。由于技术复杂度极高、供应链要求极严,ASML 2026年全年计划仅出货5-6台,2027年才会逐步提升产能。全球顶尖芯片厂商都在争抢这有限的产能,谁先拿到、拿到更多,谁就能抢占2nm以下制程的先机。

    谁先用上:三大巨头已率先布局

    ASML从2025年底开始向核心客户交付High-NA EUV,目前三家巨头已经装机并进入试产阶段。

    英特尔:首家验收,主攻1.4nm制程。2025年12月,英特尔完成全球首台High-NA EUV的验收,在美国波特兰工厂装机,主要用于Intel 14A工艺(等效1.4nm),目标2027-2028年大规模量产。目前已累计处理超3万片晶圆,进入试产爬坡阶段。

    SK海力士:存储芯片领域的首家部署者。2025年9月在韩国DRAM工厂完成安装,用于下一代HBM(高带宽内存)和先进DRAM,解决AI大模型对高速存储的瓶颈问题。首批HBM芯片预计2026年Q3-Q4正式交付,直接供应英伟达、AMD等AI芯片厂商。

    三星:2026年上半年接收第二台High-NA EUV,部署在美国得克萨斯州泰勒的2nm GAA晶圆厂,用于2nm及以下先进逻辑芯片,与英特尔、台积电正面竞争。

    有意思的是,全球最大芯片代工厂台积电目前明确表示暂不采购High-NA EUV。台积电认为,现有Low-NA EUV通过工艺优化还能支撑到A16制程,暂时不需要花4亿美元买新设备。等未来产能提升、成本下降后,再考虑大规模导入。这种“按需采购”的务实态度,倒是很符合台积电一贯的风格。

    三大变革:全球芯片格局彻底改写

    High-NA EUV的量产,绝不是简单的设备升级,而是从芯片性能、产业分工、竞争格局三个层面,带来颠覆性改变。

    芯片性能:AI算力迎来质变

    对于当前火热的AI产业来说,High-NA EUV的意义非凡。1.4nm制程能让AI芯片塞进更多晶体管,AI训练速度提升50%以上,推理功耗降低一半,直接缓解当前AI大模型“算力不够、功耗太高”的痛点。

    高端存储领域同样受益匪浅。HBM用High-NA EUV制造后,带宽提升30%-50%,延迟大幅降低,成为AI服务器、数据中心的标配。这将彻底解决AI大模型的存储瓶颈问题。

    对普通消费者而言,未来1-2年高端手机、笔记本用上1.4nm芯片后,同样电池容量续航多2-3小时,同样体积性能提升50%,发热控制更好。

    产业分工:马太效应加剧

    先进制程的门槛被进一步拉高。目前全球只有英特尔、三星、SK海力士、台积电四家有实力玩2nm以下制程,其他厂商基本被排除在外。加上单台4亿美元的高昂成本、一条2nm产线超200亿美元的投资,中小芯片厂彻底与先进制程无缘。

    这也意味着,全球芯片代工格局将加速分化:台积电靠现有EUV守住2nm市场,英特尔、三星靠High-NA EUV冲击1.4nm,形成“2nm vs 1.4nm”的双线竞争格局。

    供应链博弈:技术封锁更严

    需要清醒看到的是,High-NA EUV作为当前最顶尖的半导体制造技术,完全禁止向中国大陆出口,连相关零部件、技术服务都被严格限制。这意味着,中国大陆先进制程芯片的自主研发,短期内难以突破2nm以下瓶颈,只能在成熟制程(28nm及以上)持续深耕。

    差距虽然客观存在,但也不必过于悲观。在成熟制程、先进封装、特定芯片设计等领域,中国半导体产业仍有广阔的发展空间。这台机器的量产既是挑战,也是倒逼自主创新的动力。

    理性看待:不是万能神器

    尽管High-NA EUV意义重大,我们也要客观看待它的局限性。

    成本极高,短期难以普及。单台4亿美元,加上良率爬坡、工艺磨合,首批1.4nm芯片的价格注定不菲,只会用在AI服务器、高端HBM等领域,消费电子普及至少要到2028年以后。

    产能有限,供不应求。2026年仅5-6台的出货量,面对全球巨大的需求,产能缺口明显,高端芯片短缺的情况还会持续1-2年。

    工艺复杂,良率提升需要时间。1.4nm制程对工艺控制、材料、环境要求极高,良率从当前的60%-70%提升到90%以上,需要至少1-2年的时间。

    写在最后

    ASML High-NA EUV光刻机的量产,标志着全球芯片制造正式进入埃米级时代。这是半导体产业发展的必然结果,也是AI算力需求爆发的必然选择。

    对全球产业而言,这是一次技术跃迁,也是一次格局洗牌。对中国半导体而言,这既是挑战,也是机遇。我们既要看到差距,也要保持信心,在成熟制程、先进封装、芯片设计等领域持续突破,走出一条适合自己的发展道路。

    毕竟,芯片产业的竞争从来不是百米冲刺,而是一场漫长的马拉松。每一个技术突破,最终都会转化为普通人能感受到的科技进步。

    本文信息来源:ASML官方公告、imec行业峰会公开数据、英特尔/SK海力士/三星官方报道。

  • Google I/O 2026:Gemini Omni世界模型发布,AI从”预测下一个词”跃迁到”预测世界下一状态”

    Google I/O 2026:Gemini Omni世界模型发布,AI从”预测下一个词”跃迁到”预测世界下一状态”

    北京时间5月20日凌晨,谷歌在年度开发者大会Google I/O 2026上正式发布Gemini Omni世界模型,标志着人工智能从”预测下一个词”向”预测世界下一状态”的…

    阅读更多

    2026年5月20日,谷歌在加州山景城举办的Google I/O 2026开发者大会,成为全球AI产业的历史性时刻。谷歌CEO桑达尔·皮查伊在主题演讲中正式宣布:”我们已经进入了Gemini时代。”更重磅的是,全新亮相的Gemini Omni世界模型,以一种全新的技术哲学,重新定义了人工智能的认知边界。

    这不仅仅是一次产品迭代,而是AI范式的根本性转变。

    从”预测下一个词”到”预测世界下一状态”:什么是世界模型

    理解世界模型的意义,首先要搞清楚它与传统大语言模型的核心差异。

    我们人类能够预判扔出去的球会落在哪里,知道杯子掉地上会碎,是因为大脑里有一个对物理世界的”模拟系统”。传统大语言模型靠的是”预测下一个词”——它根据海量文本的统计规律来回答问题,并不真正”懂”物理世界。比如你问”杯子从桌子上掉下来会怎样”,大模型会说”会碎”,那是因为它在文本里见过这句话,而并非真正理解了重力、碰撞和碎裂的因果关系。

    世界模型则完全不同。它做的是”预测下一个世界状态”——它会在内部模拟杯子掉落的全过程,计算出落地时间、破碎角度、碎片飞溅的方向,让AI第一次具备了理解空间、时间、因果和物理规律的能力。

    用更学术的话说,世界模型的核心目标是实现”Next-State Prediction”(下一个状态预测),让AI掌握时空连续性与因果关系,而非仅仅是语言统计规律。这一方向已被杨立昆、Yann LeCun等顶级AI科学家视为通往通用人工智能(AGI)的必由之路。

    技术路线插图,三大路线范式转变示意

    三大技术路线:像素生成、抽象预测与空间智能

    截至2026年初,全球主要玩家在世界模型领域已经形成了三条截然不同的技术路线,代表了完全不同的技术哲学,目前尚无收敛趋势。

    像素生成派:”世界即视频”

    这一派的核心逻辑是通过视频生成技术来模拟世界演化,认为”能够生成逼真视频就意味着理解了物理规律”。代表玩家包括OpenAI Sora、Google Genie 3、阿里HappyOyster。其技术特点是采用Diffusion Transformer架构,强调时序连贯性和画面质量,追求长时长视频生成。这一路线的优势在于直观易懂,直接面向内容创作场景。但短板同样明显:对物理规律的理解停留在表象,难以支撑机器人训练等硬核场景。

    抽象预测派:”世界即因果”

    这一派的代表是Meta V-JEPA 2,由Meta首席AI科学家Yann LeCun主导。其核心逻辑是反对像素级重建,主张学习世界的抽象表征和因果逻辑。V-JEPA 2采用JEPA架构,在潜在空间进行预测而非像素空间,强调因果推理和可解释性,运行速度是英伟达Cosmos的30倍。LeCun认为”真正的世界模型应该是预测未来的抽象大脑”——不预测画面细节,只在潜在空间预测未来的抽象结构。

    空间智能派:”世界即3D”

    这一派的核心观点是真正的世界模型必须理解三维空间和物体关系,能够生成可编辑、可导出的3D资产。代表玩家包括斯坦福World Labs、腾讯HY-World 2.0、NVIDIA Omniverse。腾讯HY-World 2.0的核心差异化在于”可导出性”——生成的3D资产文件可直接用于游戏开发;群核科技则拥有全球最大的空间数据集,推出SpatialLM空间语言模型。这一路线的优势在于可直接用于游戏开发、机器人仿真,工程化落地最快。

    Gemini Omni的颠覆性突破:原生全模态与物理世界理解

    在Google I/O 2026上发布的Gemini Omni,代表了世界模型发展的新高度。谷歌并未将其简单定义为”多模态模型”,而是定位为真正意义上的”世界模型”——能够将任何输入模态(文本、图像、视频、音频)转化为统一的世界表征。Gemini Omni Flash不仅能完美理解各种视听信号,更具备了对物理世界的直观感知能力。

    在大会现场演示中,Gemini Omni已经能够理解动力学规律、动能转换与重力效应——这意味着它不仅”看过”物理现象,而且真正”理解”了物理规律。谷歌直接将该模型应用于前沿机器人的训练中,实现了从”看懂”到”看懂并行动”的跨越。

    更具颠覆性的是,Gemini Omni Flash将推理与内容生成的边界彻底模糊。用户仅通过自然对话,就能让模型将一段氨基酸定格动画短片进行精准编辑——无论是替换背景、调整分镜还是改变角色的物理运动轨迹,模型均能实时渲染输出高品质视频。从技术架构看,Gemini Omni实现了”原生全模态”——通过统一Token化技术,将所有模态映射到同一语义空间,解决了传统多模态模型”模态割裂””交互卡顿””生成失真”的痛点。

    基础设施支撑:TPU 8t与TPU 8i的”双芯片策略”

    Gemini Omni的强大能力背后,是谷歌史无前例的基础设施投入。皮查伊透露,2022年谷歌的资本支出为310亿美元,2026年这一数字将达到1800-1900亿美元,增长了近6倍。

    支撑这一切的是谷歌首次推出的”双芯片策略”:专门用于大规模预训练的TPU 8t,以及针对高并发推理极限优化的TPU 8i。TPU 8t带来了较上一代接近三倍的算力提升,更关键的是,通过底层分布式框架JAX与Pathways的深度重构,谷歌成功在全球范围内无缝串联起超过100万个TPU,实现了跨越多个物理站点的协同训练。这意味着超大规模模型的训练周期从过去的数月缩短至数周。TPU 8i则一击切中了商业化落地的最大痛点——延迟,为上层智能体的实时响应提供了可能。

    应用场景:从视频生成到具身智能

    世界模型的产业价值,正在从实验室走向大规模落地。

    视频生成领域,Sora、Genie 3等已能生成物理一致的长视频,再也不会出现”六根手指””穿模”的bug。自动驾驶领域,特斯拉、Waymo用世界模型模拟极端路况,每天训练相当于人类500年的驾驶经验,提前5-10秒预判路况变化,无干预行驶成功率提升至95%以上。人形机器人领域,在虚拟世界中训练上亿次再迁移到真实机器人,成功率提升81%。工业数字孪生领域,世界模型可模拟工厂产线运行,使故障率降低30%。

    未来展望:万亿级市场的黄金窗口

    从技术突破到产业落地,2026年标志着AI从”会思考”向”能实干”的关键转折。世界模型与具身大脑的融合,正在重新定义AI的终极形态。

    根据智源研究院在《2026十大AI技术趋势》中的判断,行业共识正从语言模型转向能理解物理规律的多模态世界模型。这一转变不仅解决了传统模型的”幻觉”痛点,更通过自动驾驶技术的迁移和工业场景的验证,开启了万亿级市场的历史窗口。

    更重要的是,世界模型正在重构AI的底层逻辑。过去AI靠”堆数据、堆算力”,现在靠”理解规律、推演未来”。它让AI从”只会聊天的工具”,变成了”能在真实世界干活的智能体”。

    当AI真正理解了这个世界,我们的生活和工作方式,都将被彻底改变。而Gemini Omni的发布,只是这场变革的开始。

  • 核聚变装置突破百秒大关:托卡马克升级如何筑起能源终极方案

    核聚变装置突破百秒大关:托卡马克升级如何筑起能源终极方案

    2026年5月,国内托卡马克核聚变实验装置实现重大技术突破:等离子体约束时间历史性突破100秒,聚变反应温度达到1.5亿摄氏度,远超太阳核心温度1500万摄氏度。与此同时,…

    阅读更多

    当人类第一次在实验室里观察到核聚变反应释放的能量时,就意识到这是一把打开能源宝库的钥匙。核聚变的原理并不复杂——模仿太阳内部将氢的同位素氘和氚融合成氦,释放出巨大能量。但要在地球上复刻恒星的炼狱环境并实现可控输出,却让科学家们奋斗了七十余年。2026年5月,这个梦想终于迈出了关键一步。

    一、等离子体约束:托卡马克的百年难题

    核聚变反应需要在极高温度(超过1亿摄氏度)下进行,此时氘氚燃料会变成等离子体状态。如何将这些滚烫的等离子体约束在有限空间内足够长的时间,是核聚变研究的核心挑战。托卡马克装置的解决思路是用磁场编织一张无形的“牢笼”——超强磁场形成的环形真空室,将等离子体与任何物质壁面隔离,避免装置被高温熔毁。

    2026年5月的这轮技术突破,核心成就在于等离子体约束时间的量级跃升。国内托卡马克装置已成功实现等离子体约束时间突破100秒,聚变反应温度达到1.5亿摄氏度。这意味着等离子体在磁场“牢笼”中稳定存在的时长首次跨过百秒门槛,为后续向“稳态运行”——即持续不断的能量输出——奠定了物理基础。

    约束时间突破百秒的意义远超数字本身。在核聚变领域有一个专业术语叫“能量约束时间”,它衡量的是等离子体能量衰减的快慢。约束时间越长,意味着等离子体在高温状态维持得越久,碰撞发生聚变的概率就越高。百秒大关的突破,标志着等离子体物理研究从“瞬间闪光”走向“持续燃烧”的关键转折。

    温度指标的突破同样震撼。1.5亿摄氏度是太阳核心温度的10倍,足以使任何已知材料瞬间化为蒸汽。托卡马克装置能够在这种极端温度下维持等离子体稳定,依赖的是超导磁体产生的强大磁场。低温超导技术的进步让磁体可以在接近绝对零度(-269℃)下无电阻运行,产生稳定的高强度磁场,成为约束高温等离子体的“定海神针”。

    等离子体约束1.5亿摄氏度全球能源格局重塑

    二、仿星器:另辟蹊径的竞争者

    就在托卡马克路线高歌猛进之际,另一条技术路线也在悄然崛起。与托卡马克用磁场“动态约束”等离子体不同,仿星器采用了更为复杂的立体扭曲磁场设计,从根本上避免了等离子体不稳定性这一困扰托卡马克多年的难题。

    仿星器的概念可以追溯到上世纪50年代,由美国物理学家斯必泽提出。其核心思想是让磁场线在三维空间中形成闭合的螺旋结构,等离子体被这些复杂的磁力线“编织”成稳定的拓扑形态。与托卡马克相比,仿星器不需要强大的等离子体电流来维持约束,这意味着它天然更易于实现稳态运行。

    国内仿星器装置已完成初步调试,在等离子体约束效果上展现出独特优势。尽管目前的技术成熟度仍落后于托卡马克路线,但仿星器在“稳态运行”这一终极目标上的潜力不容忽视。两种技术路线的竞争与互补,正在加速推动核聚变从实验室走向商业堆。

    值得关注的是,仿星器在过去几年获得了大量私人资本的青睐。马斯克支持的Commonwealth Fusion Systems、贝索斯投资的General Fusion等明星项目,都将仿星器作为主攻方向。这种“明星效应”正在为仿星器路线带来前所未有的资源投入。

    三、商业化进程:从“永远还有三十年”到2030年倒计时

    “核聚变永远还有三十年”——这是能源界流传甚广的调侃。但2026年的种种迹象表明,这个玩笑可能真的要变成历史了。

    过去五年,全球聚变商业化投资总额年均复合增长率高达50%。2026年,这一趋势愈发明显。国内企业正在构建“核聚变实验—装置研发—商业化应用”的完整产业链,技术成果向产业转化的速度明显加快。

    等离子体约束、聚变反应控制等关键技术逐步成熟,设备成本在过去五年间降低了40%。成本下降的驱动力来自多个方面:超导材料国产化大幅降低了磁体成本;AI辅助设计让装置优化迭代周期从数年缩短到数月;制造工艺的进步使得精密部件的良率显著提升。

    安全监管体系的完善同样至关重要。作为一种全新类别的能源设施,核聚变电站的安全标准此前几乎是空白。近年来,监管部门与科研机构密切协作,正在建立涵盖辐射防护、核材料管理、聚变产物处理等环节的完整规范体系。这为未来的商业化扫清了制度障碍。

    业内专家的预测正在变得具体而可期:2030年前后,全球首座商业化核聚变电站将建成投产。这个时间节点并非凭空臆想,而是基于当前技术成熟度、产业链完备程度和投资强度的综合判断。三十年魔咒正在被打破。

    四、能源格局的重塑:从电力到工业

    核聚变能的应用场景远超普通人的想象。一旦商业化成功,它将深刻重塑全球能源格局。

    电力领域是最直接的应用场景。核聚变电站可实现大规模、稳定的基本负荷发电,供电可靠性远超风电、光伏等间歇性可再生能源。更重要的是,聚变反应不产生二氧化碳、PM2.5等污染物,也不存在核裂变的放射性废料问题。一座1000兆瓦的聚变电站,每年可以满足数百万家庭的用电需求,同时减排数百万吨二氧化碳。

    工业领域的变革同样深远。高温等离子体产生的热量可以直接用于工业加热、化工生产等高耗能行业。传统工业大量依赖化石能源燃烧提供热能,碳排放占全球总排放的相当比例。核聚变提供的清洁高温热源,有望将这些行业从“碳锁定”中解放出来。

    交通领域的潜力更令人期待。核聚变能可以用于氢燃料电池的绿氢生产。电解水制氢需要大量电力,聚变电站提供的清洁电力可以让“绿氢”真正实现零碳排放。这将彻底改变氢能源汽车的经济性,使其与燃油车、电动车形成三足鼎立的竞争格局。

    更深远的意义在于资源格局的重塑。当核聚变实现商业化,能源将变得近乎“取之不尽”。地球海洋中蕴藏的氘资源足够人类使用数百亿年,彻底终结化石能源的地缘博弈。能源贫困将不再是问题,人类文明的发展上限将被大幅抬高。

    五、技术瓶颈与现实挑战

    乐观之余,仍需正视核聚变商业化面临的严峻挑战。

    第一是能量增益问题。目前的实验装置消耗的能量仍然大于聚变产生的能量,即Q值小于1。虽然实验已实现了重要的物理突破,但要实现商业化所需的Q值(通常认为需要超过10),还需要在等离子体密度、温度、约束时间三个维度同步提升。

    第二是材料难题。聚变装置内部壁面需要承受极端的中子轰击和热应力。聚变反应产生的高能中子携带巨大动能,会使壁面材料发生嬗变、脆化和肿胀。开发能够承受这种极端环境的材料,是核聚变工程化的长期课题。

    第三是氚的自持供应。氚是聚变反应的燃料之一,但自然界中氚的储量极微,几乎全部需要人工生产。聚变装置可以用锂与中子反应产氚,但如果要实现燃料的自给自足,需要在装置设计中充分考虑氚增殖区的布置。

    第四是经济性门槛。即使技术上可行,核聚变电力的成本仍需与传统能源和可再生能源竞争。乐观估计商业聚变电站的发电成本可能在每度电0.1-0.2美元区间,但仍需通过规模化来验证这一目标。

    六、从追赶到引领:中国核聚变的跃迁之路

    值得注意的是,在这轮核聚变技术突破中,中国的身影格外显眼。国内托卡马克装置的技术指标已达国际领先水平,仿星器研究也在加速追赶。在全球核聚变专利申请量排名中,中国机构已占据重要位置。

    更值得关注的是产业链的完整布局。从超导线材、超导磁体到真空系统、诊断仪器,国内已形成覆盖核聚变装置关键部件的产业链。这意味着即使面对外部技术封锁,中国核聚变发展也拥有足够的自主可控能力。

    国际合作与竞争并存也是当前格局的特点。ITER(国际热核聚变实验堆)项目正在推进,中国作为重要参与方承担了多个关键部件的研发制造。与此同时,中、美、欧、日等主要经济体都在加速本国核聚变商业化进程,一场围绕“终极能源”的竞赛已经展开。

    结语

    一百秒,听起来转瞬即逝。但对于核聚变研究而言,2026年5月的这“一百秒”承载着人类对能源终极梦想的百年追寻。从托卡马克到仿星器,从实验装置到商业堆,从追逐“永远还有三十年”到锚定2030年倒计时,核聚变正在从“科学奇迹”变为“工程必然”。

    当然,通往商业化的道路依然漫长而艰难。技术瓶颈、成本压力、材料挑战——每一道难题都需要时间去攻克。但正如一位聚变科学家所言:“我们已经看到了隧道的尽头。”当清洁、无限、安全的能源终极方案成为现实,人类文明将迎来真正的能源自由。

  • 光子芯片换道超车:薄膜铌酸锂国产化如何重写半导体规则

    光子芯片换道超车:薄膜铌酸锂国产化如何重写半导体规则

    2026年5月,中国在光子芯片领域密集传来好消息——华为联合中科院推出全球首款量产光子AI芯片”太极III”,算力提升10倍、能耗降至传统芯片千分之一;国家信息光电子创新中…

    阅读更多

    从硅的困境到光的突围

    当全球芯片产业仍在硅基制程的纳米级竞赛中焦灼时,一场静悄悄的”换道”革命正在光学领域上演。

    2026年5月,中国科研团队在光子芯片领域取得的系列突破,被外媒评价为”换道超车”——在传统硅基芯片受制于EUV光刻机供应的背景下,中国选择了一条完全不同的技术路径:用光子代替电子,用光速重新定义算力竞赛的规则。

    太极III:华为的光子AI野心

    5月中旬,华为联合中科院正式推出全球首款量产光子AI芯片”太极III”。这款芯片的核心性能数据令人震惊——在特定AI推理任务中,算力提升达到10倍,能耗却降至传统芯片的千分之一

    以当下最火的AI大模型推理为例,传统GPU集群每秒处理数亿次矩阵运算,代价是数兆瓦的功耗和庞大的散热系统。而太极III用光子传输替代电子计算,光速级别的运算让同样的任务可以在更短时间内完成,功耗却只有原来的千分之一。换算成实际场景:一个需要10台服务器机柜的AI推理任务,未来可能只需要一个巴掌大小的光子计算模块。

    太极III的核心材料是铌酸锂晶体——一种被称为”光学硅”的特殊介质。华为选择这条路,背后是长达五年的技术布局。一位参与研发的工程师透露,太极III的研制难点不在于电路设计,而在于”光路的雕刻”——如何在毫米尺度的芯片上精确操控光信号的传输、调制和路由,光的波长比电子的最小通道还要精细1000倍。

    薄膜铌酸锂:被卡脖子的”光学硅”

    如果说太极III是光子芯片的”心脏”,那薄膜铌酸锂就是制造这颗心脏的”特殊钢材”。

    铌酸锂是一种非线性光学材料,对光信号的调制效率远超传统硅基材料,被业界视为光子芯片的核心衬底。然而,高端铌酸锂晶圆长期被法国立晶(NLM)和日本光子公司垄断,中国在此领域起步较晚。

    2026年,这个局面被彻底打破。

    光库科技宣布其高端薄膜铌酸锂调制器实现量产,成为国内唯一能够供应这一核心材料的企业,打破了海外企业长达二十年的技术垄断。

    更关键的是超晶科技的突破——这家企业实现了从晶体生长、研磨抛光到薄膜制备的全流程工艺闭环,成为全球唯一可规模化量产8英寸高端薄膜铌酸锂晶圆的IDM企业,良率超过95% ,成本却比海外竞争对手低60%

    天通股份则在国内率先实现8英寸铌酸锂晶圆量产,其光学级晶圆产品已经供不应求,交付周期已经排到2027年——这或许是近年来最甜蜜的”产能焦虑”。

    硅基vs光子技术路线对比

    从跟跑到领跑:跨越二十年的追光之旅

    回顾中国光子芯片的发展历程,是一段从追赶到并跑、再到部分领域领跑的典型样本。

    2000年代初,当西方国家开始布局光子集成技术时,中国还处于”光通信”时代的初级阶段,主要精力放在光纤铺设和设备组装上。转折点出现在2015年前后,武汉光电国家研究中心、华中科技大学光谷实验室、上海交通大学等一批科研机构开始系统性布局薄膜铌酸锂技术。

    中国团队采取了一种”农村包围城市”的策略:不追求一步到位的完整技术链,而是先在某个细分环节突破,建立信心,再逐步向上下游延伸。

    2022年,华中科技大学团队率先在薄膜铌酸锂制备工艺上取得突破;2024年,国家信息光电子创新中心实现250GHz带宽调制器的批量交付;2026年,太极III的量产标志着中国光子芯片正式从”能用”进入”好用”阶段。

    带宽破纪录:光纤通信的新里程碑

    在太极III之外,5月还有一项技术突破值得关注:国家信息光电子创新中心自主研发的超宽带光子芯片,以250GHz带宽刷新了同类器件的世界纪录。

    目前商用最高规格的硅基调制器带宽大约在60-80GHz左右,这意味着国家信息光电子创新中心的成果在性能上领先了3-4倍。在光纤通信场景中,该芯片实现了单通道传输速度512Gbps的惊人成绩,太赫兹无线传输单通道速度也达到400Gbps,可以同时为86个用户提供8K超高清视频流。

    三维光子神经网络:6554TOPS的算力狂想

    光子技术的突破不限于AI和通信领域。华中科技大学光谷实验室张新亮、董建绩教授团队联合上海交通大学唐豪团队,研制出全球首款可编程三维光子神经网络芯片

    研究团队采用飞秒激光直写技术,在玻璃内部直接”雕刻”出三维波导网络,并集成74个微型加热器实现可编程控制。张新亮教授将这一结构比喻为”光路立交桥”——光信号可以在三层互通的空间中自由穿梭,使得芯片面积只需随通道数线性增长,突破了传统平面结构的限制。

    性能数据显示,这款芯片的理论计算吞吐量高达6554TOPS(每秒万亿次操作),在手写数字识别测试中准确率超过93% 。更重要的是”可编程”特性带来的灵活性——传统光子芯片往往是针对特定任务优化的专用芯片,可编程三维光子神经网络则可以通过软件配置实现不同功能,大幅降低了光子计算的门槛。

    换道超车的底层逻辑

    为什么光子芯片对中国如此重要?

    答案在于一个被反复讨论却始终无解的困境:EUV光刻机。目前全球能够制造7nm以下芯片的厂商,都离不开荷兰阿斯麦的EUV光刻机。由于美国的技术封锁,中国企业获取EUV设备的渠道长期受阻。

    光子芯片的价值在于,它根本不需要EUV光刻机。光子芯片的核心工艺是光波导的刻蚀和调制器的制备,这些工艺在普通的深紫外(DUV)光刻机上就能完成。更重要的是,光子芯片对制程的要求远低于电子芯片——130nm甚至更宽的线宽,已经足够支撑高性能光子器件的制造。

    当然,这并不意味着光子芯片会完全替代硅基芯片。两种技术各有优势和适用场景:硅基芯片在通用计算、存储等领域仍是绝对主力,光子芯片则在AI推理、通信传输、传感计算等场景展现出独特价值。未来的芯片竞争,更可能呈现”光电融合”的格局——硅基处理基础计算,光子加速特定任务,两种技术协同配合。

    产业化前夜的挑战与机遇

    尽管进展喜人,中国光子芯片产业仍面临现实挑战。

    首先是产能问题。 目前太极III虽然实现了量产,但产能规模与传统GPU相比仍有数量级的差距。要真正支撑起AI算力的需求,产能爬坡是关键。

    其次是生态建设。 光子芯片的编程模型、工具链与传统的电子芯片完全不同,需要从底层重新构建软件生态。

    第三是标准制定。 目前光子芯片领域尚无统一的技术标准,不同厂商的芯片在接口、封装等方面存在差异,限制了产业链的协同效率。

    但挑战的另一面,往往就是机遇。2026年被业内视为薄膜铌酸锂和光子AI芯片的产业化元年。从材料供应商光库科技、超晶科技的订单暴增,到华为太极III的正式量产,这条原本小众的技术赛道正在加速走向主流。

    结语

    回望2026年5月的这波光子芯片突破,最让人印象深刻的,或许不是某一项具体的技术成果,而是一种战略方向的笃定。

    当全球芯片产业在硅基制程的”纳米战争”中陷入内卷时,中国选择了光子这个新方向——不是因为它更容易,而是因为它更有可能带来根本性的突破。

    这条路能否走通,现在下结论还为时尚早。但有一点可以确定:那些曾经认为”中国芯片永远落后西方”的人,需要重新审视这个判断了。

    在光子芯片这个赛道上,胜负未定。而中国,已经拿到了入场券。

    延伸阅读

    相关阅读

  • 推理时计算革命:多智能体协同如何突破AI推理天花板

    推理时计算革命:多智能体协同如何突破AI推理天花板

    2026年,AI推理能力提升的核心战场正从训练阶段转向推理阶段。以TMAS、EDO、SPCT为代表的多项重磅研究相继突破,揭示了“推理时计算扩展”的全新路径——通过多智能体…

    阅读更多

    2026年5月,一系列重磅研究的密集发布,让“测试时计算扩展”(Test-time Compute Scaling)从一个学术概念,迅速跃升为决定大模型竞争格局的核心战场。OpenAI的o1已经证明了“让模型在推理时停下来思考”的巨大价值,而最新的研究正在将这一思路推向更深处:不再是简单的链式推理,而是多智能体协同、探索驱动的优化、以及生成式奖励模型的引入。

    这不只是一场技术迭代,更是一次范式革命。

    一、从“记忆”到“思考”:推理时扩展的本质

    理解推理时计算扩展的价值,首先要理解传统大模型的局限性。

    长期以来,大语言模型的工作方式可以被类比为“超级图书馆管理员”:它存储了海量的知识,能够根据用户的提问快速检索并输出答案。这种模式的优势在于速度快、成本低,但问题同样明显——它缺乏真正的推理能力。面对需要多步推导、假设验证、错误回溯的复杂问题时,模型往往只能基于“直觉”给出答案,容易陷入幻觉和逻辑谬误。

    测试时计算扩展的核心思路,是将部分计算任务从训练阶段转移到推理阶段。具体而言,当模型面对复杂问题时,它不再直接输出答案,而是生成显式的推理路径,通过自我问答、路径规划、错误回溯来验证逻辑。这个过程类似于人类的“慢思考”——系统性地分析问题、尝试不同解法、纠正错误、最终得出可靠结论。

    卡内基梅隆大学的研究明确指出,这种从“快思考”到“慢思考”的范式转换,本质上是将模型的“记忆能力”升级为“思考能力”。模型不再是“被动的知识存储器”,而是“主动的任务求解器”。

    二、TMAS:多智能体协同的推理新范式

    在推理时计算扩展的道路上,多智能体协同是一个极具前景的方向。2026年5月11日发表于arXiv的论文《TMAS: Scaling Test-Time Compute via Multi-Agent Synergy》提出了一个创新框架,将推理过程组织为多个专业化智能体的协作。

    2.1 现有方法的局限

    传统的测试时计算方法面临一个根本性矛盾:推理时方法受益于从相对平滑的概率分布中进行多样化采样,而基于强化学习的后训练本质上会锐化这些分布。这导致了一个两难困境——推理时需要保持探索的多样性,而后训练却在强化正确答案的同时压制了探索空间。

    现有方法要么无法有效协调并行推理轨迹,要么依赖有噪声的历史信息而没有明确决定应该保留和重用什么,这限制了它们在探索和利用之间取得平衡的能力。

    2.2 TMAS的核心架构

    TMAS的解决方案是将推理过程组织为协作式多智能体系统。其核心创新包括:

    层级记忆机制:TMAS引入了两层记忆结构——经验银行(Experience Bank)和指南银行(Guideline Bank)。经验银行重用低层次的可靠中间结论和局部反馈,而指南银行记录先前探索过的高层策略,用于引导后续推理远离冗余的推理模式。

    混合奖励强化学习方案:针对TMAS设计的混合奖励方案,联合保持基础推理能力、增强经验利用、并鼓励探索超越先前尝试的解决策略。这解决了探索-利用平衡的核心问题。

    实验结果令人振奋:在具有挑战性的推理基准测试中,TMAS实现了比现有测试时计算基线更强的迭代扩展能力。混合奖励训练进一步提高了迭代扩展的有效性和稳定性。

    推理时计算扩展技术可视化

    三、EDO:探索驱动的推理优化

    同一天,另一项重要研究《Exploration-Driven Optimization for Test-Time Large Language Model Reasoning》提出了探索驱动优化(EDO)方法,进一步推动了推理时计算扩展的边界。

    3.1 核心问题

    该研究指出,虽然推理时方法在复杂推理任务上取得了显著进展,但推理-训练矛盾的问题依然存在:推理时的方法受益于多样化采样,而基于强化学习的后训练却会锐化分布。

    EDO的核心创新是将探索性目标扩展到迭代后训练中,并将其整合到标准强化学习目标中,鼓励在采样解决方案时保持更大的多样性,同时促进更有效的推理时计算利用。

    3.2 技术方案

    EDO被整合到迭代直接偏好优化(iDPO)和组相对策略优化(GRPO)中,产生了两个变体:ED-iDPO和ED-GRPO。实验表明,这两个变体都表现出更大的解决方案多样性,特别是在与自洽性等推理时计算技术结合使用时。

    关键数据:在三个分布内推理基准测试中,EDO比最强基线提升了1.0-1.3%,在五个分布外任务上额外获得了1.5%的平均提升。除了准确性,EDO还保持了模型熵并稳定了强化学习训练动态,有效防止了过度优化导致的崩溃。

    四、DeepSeek SPCT:生成式奖励模型的推理时扩展

    在商业研究领域,DeepSeek与清华大学合作提出的SPCT方法同样引人注目。这项研究首次提出通过在线强化学习优化原则和批判生成,实现推理时扩展。

    4.1 为什么需要新的奖励模型

    现有的奖励模型(RM)在通用领域表现出局限性,特别是在面对复杂、多样化任务时。核心挑战有两个方面:通用RM需要跨领域的高质量奖励,既要灵活性也要准确性;现有RM在推理时扩展性差,无法通过增加计算资源显著提升性能。

    4.2 SPCT的三层架构

    生成式奖励模型:采用点式生成奖励模型,通过生成文本形式的奖励(如critiques)而非单一标量值,支持灵活输入(单响应、多响应)和推理时扩展。

    在线强化学习优化的SPCT:通过两阶段过程训练GRM(生成式奖励模型):

    • 拒绝式微调:冷启动阶段,通过采样和拒绝策略生成初始数据
    • 基于规则的在线RL:使用规则化奖励函数优化原则和批判的生成

    推理时扩展技术:通过多次采样生成多样化的原则和批判,投票聚合最终奖励,扩展奖励空间。同时训练辅助模型过滤低质量输出,确保推理效率。

    五、实测验证:推理时扩展的真实效果

    理论框架需要实验数据的支撑。综合多项研究的实验结果,我们可以清晰地看到推理时计算扩展带来的能力跃升。

    5.1 复杂推理任务的突破

    在数学推理领域,配备推理时计算扩展的模型在AIME等高难度基准测试中取得了突破性进展。OpenAI o1的实验表明,通过让模型在推理时“停下来思考”,其数学能力从上一代模型的约40%提升到了超过80%。

    更值得关注的是,这种提升并非来自模型规模的扩大,而是来自推理策略的优化。这意味着,即使是小规模的模型,如果配备了高效的推理时计算机制,也可能在特定任务上超越超大规模模型。

    5.2 跨领域泛化能力

    EDO的实验结果显示,在分布外任务上,推理时计算扩展同样能够带来稳定提升。五个分布外任务平均获得了1.5%的额外提升,表明这种技术具有良好的泛化能力,而非仅仅对特定基准测试的过拟合。

    5.3 效率与效果的平衡

    TMAS的实验表明,通过层级记忆机制,模型可以在保持推理质量的同时显著提升效率。经验银行避免了重复计算,指南银行引导推理走向更有前景的方向,整体效率提升可达数倍。

    六、产业影响:从技术突破到商业落地

    推理时计算扩展的价值不仅体现在学术研究上,更在于其对产业格局的深远影响。

    6.1 重新定义模型竞争维度

    过去,大模型的竞争主要聚焦于三个维度:参数规模、训练数据量、算力投入。推理时计算扩展引入了一个全新的竞争维度——推理策略的智能程度。这意味着,即使没有最强大的算力资源,通过更聪明的推理机制,小模型也可以在特定场景下与大模型竞争。

    这种变化对整个AI产业格局具有深远影响。中小型AI企业看到了通过算法创新弯道超车的可能,而大厂则需要同时在多个维度保持领先,竞争压力骤然增大。

    6.2 企业级应用的成本重构

    对于企业用户而言,推理时计算扩展带来了成本结构的重构。传统的模式是:训练阶段一次性投入大量算力,推理阶段相对低成本。而新模式则将部分算力消耗从训练转移到推理阶段。

    这意味着,企业需要重新评估“模型选择”的成本-效益分析。一个参数规模较小但推理策略更智能的模型,可能比一个超大规模模型更具商业价值,特别是在需要复杂推理能力的场景中。

    6.3 新一代AI产品的基础设施

    从更长远的视角看,推理时计算扩展将成为下一代AI产品的基础设施。想象一个能够系统性分析复杂商业问题、进行多步财务规划、执行需要数百个子任务的软件项目开发的AI助手——这些场景对推理能力的要求远超当前模型的极限。

    推理时计算扩展正是解决这一挑战的关键路径。它让模型能够在推理过程中动态分配算力,对简单问题快速响应,对复杂问题深入思考,实现真正的“智能弹性”。

    七、挑战与局限:并非银弹

    尽管推理时计算扩展展现出巨大潜力,但我们也需要清醒地认识到其局限性。

    7.1 推理长度偏见

    2026年5月的最新研究揭示了一个令人担忧的现象:更长的推理轨迹与增加的位置偏见之间存在正相关。在13个具有推理能力的模型配置中,12个表现出推理长度与位置偏见分数之间的正相关,数值从0.11到0.41不等。

    这意味着,当模型“思考”更长时间时,它可能更容易受到与内容无关的因素(如答案位置)的影响,而非做出更理性的判断。如何设计有效的去偏策略,是推理时计算扩展需要解决的重要问题。

    7.2 创造力限制

    另一项研究在CreativityBench基准上评估发现,即使是最先进的模型,在需要创意工具使用的任务上也表现出明显局限性。虽然模型通常能够为创意任务选择合理的物体,但它们在识别正确部件、功能和潜在物理机制方面仍然失败。

    这表明,推理时计算扩展主要提升的是“系统性思考”能力,而非“创造性跳跃”能力。对于需要突破性创新的任务,当前的方法仍有局限。

    7.3 算力成本的双刃剑

    推理时计算的核心思想是用更多推理阶段算力换取更好的结果,但这也意味着推理成本的增加。在大规模部署场景中,如何平衡推理质量和成本效益,仍需要工程层面的持续优化。

    八、未来展望:走向通用推理智能

    推理时计算扩展的突破,让我们得以窥见AI推理能力的未来轮廓。

    从短期看,2026年的重点将是将这些新技术整合到生产级系统中。TMAS、EDO、SPCT等框架的工程化落地,将决定推理时计算扩展能否真正从实验室走向千家万户。

    从中期看,多智能体协同推理将成为主流范式。未来的AI系统可能不再是一个单一的“全能模型”,而是由多个专业化智能体组成的“推理团队”,各司其职、协同工作、高效解决复杂问题。

    从长期看,推理时计算扩展指向的是一个更宏大的目标——通用推理智能。如果能够将人类的“系统性思考”能力完整地迁移到AI系统中,那么AGI的实现或许不再遥远。

    当然,这条道路仍然漫长。推理长度偏见、创造力局限、算力成本——每一个挑战都需要持续的研究和工程努力来解决。但可以确定的是,推理时计算扩展已经证明了自己是一条可行且有价值的路径。

    结语

    当大模型的参数规模增长开始触及物理极限,当“暴力堆算力”的模式显现出边际效益递减,整个行业开始意识到:AI的下一场革命,可能不在于模型变得更大,而在于模型变得“更聪明”。

    推理时计算扩展正是这一趋势的缩影。它不追求更大的参数规模,而是探索更智能的推理策略;不依赖更多的训练数据,而是释放推理阶段的计算潜力;不满足于“快速回答”,而是追求“深度思考”。

    这场静悄悄的革命,正在重新定义AI的能力边界。当模型学会“停下来思考”,当多智能体协同解决复杂问题,当推理过程本身成为提升智能的关键——我们正在见证AI从“超级图书馆”向“通用问题解决者”的蜕变。

    而这,或许才是人工智能真正的未来。

    延伸阅读

    • 论文原文:TMAS (arXiv:2605.10344)
    • 论文原文:EDO (arXiv:2605.09853)
    • DeepSeek SPCT: Inference-Time Scaling for Generalist Reward Modeling

    相关术语

    • 测试时计算扩展(Test-time Compute Scaling) :在推理阶段动态分配计算资源以提升模型推理能力的技术范式
    • 多智能体协同(Multi-Agent Synergy) :多个专业化AI智能体协作完成复杂推理任务的方法
    • 链式推理(Chain-of-Thought) :让模型生成显式推理步骤而非直接输出答案的技术
    • 探索-利用平衡(Exploration-Exploitation Tradeoff) :在推理过程中平衡尝试新路径与利用已知有效策略的挑战