博客

  • Claude Opus 4.7自主AI科研突破:人工智能首次在科研竞赛中超越人类专家

    Claude Opus 4.7自主AI科研突破:人工智能首次在科研竞赛中超越人类专家

    2026年5月,Prime Intellect实验室完成了一项划时代的实验:让Claude Opus 4.7和GPT-5.5 Codex在完全无人干预的情况下,自主参与na…

    阅读更多

    一场没有裁判的竞赛:AI向人类发起的科研挑战

    2026年5月,一项在完全无人干预下完成的实验,将人工智能推过了科研自主化的“卢比孔河”。

    美国AI初创公司Prime Intellect进行了一场独特的实验:他们将Claude Opus 4.7和基于GPT-5.5的Codex部署在H200算力集群上,切断了所有人类指导,让这两个顶级AI自主参与一项名为“nanoGPT速通”的基准测试竞赛。实验消耗了1.4万小时的H200算力,进行了约1万次迭代,产生了239亿Token的思考轨迹。

    最终,Claude Opus 4.7以2930步的成绩夺得第一,Codex以2950步紧随其后,双双超越了由人类顶尖开发者Keller Jordan保持的2990步世界纪录。

    这一结果让整个AI学术界为之震动。

    固定规则下的极致博弈:nanoGPT速通为何重要

    nanoGPT速通是由Keller Jordan发起的一项AI基准测试,其规则设计极为严苛,被业界形象地比喻为“把两个棋手关进房间,棋盘固定、棋子固定,只能改下棋策略,看谁先赢”。

    具体来说,这项测试有三大硬性约束:模型架构固定为1.24亿参数的nanoGPT,训练数据完全固定,参赛者唯一能调整的只有优化器与超参数。这意味着参赛者必须深入理解深度学习的底层机理,通过精妙的参数调节来榨取模型的最大性能。

    在传统观念中,这类任务被视为人类专家的专属领域。因为优化器的设计需要深厚的数学功底、对模型行为的直觉把握,以及在无数可能性中做出正确选择的判断力。然而,Prime Intellect的实验证明,在特定约束条件下,AI已经具备了超越这些人类专家的潜力。

    Prime Intellect为AI搭建了一套完整的自主科研框架:AGENTS.md定义行为规范,goal.md锁定目标,plan.md记录策略演化,scratchpad存储中间草稿。这套框架让AI能够在没有人类实时指导的情况下,自主开展长期的探索性研究。

    AI与人类专家科研性能对比图示

    两种截然不同的AI“性格”:优等生与推土机

    在自主运行过程中,两个顶级AI展现出了截然不同的“性格”与效率瓶颈。

    Claude Opus 4.7表现得像一位“谨慎的优等生”。即使被要求自主运行,它仍然频繁暂停并索要指令,陷入“得出结论→请求指导→等待”的循环,未能充分利用算力窗口。其指令遵循能力虽然较前代有显著提升,但过度谨慎的态度影响了计算效率。

    相比之下,Codex更像一台“数字推土机”。它从不停止,持续横扫参数空间,在相同超参数曲面上卡住数小时进行大量无效搜索,将Token消耗在错误路径上。这种“蛮力”策略虽然低效,但也展现出了AI在持续探索方面的独特优势。

    最终,Claude Opus 4.7给出的获胜方案是一个由复杂参数堆叠而成的“迷宫”。那些关于初始化缩放、学习率按角色拆分的微小变动,在人类眼中显得支离破碎,但结果冰冷而确凿:比人类最优方案快了60步。

    更值得关注的是,Claude Opus 4.7在新的tokenizer升级中,几乎完全避免了中文Token的额外消耗,通胀主要发生在英文上,而中文token数大量维持在1.000×。这一细节表明,顶级AI在跨语言处理方面已经达到了令人惊叹的精细程度。

    科研范式的根本转变:从“试错实验”到“理性设计”

    中国科学院院士李景虹指出:“人工智能正成为科学研究的新范式。”他认为,AI正从辅助工具升级为重要的科研基础设施和科研驱动力。

    唐波院士进一步阐述,人工智能正将科学研究从经验驱动的“试错实验”时代推向模型主导的“理性设计”时代。这一转变的意义远超单一的技术突破。

    传统的科学研究依赖于科学家的个人经验、直觉和反复实验。这种方法虽然在历史上取得了巨大成功,但也存在明显的局限性:人类的工作时间有限,注意力会疲劳,且难以同时处理海量变量。而AI驱动的研究方法则可以24小时不间断运行,通过大规模并行探索发现人类难以察觉的模式和关联。

    Prime Intellect的实验首次在严格受控的竞赛环境中验证了这一范式转变的可行性。当AI能够在专业竞赛中击败人类专家时,我们不得不重新审视“科研能力”的定义。

    开源生态与全球竞争新格局

    Prime Intellect完全开源了实验代码与过程记录,项目主页与代码仓库可供全球社区复现与验证。这种开放的态度不仅体现了科学精神,也降低了研究门槛,让更多机构能够参与到自主AI科研的探索中来。

    在全球竞争中,中国AI生态系统正展现出独特的路径优势。Prime Intellect的实验显示,中国实验室从每单位算力中榨取的智能是原始扩展定律预期值的4至7倍。通过技术创新,如将注意力缓存压缩93%,中国AI持续提升效率,在特定任务上展现出与国际顶尖模型比肩的能力。

    与此同时,开源模型如Kimi K2.6在性能媲美西方顶尖模型的同时,凭借成本优势迅速获得市场青睐。Claude Opus 4.7每百万输出Token定价25美元,而Kimi K2.6仅需约4美元,性价比优势突出。这种差异正在重塑全球AI服务的商业模式。

    商业化路径:按Token计费的科研新模式

    Prime Intellect采用了创新的计费模式:在其开放的Lab平台上,训练按Token计费而非按GPU时长。这一模式为未来大规模自主实验提供了成本可控的路径。

    传统的GPU时间计费模式存在明显的效率问题:GPU在等待指令或执行低效操作时同样计费,导致资源浪费。而按Token计费则将激励结构转向结果导向,AI系统有更强的动力优化自身效率,减少无效计算。

    这种商业模式创新,与技术突破同样重要。它为自主AI研究的商业化提供了可行的收入模型,有望吸引更多资本和人才进入这一领域。

    技术瓶颈与未来展望

    尽管取得了突破性进展,当前的自主AI研究仍面临诸多挑战。

    首先是效率问题。Claude Opus 4.7的“过度谨慎”表明,当前的AI系统在自主决策方面仍有改进空间。如何平衡探索与利用、冒险与安全,是下一代AI系统需要解决的核心问题。

    其次是可解释性问题。Claude Opus 4.7给出的获胜方案虽然有效,但其背后的逻辑对人类来说几乎是不可理解的。在某些高风险应用场景中,这种“黑箱”特性可能带来难以预见的风险。

    第三是通用性局限。nanoGPT速通是一个高度结构化的任务,参赛者可以清楚地定义目标和评价标准。但在更开放的科研问题中,目标本身往往是不明确的,评价标准也可能随研究进展而调整。当前的自主AI系统在这些场景中的表现仍有待验证。

    展望未来,Prime Intellect的实验为我们描绘了一幅令人振奋的图景:当算力与算法持续进化,自主AI科研的浪潮才刚刚兴起。药物研发、材料设计、气候建模等复杂领域,都可能成为AI大显身手的舞台。

    结语:一个新的开始

    Claude Opus 4.7在nanoGPT速通竞赛中的胜利,不是一个终点,而是一个新的起点。

    它证明了在特定约束条件下,AI具备超越人类专家的优化潜力。更重要的是,它验证了“模型主导的理性设计”这一新科研范式的可行性。当AI能够自主设计实验、分析数据、迭代方案时,科学研究的生产力将迎来指数级提升。

    当然,这一变革也带来了深刻的哲学问题:当AI在科研领域超越人类时,人类的角色将如何定义?或许,答案在于人类与AI的协作——人类提供愿景和价值判断,AI提供计算能力和模式识别。这种协作模式,可能才是科研未来的最佳形态。

    无论如何,2026年5月的这一天,已经被载入了人工智能发展的史册。

    图片alt描述

    封面图:Claude Opus 4.7 – AI科研突破图,展示神经网络与人类智慧的交汇融合

  • 气固氢负离子电池:常温常压储氢技术如何改写氢能产业格局

    气固氢负离子电池:常温常压储氢技术如何改写氢能产业格局

    2026年5月,中国科学院大连化学物理研究所陈萍团队在《焦耳》期刊发表重磅成果——全球首例气-固氢负离子原型电池。该技术突破困扰氢能产业半个多世纪的储氢瓶颈,实现常温常压下…

    阅读更多

    氢能的”卡脖子”难题

    氢能被誉为人类的”终极能源”,它燃烧只产生水,零碳排放、能量密度极高——1升海水提取的氘聚变能量相当于300升汽油。更重要的是,氢气可以从太阳能、风能等可再生能源电解水制备,被视为实现”双碳”目标的关键抓手。

    然而,氢能虽好,”储存”却一直是产业化的最大痛点。

    传统储氢方式有两条路:高压气态储氢和液态储氢。前者需要将氢气压缩到350至700个大气压——相当于把氢气塞进一个承受7000米水压的容器里,这对储罐材质要求极高,安全隐患大、成本居高不下;后者则需要将氢气冷却到零下253摄氏度深冷液态,液化过程本身就消耗30%以上的能量,且低温设备复杂、蒸发损失难以避免。

    这两条路都让氢能的”最后一公里”走得格外艰难。数据显示,储氢成本占氢能全产业链成本的近三分之一,成为氢能推广普及的核心制约因素。

    一块会”呼吸”的电池

    2026年5月,中国科学院大连化学物理研究所传来消息:陈萍团队在《焦耳》期刊上发表论文,宣布成功研发气-固氢负离子原型电池。这项技术用一种全新的思路解决了储氢难题——它让氢气在常温常压下就能安全、高效地”储存”和”释放”。

    这块电池的原理说起来颇具科幻色彩:它像一块能够”呼吸”的电池。

    放电时,电池吸入氢气,通过电化学反应将氢气转化为电能输出,同时把氢以金属氢化物的形式安全”锁”在电极材料中——这就是”吸氢”的过程,也是储存能量的过程。

    充电时,外接电源通入电能,驱动金属氢化物中的氢释放出来——这就是”放氢”的过程,同时电极材料恢复金属形态,为下一轮储存做好准备。

    整个过程在常温常压下就能进行,不需要高压容器,不需要深冷设备。实验数据显示,这块电池的能量利用效率高达93.9%,比传统热化学储氢方式提升了三分之一以上。

    更令人惊喜的是,这块电池具有极强的环境适应性。它能在零下20摄氏度到90摄氏度的宽温域内正常工作,这意味着无论是在寒冷的北方冬季,还是在高温的工业环境中,它都能稳定运行。特别是在一些环境复杂的偏远地区——比如没有电网覆盖的风电场、光伏电站——这种”氢电共储”的特性可以大显身手,实现分布式氢能的储存与利用。

    三种储氢技术效率对比图

    原创突破背后的科学逻辑

    这项技术的核心创新在于氢负离子传导机制。传统认知中,氢在电池中通常以质子(H⁺)的形式存在和迁移。但陈萍团队另辟蹊径,利用氢负离子(H⁻)在特定固体材料中的传导特性,实现了全新的储氢机制。

    具体来说,团队开发了一种新型的金属氢化物基电极材料。在这种材料中,氢负离子可以在晶格中稳定存在,同时保持良好的离子传导性。当电池放电时,外部氢气在电极表面解离为氢原子,进而形成氢负离子并嵌入材料晶格;充电时,这个过程可逆进行,氢负离子脱离晶格重新结合为氢气分子。

    “这项技术的本质是’氢电一体化’——既可以储能发电,又可以储存氢气。”国际智能运载科技协会秘书长张翔评价道,”它为破解困扰氢能产业半个多世纪的储氢难题提供了全新思路,是一项具有原创性和颠覆性的技术突破。”

    从产业角度看,这项技术有几个关键优势值得关注:

    第一,能量效率大幅提升。 93.9%的能量利用效率,意味着每一次储存和释放氢气,只有不到7%的能量损失。相比之下,传统高压气态储氢效率约80%,液态储氢效率约75%,氢负离子电池的优势非常明显。

    第二,安全性能显著改善。 常温常压工作意味着不再需要动辄数百大气压的高压容器,也不需要零下两百度的深冷设备。从源头消除了高压泄漏和低温冻伤的风险。

    第三,适用场景更加灵活。 宽温域工作特性使其可以部署在各种地理环境和气候条件下,从东北的严寒到西北的酷热,从海岛到沙漠,都能稳定运行。

    第四,与可再生能源天然契合。 氢负离子电池可以与风电、光伏等间歇性可再生能源配合——在发电过剩时用电制氢储存,在发电不足时氢气发电输出,实现”绿电-绿氢-绿电”的完美闭环。

    储氢赛道的”中国力量”

    气-固氢负离子电池并非中国储氢技术突破的孤例。事实上,2026年已成为中国储氢技术集中爆发的元年。

    就在这一技术成果发布的同一时期,我国首个百万方级盐穴储氢示范工程在河南平顶山正式投产。这个工程能够储存150万标准立方米氢气,关键设备实现100%国产化,标志着大规模物理储氢技术迈出关键一步。与气-固氢负离子电池的”材料路线”不同,盐穴储氢走的是”地质路线”——利用地下盐穴的空间储存高压氢气。

    两条技术路线各有侧重、互为补充。气-固氢负离子电池更适合分布式、小规模的氢能储存场景,比如为单个建筑或社区供能;盐穴储氢则适合大规模、跨季节的战略性储备,为区域氢能供应网络提供”压舱石”。

    更值得关注的是,这些技术突破正在撬动整个产业链的协同发展。从储氢材料、核心装备到下游应用,一批关键技术正在实现国产化替代。以气-固氢负离子电池为例,其核心材料的国产化率已超过80%,这为后续的规模化推广奠定了坚实基础。

    产业专家指出,随着气-固储氢、盐穴储氢、液态储氢、有机液态储氢等多种技术路线并行推进,中国正在构建一个多层次、多场景的储氢技术体系。这不仅为国内氢能产业发展提供了技术保障,也为全球氢能技术进步贡献了”中国方案”。

    从技术突破到产业落地还有多远

    尽管气-固氢负离子电池的技术突破令人振奋,但从实验室走向产业化,仍需要跨越几道门槛。

    首先是规模化放大问题。 目前的原型电池还停留在实验室级别,单次循环的储氢量有限。如何将实验室成果转化为可以商业化量产的电池产品,需要解决材料批量制备、电堆集成、系统优化等一系列工程化难题。

    其次是寿命与稳定性问题。 实验室条件下可以达到高效率,但实际应用中需要面对数千甚至上万次循环的考验。金属氢化物材料在反复吸放氢过程中会逐渐粉化、衰减,如何提升循环寿命是下一步研究的重点。

    第三是成本控制问题。 新型材料的成本目前仍较高,需要通过材料优化、工艺改进、规模效应等多途径降低成本,使其在经济性上能够与传统储氢方式竞争。

    第四是标准与认证问题。 新技术需要建立完整的标准体系和认证规范,才能进入市场的”通行证”。这需要产学研用各方协同推进。

    不过,从历史经验看,能源技术的成熟曲线往往呈现”S”形——早期发展缓慢,一旦突破临界点就会进入快速普及阶段。业内普遍预计,气-固氢负离子电池有望在2030年前后实现小规模商业化应用,在2035年前后进入规模化推广阶段。

    氢能社会的愿景正在照进现实

    回顾人类能源史,每一次重大突破都伴随着储能技术的革新。煤炭时代,蒸汽机解决了能量的固定式使用问题;石油时代,内燃机让能量可以随身携带;电气时代,电池让能量变成可移动的”商品”。

    而氢能时代,需要解决的正是”氢”的储存与运输问题。当这个瓶颈被突破,氢能将真正从”能源选项”变成”能源主角”。

    想象一下未来的场景:西北的戈壁滩上,万台风机整齐排列,发的电一部分并入电网,一部分用来电解水制氢;氢气通过管道或槽车运往各地,一部分进入工业领域作为原料,一部分进入交通领域为氢燃料电池车供能,还有一部分进入千家万户作为清洁燃料;在一些偏远的海岛或山区,气-固氢负离子电池组成的分布式储能系统,正在为当地提供稳定、清洁的电力供应……

    这样的场景或许并不遥远。随着储氢技术的持续突破和氢能产业链的不断完善,氢能社会正在从愿景走向现实。

    而中国科学院大连化物所陈萍团队的这项原创性成果,或许就是通往这个氢能时代的一把关键钥匙。它证明了在储氢这个”世纪难题”面前,中国科学家已经找到了新的突破口。接下来的任务,就是把实验室里的成功,转化为改变世界的力量。

    参考资料:中国科学院大连化学物理研究所陈萍团队《焦耳》期刊论文、河南平顶山盐穴储氢示范工程相关报道

  • 首次实现人工细胞不对称分裂:中科院《自然》重磅突破如何改写合成生物学

    首次实现人工细胞不对称分裂:中科院《自然》重磅突破如何改写合成生物学

    中国科学院化学研究所团队联合国内外科学家,首次实现人工细胞形态与功能的不对称分裂,这一成果于2026年5月13日发表在《自然》期刊。该突破利用瞬态化学不均一与界面能梯度诱导…

    阅读更多

    一、一颗细胞如何”生”出两个不同的自己

    生命的奇妙,从一颗受精卵分裂开始。一个细胞变成两个,两个变成四个——但这绝不是简单的复制。干细胞分裂后,有的变成神经元,有的变成心肌细胞,它们的命运从不对称分裂那一刻就已注定。这种让”相同”变成”不同”的能力,是生命生长发育的核心基础,也是困扰科学界数十年的未解之谜。

    长期以来,研究人员试图在实验室里复刻这一过程,但人工合成的细胞始终缺乏”不对称”的能力——它们只能一分为二地复制自己,却无法像天然细胞那样,分裂出形态、功能各不相同的子代。这道鸿沟,阻碍着人类对生命本质的理解,也制约着合成生物学和再生医学的发展。

    2026年5月13日,中国科学院化学研究所乔燕、王树研究团队联合国内外多支科研力量,在《自然》期刊发表重磅论文,首次实现了人工细胞形态与功能的不对称分裂。这项成果不仅填补了化学、材料与合成生物学交叉领域的技术空白,更为人类探索生命起源、开发新型生物医药和智能传感技术开辟了全新道路。

    二、”剥离式”分裂:让机器也学会”偏心”

    要理解这项突破的难度,得先了解天然细胞不对称分裂的精妙机制。在真实的生命体中,细胞内部存在精密的空间组织和功能分区——细胞核位于特定位置,细胞器各有其位,细胞膜上的蛋白质呈不对称分布。这种空间的不均等,直接决定了分裂后两个子细胞的命运差异。

    然而,人工合成的细胞——学名叫”合成细胞”或”人工细胞”——通常是均匀的液滴结构。内部没有空间区隔,自然也无法实现”不对称”。正因如此,人工细胞的不对称分裂,长期以来被业界视为”世界性研究难题”。

    中科院团队的解决思路出人意料:既然天然细胞靠内部结构实现不对称分裂,那就让人工细胞也”长出”结构。

    他们提出了”瞬态化学不均一、界面能梯度诱导不对称分裂”的新思路。具体做法是:首先制备含有特殊物质的液滴,利用化学反应在液滴内部制造出化学成分的梯度分布;然后通过酶催化反应,触发液滴表面的形变——表面逐渐凹陷,形成类似”核—壳”的界面分界;最终,液滴分裂成两种完全不同的结构:一种是液晶液滴,另一种是多层囊泡。

    “就像一颗种子分裂成了果实和根茎,它们虽然来自同一个母体,但形态和功能完全不同。”论文通讯作者乔燕这样形容这一过程。

    人工细胞不对称分裂过程可视化插图

    三、为什么”碱性磷酸酶”是关键钥匙

    在这项研究中,碱性磷酸酶扮演了至关重要的角色。当研究人员将这种酶加入人工细胞后,它开始催化液滴内部的化学反应,消耗特定底物,产生磷酸盐离子。这些离子的释放会导致液滴内部的化学环境发生变化,形成浓度梯度。

    更关键的是,化学反应还会改变液滴表面的张力分布。张力低的地方更容易拉伸,张力高的地方则保持稳定。这种张力的不均衡,最终驱动液滴表面发生形变——就像有人在气球表面按压,气球会向一侧凹陷。

    随着凹陷逐渐加深,液滴最终被”撕裂”成两个独立的部分。但这次的”撕裂”并非简单的对半分开,而是形成了两种截然不同的结构:一个是内部有序排列的液晶液滴,另一个是外部包裹、内部空心的多层囊泡。

    “这就像掰开一颗石榴,里面的籽排列方式和外面果皮的形态完全不同,但它们本是一体。”王树研究员解释道。

    四、实验揭示的通用规律

    初步成功之后,研究团队开始追问:这种不对称分裂是”巧合”还是”必然”?能否通过调控条件,实现对分裂方式的精准控制?

    一系列实验给出了令人振奋的答案。

    研究团队发现,通过调节金属离子浓度、酸碱度,或者更换核苷酸物质,都能成功触发不对称分裂。这说明这一机制具有很强的通用性,不依赖于某一种特定的化学反应。

    更有趣的发现是:只有具备”结构化层状液晶有序结构”的人工细胞才能完成不对称分裂。那些内部结构混乱的无序液滴,在遭遇相同条件时,只会直接解体,而非分裂。

    “这揭示了一个重要规律:结构决定功能。”乔燕强调,”没有内部结构的有序化,就无法实现功能上的不对称。”

    更重要的是,分裂后的子代细胞竟然”继承”了母体的某些活性物质。更进一步,两个子细胞还出现了功能区分:液晶液滴形态的子细胞,主要负责稳定储存物质;囊泡形态的子细胞,则倾向于向外释放所承载的分子。

    这种”代际功能差异”,与天然细胞的不对称分裂高度相似,意味着人工细胞第一次真正具备了”分化”的能力。

    五、从生命起源到精准医疗

    这项突破的意义,远不止于技术层面的创新。它的影响,将渗透到生命科学、医学和材料学的多个领域。

    探索生命起源的新实验模型

    生命是如何从无序走向有序的?第一个细胞是如何实现功能分化的?这些问题困扰了科学家上百年。传统研究只能依赖化石记录或计算机模拟,但中科院团队的人工细胞模型,提供了一种全新的实验手段。

    通过人为设计化学条件,观察人工细胞如何从对称走向不对称,如何实现功能分化,科学家得以在实验室里”重演”数十亿年前可能发生的故事。

    生物医药的新可能

    在药物递送领域,不对称分裂的发现带来了新思路。如果人工细胞能够精准地”分配”物质——一个子细胞储存药物,另一个子细胞释放药物——那么设计更智能的给药系统就成为可能。

    此外,研究中涉及的脂质体、囊泡等结构,本身就是重要的药物载体。理解它们如何形成、如何分裂,有望帮助研究人员设计出更高效的纳米药物递送平台。

    智能传感的新材料

    分裂产生的液晶液滴和多层囊泡,对温度、光照、化学物质等外部刺激具有不同的响应特性。这意味着它们可以被设计成”智能传感器”——通过检测分裂产物的变化,推断环境中的特定物质浓度。

    这种应用场景,包括环境监测、食品安全检测和医疗诊断等多个领域。

    六、为什么中国团队能率先突破

    值得注意的是,这项成果由中科院化学所主导,联合了美国、德国、新加坡等多国科学家。那么,为什么中国团队能在这一领域率先取得突破?

    首先,学科交叉是核心优势。不对称分裂涉及化学、材料科学、生物学和计算科学的多学科交叉。中科院化学所是国内少有的在界面化学、软物质科学和合成生物学领域均有深厚积累的研究机构,这为跨学科研究提供了土壤。

    其次,长期积累是关键基础。乔燕、王树团队在液滴界面化学和人工细胞构建方面已有十余年的研究历史。从最初的简单液滴,到后来的功能化液滴,再到如今的具备空间结构的人工细胞,每一步都是在前人基础上的稳步推进。

    第三,国际合作提供了多元视角。这项研究邀请了美国加州大学、欧洲分子生物学实验室等机构的科学家参与,不同文化背景的思维方式碰撞,激发了创新灵感。

    七、挑战与展望

    尽管取得了重要突破,研究团队也清醒地认识到,距离真正模拟天然细胞的不对称分裂还有很长的路要走。

    目前的分裂效率、产物纯度和可重复性,仍需进一步优化。如何将这一技术从实验室规模放大到工业生产水平,也是亟待解决的问题。

    此外,人工细胞与天然细胞的融合,是另一个值得关注的方向。如果人工细胞能够与活体细胞进行物质交换或信号传递,将为再生医学和组织工程开辟新的可能性。

    “我们的目标不是模仿生命,而是理解生命,最终创造服务于人类的新体系。”乔燕表示。

    结语

    从《自然》期刊发表,到科学界的高度关注,中科院化学所这项关于人工细胞不对称分裂的研究,向世界展示了中国科学家在基础研究领域的原创能力。它不仅回答了一个困扰学界多年的科学问题,更为生物医药、智能材料乃至生命起源的探索,提供了全新的工具和思路。

    当一颗人工合成的液滴学会了”偏心”,人类对生命本质的理解,或许也将迎来一次不对称的分叉。

  • 理想自研马赫M100芯片:1280TOPS算力背后的数据流架构革命

    理想自研马赫M100芯片:1280TOPS算力背后的数据流架构革命

    2026年5月12日,理想汽车正式发布自研车规级AI芯片马赫M100,采用台积电5nm工艺,峰值算力达1280TOPS。更值得关注的是,这款芯片彻底抛弃传统冯·诺依曼架构,…

    阅读更多

    一、官宣即炸场:参数拉满背后的行业震动

    2026年5月12日,理想汽车扔出一颗技术深水炸弹——自研车规级AI芯片马赫M100正式官宣。这不是一款简单的“期货芯片”,而是已经具备量产能力、即将在旗舰车型L9 Livis上实现装车的硬核产品。

    先看这组硬核参数:

    • 制程工艺:台积电5nm车规级工艺
    • 峰值算力:1280 TOPS(INT8)
    • 首发车型:理想L9 Livis(双芯片协同,总算力2560 TOPS)
    • 有效算力:单芯片是英伟达Thor-U的3倍,双芯片协同可达5-6倍

    这组数据意味着什么?目前市面上绝大多数车载AI芯片的单颗算力还在500-1000 TOPS区间徘徊,而理想直接用一颗芯片就刷新了行业天花板。更关键的是,这不是通过堆算力单元实现的“暴力美学”,而是通过架构层面的范式革命实现的“精准打击”。

    业界对此反应强烈。车规级芯片长期被Mobileye、高通、英伟达等国际巨头把持,国产替代方案要么性能不足、要么功耗感人、要么车规认证难产。而马赫M100的发布,第一次让国产车载AI芯片在算力维度站上了与头部玩家正面交锋的位置。

    二、架构大换血:从“仓库搬运”到“高速流水线”

    如果只是算力参数的提升,马赫M100还不足以让整个行业为之震动。真正让这款芯片具有划时代意义的,是其底层架构的颠覆性创新。

    传统冯·诺依曼架构的“死穴”

    理解这个突破,需要先弄清楚传统AI芯片的工作方式。以GPU为代表的传统芯片,沿用的是冯·诺依曼架构——计算单元和存储单元是分离的。数据需要不断在“仓库”(内存)和“工人”(计算单元)之间来回搬运:算一次,搬一次;算得越多,搬得越累。

    这带来的结果是:延迟高、功耗大、效率低。就像一个工厂,原料要反复进出仓库,浪费大量时间和人力成本。对于需要实时响应的自动驾驶场景来说,这种架构天生存在瓶颈。

    数据流架构的“降维打击”

    马赫M100选择了一条完全不同的技术路线——动态数据流架构。其核心理念是:数据驱动,而非指令驱动。

    编译器提前规划好所有数据的流动路径,数据从上一个计算单元完成处理后,直接、无损地流向下一个计算单元。整个过程“全程不进仓库,不绕弯路”。就像一条高度自动化的流水线,每个工位只需要专注于自己手头的活,物料自动送达,产品自动流转。

    这种架构的优势是全方位的:

    表格

    对比维度传统GPU架构马赫M100数据流架构
    数据搬运频繁访问外部内存无需外部内存访问
    延迟高(毫秒级)低(200-300毫秒端到端)
    能耗高(数据搬运耗能大)同功耗下降低40%
    效率受限于带宽瓶颈计算资源利用率更高

    官方数据显示,在同等功耗下,M100的推理延迟降低了35%,能耗减少了40%。这对于对能效极其敏感的电动车来说,意味着更强的性能释放和更扎实的续航表现。

    ISCA认证:汽车企业的学术“高光时刻”

    衡量一项技术创新含金量的最好标尺,是学术界是否认可。理想汽车关于数据流架构的论文,被2026年国际计算机体系结构大会(ISCA)工业分会正式录用。

    ISCA是计算机体系结构领域全球最顶级的学术会议之一,与MICRO、HPCA并称为“体系结构三大会”。历年入选论文多来自英特尔、AMD、NVIDIA、高通等芯片巨头,以及斯坦福、MIT等顶尖高校。理想汽车是全球第一家以第一作者身份入选ISCA工业分会的汽车企业。

    这意味着什么?意味着理想不是在“PPT造芯”,而是真的在底层架构层面做出了具有学术价值的创新突破。

    马赫M100数据流架构对比示意图

    三、用户体验重构:从“辅助驾驶”到“预判式安全”

    技术参数再漂亮,最终还是要落到用户体验上。马赫M100对普通车主意味着什么?

    自动驾驶:从“反应”到“预判”的质变

    当前量产的L2+级辅助驾驶系统,本质上还是“反应式”的——传感器检测到障碍物,系统做出刹车或转向反应。而马赫M100搭配理想自研的3D ViT三维视觉模型,能够实现更高维度的环境感知和预测。

    端到端延迟缩短至200-300毫秒,这意味着车辆的决策响应速度比人类驾驶员快将近一倍。在遇到紧急情况时,系统能够在你“反应过来”之前就完成风险评估和规避动作。

    智能座舱:从“功能机”到“智能体”的跨越

    车载语音助手“秒回”、复杂指令一次听懂执行、车机系统“越用越聪明”——这些体验的背后,是强大算力对车载大模型的支撑。M100能够轻松运行端侧大模型,让车机从“执行固定指令的工具”进化为“理解你、记住你、主动服务你的智能伙伴”。

    更重要的是,可编程特性让芯片能够跟随AI算法一起持续迭代。现在的旗舰车型,两三年后可能因为算力不足而“落伍”。而M100的目标是让车辆在全生命周期内都能享受最新的AI能力。

    四、为什么要自研:理想的底层逻辑

    看到这里,可能有人会问:英伟达、Mobileye的芯片不好用吗?为什么要花四年时间、投入这么大成本去自研?

    第一,摆脱“卡脖子”的战略必然

    外购芯片,意味着核心技术掌握在别人手里。高昂的专利费和采购成本是一方面,更关键的是——技术迭代节奏和功能定义权都在供应商手中。想加个新功能?芯片不支持,只能等供应商下一代产品。这种被动,在智能化竞争日趋白热化的当下,是致命的。

    理想的判断是:智驾系统的差异化竞争力,必须建立在自主可控的硬件底座之上。否则,你永远是在别人的框架里做“定制开发”。

    第二,软硬一体才是体验最优解

    苹果的A系列芯片+iOS系统组合,为什么在性能和体验上始终领先?因为芯片、系统、软件三方是深度协同设计的,每个指令的执行路径都经过全局优化。

    理想正在复刻这条路径:芯片、大模型、操作系统、整车硬件,四位一体自主研发、深度打通。只有这样,才能把硬件性能压榨到极致,把用户体验打磨到“刚刚好”。

    第三,长期主义的成本账

    自研芯片前期投入巨大,但量产后单颗成本将显著低于外购方案。更重要的是,通过自研建立的技术壁垒,能够在竞争中形成真正的差异化优势——这是花钱买不到的护城河。

    五、行业启示:从“中国制造”到“中国定义”

    理想M100的意义,远不止于一款新芯片的发布。

    过去十年,中国汽车工业走过了“市场换技术”的弯路,也经历了“新能源换道超车”的阵痛。但在核心芯片领域,国产替代更多时候是在“替代”——用性能打折的国产方案填补供应链空白,而非真正在技术上与国际玩家正面竞争。

    马赫M100的出现,改变了这一定律。它不是低端替代,而是顶级水准的正面对决:5nm工艺、1280TOPS算力、行业第一的学术认可——这些标签放在一起,代表的不是“够用”,而是“领先”。

    从产业逻辑看,这是国产汽车工业从“集成创新”走向“原生创新”的标志性事件。当一家成立不到十年的新势力车企能够在核心硬件领域拿出世界级的技术成果时,意味着中国汽车产业的创新范式正在发生根本性转变。

    当然,挑战依然存在。芯片从“发布”到“量产装车”再到“经受市场长期检验”,中间还有很长的路要走。车规级的可靠性要求、极端工况下的稳定性验证、大规模量产的一致性品控——每一关都不好过。

    但方向是对的。当越来越多的中国企业在核心技术上选择“自己定义规则”,而非“别人定义规则后我来适应”,中国汽车工业才能真正站上全球舞台的中央。

    下一个时代的汽车产业游戏规则制定者名单里,中国的名字,值得期待。

    作者:前沿科技网站内容团队

    发布日期:2026-05-13

    来源:前沿科技网站内容/2026-05-13/01-理想自研马赫M100芯片.md

  • 人类细胞发现”黑暗蛋白”:改写蛋白质组认知的颠覆性突破 | 前沿科技

    人类细胞发现”黑暗蛋白”:改写蛋白质组认知的颠覆性突破 | 前沿科技

    2026年5月,《自然》重磅发表颠覆性研究:人类细胞中隐藏着成千上万种从未被正式记录的”黑暗蛋白”,科学家将其命名为peptideins(肽蛋白)。这项发现彻底改写了人类对…

    阅读更多

    你可能不知道,我们从小学生物课时就牢牢记住的那个数字——”人类基因组大约有2万个编码蛋白质的基因”——可能要加上一个巨大的注释了。

    2026年5月6日,国际顶级期刊《自然》发表了一项颠覆性研究:由TransCODE联盟主导的国际科研团队,在对7264个候选”黑暗蛋白”进行严格验证后,首次确认人类细胞中存在大量此前被完全忽视的微小蛋白质。科学家们为这类分子创造了一个全新的名称:peptideins(肽蛋白)

    这不是简单的命名游戏。这是生命科学版图的一次大扩张——它意味着,人类对自身蛋白质组的认知,只是冰山一角;那些至今无解的疾病、发育之谜、癌症机制,很可能就藏在这片从未被探索的”黑暗地带”里。

    peptideins与癌症、基因突变、发育障碍关联示意

    被扔进”暗物质”垃圾桶的万亿遗产

    过去几十年,生物学家在测序和注释人类基因组时,有一套严格到近乎苛刻的标准:一段DNA序列要被认定为”编码蛋白质的基因”,必须满足几个条件——

    长度足够长:氨基酸链必须达到一定的长度阈值,才能被视为”正经”的蛋白质。
    功能明确:必须有清晰的生物学功能,并且在进化过程中被保留下来。
    位置标准:必须位于典型的编码区域。

    那些不符合这些条件的小分子,命运就只有一个:被系统性地排除在官方基因库和蛋白质数据库之外。它们被当作转录翻译的”垃圾副产物”,随手丢进一个叫作”基因组暗物质”的垃圾桶。

    而这些被丢掉的东西,就是科学家现在所说的”黑暗蛋白”(dark proteins)。

    它们有几个鲜明的特征:

    体型极小:氨基酸链远短于传统意义上的蛋白质,小到过去根本没有检测手段能发现它们。
    位置隐蔽:常常位于已知基因的”阴影区”——旁边、甚至和已知编码区重叠。
    来源神秘:来自过去被认为”绝对不会编码蛋白”的基因组区域。
    身份模糊:在其他物种里很少见,缺乏进化上的”亲戚”。
    功能未知:绝大多数不知道在细胞里干什么,甚至不知道有没有用。

    它们就像细胞世界里的”幽灵分子”——明明真实存在,却长期没有姓名、没有户口、没有合法身份。

    海德堡大学生物信息学家Christoph Dietrich评价这项发现时直言:“这是重大突破!这些微小蛋白,有望掀起新一轮生命科学浪潮。”

    生物学版”矮行星事件”

    有人可能会问:不就是给小分子起了个名字吗?至于这么轰动?

    答案是:至于。而且意义堪比天文学发现矮行星。

    2006年,冥王星被”踢”出太阳系九大行星。但科学家并没有否定它的存在,而是创造了一个新分类——”矮行星”。这一重新定义,打开了柯伊伯带研究的大门,催生了大量新发现。

    peptideins(肽蛋白)的命运如出一辙。

    在此之前,这些黑暗蛋白:

    • 不被数据库收录——GENCODE、UniProt等国际核心数据库里根本没有它们的位置
    • 拿不到研究经费——申请资助时,审稿人会质疑”这东西有没有功能都不确定,为什么要研究”
    • 论文很难发表——主流期刊认为”没有明确功能验证的研究”不够”solid”
    • 被主流领域视为”旁门左道”——大量生物学家的默认认知是:能被传统方法漏掉的分子,肯定不重要

    现在不同了。

    TransCODE团队的研究结果获得了国际学术界的高度认可,这15个经过严格验证的肽蛋白已被正式接纳进GENCODE等国际核心数据库。这意味着全球的实验室,从此可以名正言顺地研究、测序、靶向、开发药物——不再需要面对”你研究的东西到底存不存在”这样的灵魂拷问。

    被忽略的生命密码:它们和癌症、罕见病直接相关

    最让医学界坐不住的,是研究揭示的另一层真相:这些”黑暗蛋白”并非无用的细胞副产物,它们很可能深度参与了人类重大疾病的发生发展。

    已有研究强烈暗示,peptideins与以下几类问题密切相关:

    儿童肿瘤:部分肽蛋白在儿童癌细胞中异常活跃,疑似是驱动癌变的”幕后黑手”。过去科学家把已知基因翻了个底朝天也找不到病因,现在有了全新的排查方向。

    细胞核心功能:它们参与细胞生长、分裂、信号传递等最基础的生命活动——这些过程一旦出错,后果可想而知。

    机制不明的遗传病和代谢病:在一些发病机制长期成谜的疾病中,肽蛋白呈现异常表达。答案可能一直藏在”黑暗区”里。

    胚胎发育与组织分化:发育生物学中许多悬而未决的问题,可能都与这些此前未被记录的分子有关。

    想象一下这个场景:一位疑难杂症患者走访了全国最顶尖的专家,把已知的2万种蛋白质查了个底朝天,依然找不到病因。而真正的致病元凶,几十年来一直躲在”黑暗区”里,连个名字都没有。

    这就好比警察查案:把明面上的嫌疑人全部排查一遍,却忽略了躲在暗处、从未登记在册的那个人。

    peptideins的”正名”,等于给医学研究提供了一份全新的靶点清单。未来,新药研发、疾病诊断、癌症治疗,都将因此多出一条全新路径。

    当然,科学界也保持了应有的审慎。伦敦大学学院计算生物学家Anders Krogh指出:”大多数肽蛋白,可能真的只是细胞副产物,没有实际功能。” 但他也承认:”哪怕只有1%有功能,这都是数千个全新的研究方向、上百个潜在新药靶点。”

    这背后是一整套技术革命

    peptideins之所以在今天才被发现和确认,背后是几项关键技术的成熟和叠加效应:

    大规模蛋白质组学检测:质谱技术的灵敏度在过去五年里提升了两个数量级,使得检测极微量的短链蛋白成为可能。

    RNA测序数据的深度挖掘:大量公开的RNA-seq数据中隐藏着肽蛋白存在的证据——它们虽然不产生经典蛋白质,但确实有RNA转录本。TransCODE团队利用计算方法从这些”噪音数据”中挖掘出了有效信号。

    功能验证的严格标准化:研究团队为肽蛋白验证建立了一套严格的评判标准,确保每个被认定的peptideins都有足够的实验证据支撑,经得起同行评审。

    国际协作网络的支撑:TransCODE联盟汇集了来自欧洲、北美、亚洲十余个研究机构的数百名科学家,这种规模的协作在过去几乎是不可想象的。

    加州大学戴维斯分校的分子生物学家Elizabeth Tseng评论道:”这项研究证明了科学界长期存在的一种偏见:’如果方法看不见,那它就不存在。’peptideins的存在其实从未被否定,只是我们一直没有能力正视它们。”

    打开生命科学的”暗门”之后

    peptideins的发现,指向一个比”发现了几个新分子”更深刻的命题:

    我们对自身生命密码的了解,可能还停留在幼儿园阶段。

    我们以为基因组已经测序完毕。
    我们以为蛋白质组的基本轮廓已经清晰。
    我们以为生命的主要逻辑已经摸清。

    但现实给了我们一记清醒的耳光:

    • 我们连细胞里有哪些重要分子都没认全
    • 大量关键物质长期被当作”垃圾”丢掉
    • 数据库里的”标准答案”,遗漏了一个庞大的未知世界

    这种认知冲击,历史上并不罕见。人类以为原子是最小粒子,直到发现了电子、质子、中子;以为经典力学能解释一切,直到量子力学横空出世。

    peptideins的出现,标志着**”微蛋白质时代”**的正式开启。

    未来几年,我们很可能会目睹一连串连锁突破:

    新的疾病标志物:某些肽蛋白可能成为肿瘤、早衰、代谢病的早期预警信号,比传统指标更灵敏、更特异。
    新的抗癌靶点:如果某些peptideins确实是癌细胞存活的”必需品”,靶向它们可能成为全新的治疗策略。
    新的发育调控机制:困扰生物学界多年的发育谜题,可能在肽蛋白层面找到答案。
    新的药物开发路径:成百上千个此前不存在的药物靶点,将进入研发人员的视野。

    对普通人意味着什么?

    你可能会说:这是科研圈的事,跟我有什么关系?

    关系太大了,而且可能比你想象的来得更快。

    更精准的诊断:未来体检报告中,可能增加一项”肽蛋白谱检测”,用于筛查癌症、代谢病等风险——就像今天做肿瘤标志物检测一样常规。

    更多”无药可医”的病迎来特效药:很多罕见病、疑难杂症长期查不出基因缺陷,答案很可能就藏在peptideins里。一旦找到对应的致病肽蛋白,药物研发就有了明确方向。

    靶向药物的范式升级:现有的靶向药主要针对”经典蛋白”,peptideins正名之后,药企可以光明正大地针对这些新靶点开发药物。尤其是儿童肿瘤领域,目前治疗选择极为有限。

    教科书全面改写:再过几年,学生物学的年轻人将学到:人类不仅有2万种经典蛋白,还有成千上万种肽蛋白,它们共同构成生命运转的秘密网络。

    推动精准医学走向更深层次:精准医学的核心理念是”不同人的疾病机制不同,需要个性化治疗”。peptideins的多样性和特异性,恰好为这一理念提供了全新的物质基础。

    一扇从未被打开的门

    这项研究的真正意义,或许不在于发现了多少个新分子,而在于它彻底打碎了人类的一种认知傲慢:我们以为已经足够了解自己,但事实上还有一整个”平行宇宙”隐藏在视线之外。

    人类花了数十年建立起的基因组和蛋白质组”标准地图”,现在被迫大幅修订。这不是科学的失败,恰恰相反——这是科学自我纠错、自我扩展能力的最好证明。

    正如论文作者在讨论部分所写:“科学史上许多最重要的发现,都始于我们意识到自己曾经忽视了什么。”

    peptideins的发现,不是终点,而是一扇从未被打开的门的开启钥匙。

    接下来的问题更令人兴奋:这些黑暗中的生命密码,究竟在控制着什么?它们如何参与疾病的进程?能否被安全地靶向?

    这些问题,将在未来十年甚至更长时间里持续推动生命科学的发展——而今天被正名的这15个peptideins,只是冰山露出水面的第一个小角。

    参考来源

    • Nature, “Systematic identification and validation of human peptideins”, TransCODE Consortium, May 2026
    • GENCODE Database v48 Update
    • Christop Dietrich评论, BioRxiv preprint, 2026

    相关阅读推荐

    • 《AI驱动的蛋白质设计革命:从折叠预测到全新氨基酸序列》
    • 《改写遗传病治疗规则:基因编辑疗法如何走出实验室》
    • 《微生物细胞工厂:合成生物学如何重塑制药业》

    标签:黑暗蛋白、肽蛋白、蛋白质组学、基因组注释、TransCODE、疾病靶点、生命科学突破、基因编辑、精准医学

  • 台积电”化圆为方”如何重写先进封装游戏规则

    台积电”化圆为方”如何重写先进封装游戏规则

    当芯片面积大到”圆”装不下,封装技术必须迎来范式革命。台积电2026年正式推出CoPoS技术,用方形玻璃基板替代圆形硅中介层,这不仅是材料形态的转变,更是一场牵动整个半导体…

    阅读更多

    引言:一场迟到三十年的”叛逆”

    半导体封装行业有个不成文的规矩:芯片是方的,但封装必须在圆形的晶圆上进行。这种”削足适履”的传统已经维持了近半个世纪。

    2026年4月,台积电在圣何塞技术论坛上正式公布CoPoS(Chip on Panel on Substrate)技术路线图,宣告这个”规矩”正式被打破。方形玻璃基板将取代圆形硅中介层,成为下一代AI芯片封装的核心载体。

    这不仅仅是材料形态的更替。当芯片面积从3.3个光罩向14个乃至40个光罩演进时,传统的封装思路已经触及物理极限。CoPoS的出现,意味着半导体产业正在经历一次从”在芯片上设计系统”到”在系统里封装芯片”的根本性转变。

    CoPoS封装结构剖面图,从芯粒HBM堆叠到玻璃通孔TGV再到有机基板的层级架构

    一、为什么CoWoS”装不下”了

    理解CoPoS的价值,首先要理解它的 predecessor——CoWoS(Chip on Wafer on Substrate)的困境。

    CoWoS是台积电旗舰级封装技术的代名词。通过在芯片和基板之间插入一层硅中介层,CoWoS能够将HBM高带宽内存与计算核心高密度互连,是英伟达H100、GB200等旗舰AI加速器的”标准配置”。这种架构的稳定性经过了多年验证,成为行业标杆。

    但问题在于:AI芯片正在变得越来越大。

    根据台积电2026年公布的路线图,2024年其先进封装面积为3.3个光罩(Reticle),2026年提升至5.5个,2027年达到9.5个。更远期的目标是:2028年实现14个光罩,2029年冲击40个以上。

    这意味着什么?14个光罩的封装面积约12000平方毫米,相当于两张扑克牌大小。当芯片需要集成如此多的计算芯粒和HBM堆叠时,传统的圆形硅中介层面临三重困境:

    面积利用率低。从圆形晶圆上切割矩形芯片,边缘损耗巨大。以当前主流的12英寸晶圆为例,切割面积利用率不足70%,意味着近三分之一的硅材料被浪费。

    翘曲问题严重。大尺寸硅中介层在热处理过程中容易变形,良率随面积增大而急剧下降。

    成本不可承受。硅是昂贵的材料,制造更大面积的中介层,成本几乎是线性增长。

    英伟达、谷歌TPU、苹果M-Ultra等AI巨头的需求正在推动这个趋势。当”大芯片”成为AI算力的标配,CoWoS的物理极限就成了整个行业的瓶颈。

    二、CoPoS:从”圆”到”方”的范式转移

    台积电的解决方案出人意料却又合乎逻辑——既然芯片是方的,为什么非要在圆形的基板上封装?

    CoPoS用方形玻璃面板替代圆形硅中介层。这一改变带来四个关键优势:

    面积不受限制。玻璃面板可以做到510×515mm甚至更大,不再受晶圆尺寸的束缚。面积利用率的提升直接转化为成本优势。

    信号损耗极低。玻璃的介电常数比硅更低,在高频信号传输中表现更优。这对于AI芯片中动辄数十GB/s的带宽需求至关重要。

    热膨胀系数可调。玻璃材料的热膨胀系数可以通过配方调整,匹配芯片的硅材料特性,从根本上缓解翘曲问题。

    通孔密度更高。玻璃通孔(TGV)的深宽比可达50:1,远超硅通孔(TSV)的10:1,这意味着更高的互连密度。

    从技术指标看,CoPoS的试产线已在2026年第一季度启动建设。台积电在台南嘉义的产线于2月份开始交付设备,计划6月份完成整条产线建设。这意味着CoPoS从技术发布到工程化落地的时间窗口被压缩到了极致。

    三、三星、苹果入局:产业链共振已经启动

    CoPoS的价值不仅在于技术本身,更在于它正在引发一场产业链的共振。

    苹果公司已开始内部测试三星提供的玻璃基板用于AI封装。这则来自韩国媒体The Elec的报道透露了一个重要信号:终端巨头正在为CoPoS时代的到来提前布局。

    三星的玻璃基板计划更为激进。据报道,三星电机计划2026年第四季度运营玻璃基板试点生产线,比原计划提前一个季度。英特尔同样不甘落后,2026年初已推出采用800微米玻璃基板的EMIB封装样品。

    从产业链视角看,CoPoS的崛起正在重塑三个领域的价值分配:

    玻璃基板与上游材料。康宁、三星电机等玻璃材料供应商迎来新的增量市场。TGV(玻璃通孔)全制程能力成为核心竞争力。

    核心设备商。面板级封装需要全新的设备生态:超快激光打孔设备、面板级电镀设备、CMP平坦化设备、直写光刻设备以及AOI自动光学检测设备。每一台设备都是一个新的增量市场。

    封装测试厂商。传统封测厂需要向上游玻璃基板及材料领域延伸,而面板制造商则可能凭借玻璃基板加工优势向下游封装环节渗透。

    四、TGV:玻璃基板的”神经网络”

    如果说玻璃基板是CoPoS的”骨骼”,那么TGV(Through Glass Via,玻璃通孔)就是它的”神经网络”。

    TGV工艺是为玻璃基板”打通神经”的关键技术。其完整流程包括:激光诱导改性、刻蚀、清洗、双面电镀、退火、化学机械抛光(CMP)等环节。其中,超快激光打孔设备是最核心的环节。

    为什么要用激光而非传统的光刻工艺?原因在于玻璃材料的特性。玻璃不像硅那样容易被化学刻蚀,需要用激光精确改性后才能进行后续加工。而且,TGV的深宽比高达50:1,远超TSV的10:1,这意味着在玻璃上打的孔更深、更窄,对工艺精度要求极高。

    另一个关键环节是RDL(Re-Distribution Layer,重布线层)。随着芯片互联密度提升,RDL金属层数翻倍,铜凸点间距缩小至5微米。直写光刻设备、刻蚀、薄膜沉积及检测设备的需求被显著拉动。

    这些看似”配角”的设备和材料,实际上正在成为这场封装革命中最确定的受益者。

    五、落地节奏:比想象更快

    市场对CoPoS的普遍预期存在两点显著低估:

    应用范围被低估。当前市场主要关注CoPoS作为”中介层”替代CoWoS的逻辑。但研报指出,玻璃基板的低损耗、高密度优势,使其在IC载板替代、射频FOPLP封装以及CPO(Co-Packaged Optics,共封装光学)领域具备同样广阔的空间。

    尤其是在1.6T及以上速率的光模块中,玻璃基板凭借其优异的高频性能和光波导集成能力,被认为是CPO的核心载体。这意味着CoPoS的影响范围远超AI芯片封装本身。

    落地时间被低估。尽管台积电将CoWoS的中介层上限提升至14倍光罩,可能推迟CoPoS大规模量产的紧迫性(TrendForce预计2028年量产),但在IC载板和CPO等新兴应用上的进展,将加速玻璃基板的商业化落地。

    苹果的测试、三星的加速、英特尔的产品化——这些信号都在指向同一个结论:CoPoS的产业化节奏正在全面加快。

    六、封装即系统:重新定义芯片产业

    回望半导体产业的发展历程,有一个清晰的演进脉络:

    • 1960年代:集成电路时代,在芯片上集成电路
    • 2000年代:SoC时代,在芯片上集成系统
    • 2020年代:Chiplet时代,在封装里集成芯片
    • 2026年开始:封装即系统时代

    CoPoS的出现是这个趋势的最新注脚。当封装面积达到14个光罩、整合约10个大型运算芯粒和20个HBM堆叠时,封装本身已经变成了一个系统。

    这意味着什么?意味着芯片的设计逻辑正在被彻底改写。

    过去,芯片设计师在微缩晶体管尺寸的框架内思考如何提升性能。现在,他们需要在一个更大的封装空间内,优化不同芯粒之间的互连、散热和电源完整性。封装不再是芯片设计的”收尾工作”,而是芯片性能的”第一性因素”。

    对于中国半导体产业而言,CoPoS既是挑战也是机遇。

    挑战在于:台积电在先进封装领域的领先地位正在进一步巩固,CoWoS市占率超80%,3D封装市占率超60%,CoPoS将使这个差距进一步拉大。

    机遇在于:玻璃基板、面板级封装等新兴技术仍在产业化早期,全球供应链尚未完全固化。盛合晶微、长电科技等国内封装厂商在TGV等关键工艺上已有技术积累,有望在新的产业格局中占据一席之地。

    结语

    2026年,半导体行业正在经历一场静默的革命。

    当台积电宣布”化圆为方”,当苹果、三星、英特尔竞相入局玻璃基板,当TGV和RDL设备成为新的”卖铲人”,整个产业的价值链条正在被重构。

    这不是某个单点技术的突破,而是整个封装范式的转移。从CoWoS到CoPoS,从硅中介层到玻璃面板,从”封装芯片”到”封装系统”——半导体产业正在用一种全新的方式突破物理极限。

    对于从业者而言,理解CoPoS不仅是理解一项新技术,更是理解半导体产业下一个十年的竞争逻辑。谁掌握了封装,谁就掌握了定义系统性能的权力。

    本文仅供技术科普,不构成投资建议。

  • 国产AI芯片商业化突围:寒武纪净利暴涨185%,华为昇腾2026年营收剑指820亿

    国产AI芯片商业化突围:寒武纪净利暴涨185%,华为昇腾2026年营收剑指820亿

    当美国芯片禁令步步收紧,国产AI芯片却在2026年交出了一份令人惊喜的答卷。寒武纪一季度净利润暴涨185%,华为昇腾全年营收预计突破820亿元,国产AI芯片市场份额首次超越…

    阅读更多

    四年前,当华为被列入实体清单时,很多人担忧中国AI产业将陷入”无芯可用”的困境。彼时,国产芯片在性能、生态和可靠性上与英伟达的差距,似乎是一道难以逾越的鸿沟。

    四年后的今天,局面正在发生微妙而深刻的变化。

    2026年第一季度,寒武纪营收28.85亿元,同比增长159.56%,归母净利润10.13亿元,同比暴涨185.04%,更让行业振奋的是,这家公司经营现金流转正至8.34亿元——这意味着国产AI芯片厂商终于实现了从”烧钱研发”到”自我造血”的关键跨越。与此同时,华为昇腾2026年全年营收预计达820亿元,同比增长60%,全年出货量将达75万颗。

    国产AI芯片晶圆制造半导体产业链寒武纪营收暴涨185%

    这些数字背后,是中国AI芯片产业从技术突破走向商业闭环的完整叙事。

    从”备胎”到”首选”:国产替代的三年蜕变

    回顾国产AI芯片的发展历程,2023年是一个重要分水岭。在那之前,国产芯片虽然在实验室跑分上逐渐逼近国际水平,但实际部署时却面临”没人敢用”的尴尬——不是因为性能不够,而是因为软件生态不完善、应用适配成本高、售后服务跟不上。

    一位国内互联网大厂的算法工程师曾私下告诉我,他们不是不想用国产芯片,而是”不敢用”:”换平台意味着要重新优化所有模型,还要承担迁移失败的风险。没有客户愿意做第一个吃螃蟹的人。”

    转机出现在2024年。随着美国芯片出口管制持续收紧,大模型厂商不得不寻求备选方案。这一被迫的”备胎转正”,却让国产芯片获得了难得的实战机会。

    “说实话,最初我们也没抱太大期望。”某头部云厂商的技术负责人回忆道,”但测试结果让我们吃了一惊——昇腾910B在一些场景下的表现已经不输A100,而且价格更有优势。”

    正是这种”意外之喜”,推动了国产AI芯片的规模化应用。到2026年,国产AI芯片在政务、金融、能源等关键行业中的采购占比已超过70%,彻底打破了”国产=低端”的刻板印象。

    寒武纪样本:从亏损到盈利的商业闭环

    寒武纪的财务数据变化,是观察国产AI芯片商业化进程的最佳样本。

    2022年,寒武纪还处于持续亏损状态,全年营收7.2亿元,净亏损超过12亿元。彼时,这家脱胎于中科院计算所的AI芯片公司,被外界质疑为”PPT公司”——技术听起来很美好,但就是赚不到钱。

    转折发生在2023年下半年。随着国内大模型训练需求爆发,寒武纪的思元系列芯片凭借在Transformer架构上的深度优化,获得了互联网厂商的青睐。2024年,寒武纪首次实现年度盈利,2025年营收突破80亿元,2026年仅一季度就完成了28.85亿元营收。

    更值得关注的是其毛利率的持续改善。财报显示,寒武纪2026年第一季度毛利率约为65%,较2022年提升了近20个百分点。这一数字的改善,意味着公司不再依赖低价换市场,而是真正凭借产品力和服务能力赢得客户。

    “我们不再只是卖芯片。”寒武纪CEO陈天石在近期采访中表示,”现在我们卖的是完整的解决方案——包括硬件、软件栈、技术支持和定制化服务。这种综合能力,才是我们的核心竞争力。”

    华为昇腾:生态战法与75万颗芯片的野望

    如果说寒武纪代表的是”技术派”路线,那么华为昇腾则是”生态派”的代表。

    昇腾芯片的成功,很大程度上得益于华为打造的完整软硬件生态。从底层的CANN计算架构,到中层的MindSpore框架,再到上层的ModelArts平台,华为几乎复刻了英伟达的CUDA帝国模式,只是换了一套更贴合中国市场的”玩法”。

    这种”全家桶”式的生态策略,正在显现威力。2026年,阿里巴巴、字节跳动、腾讯等头部互联网厂商纷纷扩大昇腾芯片采购量,用于大模型训练和推理部署。一位知情人士透露,字节跳动2026年的昇腾订单量是其2025年的三倍。

    “昇腾最大的优势不是性能,而是稳定。”某AI创业公司的技术VP告诉我,”用昇腾出问题,打个电话就有人来支持;用英伟达显卡,遇到问题可能要找代理商层层反馈。国内厂商更看重这种本地化服务能力。”

    更重要的是价格。知情人士透露,昇腾910B的价格比同性能英伟达芯片低30%-40%,在当前大模型竞争进入”拼成本”阶段后,这一价格优势成为客户选择的重要考量。

    隐忧与挑战:热闹背后的冷思考

    尽管国产AI芯片捷报频传,但我们也要清醒地看到产业面临的挑战。

    首先是产能问题。芯片制造是典型的重资产、长周期产业,设计出来不代表能量产。目前,国内AI芯片主要依赖台积电和三星代工,一旦地缘政治出现变数,产能供应存在风险。虽然中芯国际的7nm工艺已有突破,但在先进封装和高性能计算芯片领域,与国际龙头仍有差距。

    其次是生态深度。英伟达CUDA生态经过十几年积累,拥有数百万开发者、丰富的工具链和成熟的社区。国产芯片的软硬件生态虽然在快速追赶,但在某些细分场景(如高性能计算、科学计算)仍存在工具链缺失问题。迁移成本,是阻碍更多客户”上车”的现实障碍。

    第三是同质化竞争。当前,国产AI芯片赛道已涌入数十家玩家,产品同质化现象严重。当市场从”缺芯”转向”饱和”,价格战和淘汰赛将不可避免。谁能笑到最后,还是一个未知数。

    未来已来:AI算力的新格局

    尽管挑战重重,国产AI芯片的趋势已经不可逆转。

    从宏观层面看,AI算力自主可控已成为国家战略。政策层面的持续支持、庞大的国内市场需求、产业链上下游的协同创新,共同构成了国产芯片发展的”天时地利人和”。

    从产业层面看,国产芯片正在从”替代”走向”引领”。在某些细分领域,如大模型推理、边缘计算、特定行业AI应用,国产芯片凭借定制化优势和快速迭代能力,已展现出与国际巨头正面竞争的实力。

    “五年前,我说国产AI芯片能追上英伟达,很多人觉得我是在吹牛。”一位从业二十年的芯片老兵告诉我,”现在,我可以说,在某些场景下,我们已经不输给任何人了。”

    这句话,或许是国产AI芯片逆袭之路的最佳注脚。

  • 量子计算硬件产业化加速:2026年四大技术路线突破与资本布局

    量子计算硬件产业化加速:2026年四大技术路线突破与资本布局

    2026年开年,中国量子计算赛道以一季度融资总额突破33亿元的爆发式增长,宣告其从实验室研究向产业应用转化的关键转折。超导、光量子、离子阱、中性原子四条技术路线并行突破,A…

    阅读更多

    一、资本热潮:从”投技术”到”投落地”的逻辑转变

    量子计算赛道的融资故事,在2026年发生了质的飞跃。行业数据显示,2026年第一季度,中国量子计算领域融资总额达到33亿元,直接超越2025年全年24.73亿元的融资规模,融资频率与金额均创下历史新高。更值得关注的是,这轮资本热潮的流向发生了根本性变化:资本评估体系正从早期的”投技术、投科研”转向”投落地、投商业化”,具备实际场景应用和工程化能力的企业成为资本追捧的核心标的。

    头部企业的融资动态清晰地勾勒出这一趋势。玻色量子在3月31日完成10亿元B轮融资,由北京金控、工银资本等联合领投,资金重点投向深圳专用量子计算机工厂的扩产与技术迭代。这家从创立之初就锁定专用量子计算机赛道的企业,聚焦能够快速落地、为产业创造实际价值的算力产品,契合资本对长期回报的需求。图灵量子在2026年上半年已获得融资近10亿元,其中国家创业投资引导基金长三角基金的首个量子直投项目尤为引人注目——这标志着国家层面的战略资本正式重仓量子赛道。量旋科技C系列累计融资近10亿元,重点投向高比特超导量子芯片的研发与规模化应用,IPO步伐同步加快。

    量子计算实验室:稀释制冷机与量子芯片研发产业化

    这场资本热潮并非盲目押注。 从国家引导基金首次重仓量子赛道,到多条技术路线实现工程化突破,再到生物医药、金融等场景的应用案例不断涌现,中国的量子计算生态正以前所未有的速度成熟。麦肯锡预测,到2040年,全球量子技术领域市场规模将达到1980亿美元,且主要由量子计算和量子通信产业推动。以色列量子技术创企Quantum Machines联合创始人兼CEO Itamar Sivan的观点更为直接:”这是一场没有输家的游戏。”

    二、四路竞速:超导、光量子、离子阱、中性原子的工程化突破

    量子计算的实现路径从来不是单选题。当前全球量子计算主要围绕超导、光量子、离子阱和中性原子四条技术路径展开竞争,而中国在每条赛道上均取得了标志性进展,呈现出”多路并行、各有突破”的格局。

    超导路线是目前产业化最为成熟的方向。本源量子自主研发的”本源悟空”超导量子计算机,已实现72比特芯片的批量生产,其硬件研制团队负责人孔伟成博士带领团队坚持全栈式自主研发,实现了超过80%的国产率,核心部件完全自主可控。截至2026年4月底,”本源悟空”已为全球163个国家和地区超4700万人次提供量子算力服务,完成90万余次量子计算任务。近期,该设备还上线了量子知识大模型Origin Brain等人工智能工具,推动量子算力在电力、金融、工业等复杂场景中探索应用。中电信量子集团的”天衍-287″计算机搭载”祖冲之三号”同款芯片,在特定问题上的处理速度比当前最快超级计算机快4.5亿倍,并已接入云平台开放量子优越性服务。

    光量子路线凭借室温运行、抗干扰强等优势,被视为实用化突破的重要方向。图灵量子构建了国内唯一覆盖芯片、硬件、整机、软件的全栈自主光量子技术体系,在光量子芯片制备和量子光学系统集成方面建立了完整的技术护城河。玻色量子则专注于专用机赛道,其千比特级产品”驭量·山海1000″瞄准新药研发等快速变现场景,2025年于深圳落地的中国首个规模化专用量子计算机制造工厂,预计2026年底实现数十台产能。

    离子阱路线被视为实现通用容错量子计算的潜力股。合肥幺正量子作为国内该领域领军者,已搭建起领先的整机系统,并公开达成量子体积32的基准测试。离子阱技术路线的优势在于其极高的量子门保真度和长相干时间,虽然在比特规模扩展上面临挑战,但在量子模拟和量子化学等领域具有独特优势。

    中性原子路线在比特规模上取得了惊人突破。清华大学团队利用全自主技术,首次在实验中捕获并操控了10064个原子,将可获取的量子比特资源推进到”万量级”,超越了此前国际纪录。这一突破为大规模量子计算提供了新的技术路径,也为量子模拟和量子优化问题的求解奠定了硬件基础。

    四条技术路线的并行突破,打破了外界对量子计算”技术路线不确定”的担忧。更重要的是,这些突破不再是实验室里的演示,而是具备工程化量产能力的实质性进步。量子计算的产业化,不是押注某一条路线,而是多路竞速、相互补充、共同推进。

    三、AI融合:双向赋能的产业化催化剂

    量子计算商业化的最大障碍之一,是其研发和运维的高成本、长周期。而AI技术的引入,正在从根本上破解这一痛点。2026年,”量子+AI”的深度融合已成为激活产业长期价值的核心抓手,表现为双向赋能的清晰逻辑。

    一方面,AI技术大幅降低了量子研发的成本与门槛。 本源量子在”本源悟空”真机上实现十亿参数AI大模型微调,使参数量减少76%,同时训练效果提升8.4%。这一突破意味着,量子计算的编程和优化不再需要专业人员手动调试,AI可以自动完成量子电路的优化和参数调校。国盾量子则通过AI优化量子校准与纠错技术,有效降低量子门错误率,缓解了量子技术研发周期长、成本高的产业痛点。英伟达于2026年4月推出全球首个开源量子AI模型家族”Ising”,一举攻克量子比特校准与纠错两大核心瓶颈,将校准周期从数天压缩至数小时,纠错速度与精度实现数倍跃升,为量子计算实用化打通了关键技术通道。

    另一方面,量子算力为突破AI的经典算力瓶颈提供了新路径。 国内首家”AI+量子”融合实体公司量智开物的成立,标志着这一趋势走向系统化产业布局。该公司发布的”追风”算法能在20毫秒内完成万量级原子阵列重排;”扁鹊”解码器则能智能辅助量子纠错。量智开物共同发起人、清华大学教授翟荟的观点颇具深意:”要操控这样规模的量子计算机,人工智能的引入不是锦上添花,而是不可或缺。”

    量子计算与AI的融合,正在改变两个领域的游戏规则。对量子计算而言,AI提供了工程化落地的加速器;对AI而言,量子计算提供了突破经典算力瓶颈的新可能。这种双向赋能的关系,使得”量子+AI”成为2026年最具想象力的技术组合之一。

    四、场景落地:从”能用”到”好用”的商业验证

    技术的价值最终要在产业场景中兑现。2026年,量子计算的”超能力”正在生物医药、金融科技、新材料研发等领域接受检验并开始创造实际价值。

    生物医药成为量子计算的首要应用赛场。在精准医疗中,量子计算能加速医学数字孪生开发,辅助实现肿瘤病灶边界的更精准判断。上海市肿瘤研究所PI向冬喜指出,在患者肿瘤病症治疗中,精准确定癌变组织的切除边界是具有挑战性的环节——切除范围太小存在复发风险,切除范围过大则伤害健康组织。引入量子计算后,借助医学分析和模型计算,能够实现对病灶边界更精准的判断,提高临床治疗水平。

    基因测序领域的应用同样引人注目。诺禾致源与玻色量子合作,将量子技术应用于单细胞组学数据分析,通过QBM-VAE(量子玻尔兹曼机-变分自编码器)模型实现创新解决方案。诺禾致源首席科学家田仕林介绍,真实的单细胞数据具有高度异质性、多峰分布和强非线性关系,当前主流模型与现实存在”错配”困境,而量子技术的引入能更清晰地刻画细胞分化轨迹,为疾病诊断提供新路径。

    金融领域的优化问题天然契合量子计算特性。中科酷原科技已申请一项适配中性原子量子计算机的投资组合优化方法专利,旨在降低电路复杂度,提升计算效率与工程实用性。金融行业对量子计算的热情不仅限于中国——全球主要金融机构都在探索量子计算在风险评估、资产组合优化、欺诈检测等场景的应用。

    新材料研发也受益于量子模拟能力。量坤科技通过创新”量子+AI+超算”融合模式,大幅提升了新材料、新药的研发效率。量子计算能够在原子和分子层面模拟材料的量子力学行为,为设计新型电池材料、催化剂、药物分子等提供强大的计算工具。

    这些应用场景的落地,证明了量子计算并非”屠龙之术”,而是能够在真实商业环境中创造价值的实用技术。尽管目前的应用仍处于早期验证和小规模试点阶段,但其潜力已经清晰可见。

    五、挑战与展望:2029年容错量子计算的目标

    尽管融资火热、技术突破频现、应用场景不断拓展,但中国量子产业整体仍处于商业化初期。业内研判,容错通用量子计算机预计2029年前后方能落地。当前发展的关键,在于推动量子算力从”可用”的演示验证,迈向”好用”的规模化商业变现。

    硬件稳定性仍是首要挑战。量子比特极其脆弱,需要在接近绝对零度(-273℃)的极低温环境下运行,对硬件制造和工程化能力提出了极高要求。北京计算科学研究中心薛鹏教授指出,量子计算等核心领域仍面临硬件稳定性、纠错效率等基础瓶颈,技术突破与商业回报之间仍存在较大不确定性,产业成熟尚需时间检验。

    核心器件与高端装备的部分进口依赖也需要关注。薛鹏教授建议,首先要加强基础工艺研发,联合科研院所攻关关键材料与制备技术;其次通过标准化、模块化设计降低量产成本,避免过度追求极端性能;第三优先在容错率较高的场景(如量子精密测量)推动小规模应用。

    从”可用”到”好用”,还有很长的路要走。 东南大学物理学院教授肖磊的观点更为务实:未来3至5年,量子算力融入数字经济基础设施以及”量子+行业”的普及,预计仍以早期验证和小规模试点为主,更现实的路径是少数特定场景(如量子模拟、专用计算)率先试用,但通用容错计算和广泛产业融合仍需更长时间积累。

    但这并不意味着悲观。回顾历史,每一项颠覆性技术从实验室走向大规模应用,都需要经历漫长的产业化过程。晶体管从发明到商业化用了数十年,互联网从ARPANET到全民普及也走过了近30年。量子计算正在经历同样的历程,而2026年的这轮融资热潮和技术突破,标志着这场历程正在进入加速期。

    结语:算力革命的”合肥答案”

    从央视五一特别节目聚焦合肥量子团队,到一季度融资突破33亿元,再到多条技术路线的并行突破,2026年的中国量子计算产业正在给出自己的答案。

    这个答案的核心,是技术自主与产业协同的双轮驱动。合肥”本源悟空”超过80%的国产率,证明了核心技术握在自己手里的可行性;而玻色量子、量旋科技、图灵量子等企业的融资和扩产,则展示了产业生态对技术成果转化的放大效应。

    这个答案的姿态,是长期主义的战略定力。量子计算仍处于产业化早期,短期内难以产生规模化的商业回报。但正如孔伟成团队用十余年攻坚造出”量子金箍棒”,唐世彪团队在量子通信”无人区”凿出产业化道路,量子计算的成功需要的不是投机式的短期押注,而是愿意陪伴穿越创新周期的长期资本和战略耐心。

    这个答案的指向,是从跟跑并跑到领跑全球的跨越。在全球量子计算的竞争中,中国已经在多条技术路线上建立了优势地位。从”量子大道”上93家产业链企业,到国家引导基金的首次重仓,再到生物医药、金融等场景的初步验证,中国的量子计算生态正以前所未有的速度成熟。

    量子科技仍处马拉松的早期阶段,但合肥团队的奔跑,全国无数量子科技工作者的努力,已经给出了将发展主动权握在自己手中的清晰答案。2026年的量子计算产业化元年,或许正是这场漫长马拉松中,最具标志性意义的一个里程碑。

  • 大模型推理时代来临:2026年AI产业迎历史性转折

    大模型推理时代来临:2026年AI产业迎历史性转折

    2026年第一季度,中国AI推理算力占比首次突破52%,超越训练算力。这一看似简单的数字背后,隐藏着AI产业从“技术炫耀”走向“商业落地”的深层逻辑。当大模型从实验室走向千…

    阅读更多

    一、历史性转折:推理算力首超训练算力

    2026年3月,中国信通院发布的一组数据,在AI行业内引发了广泛讨论。数据显示,2026年第一季度,中国AI推理算力占比达到52%,首次超越训练算力的48%。这个数字的变化,远比它看起来的意义更为深远。

    过去几年,大模型竞争的焦点几乎都集中在“训练”环节。谁能训练出更大的模型、谁能获取更多的GPU、谁能在更短的时间内完成训练——这些都是媒体报道的焦点,也是资本市场的兴奋点。但随着大模型在各行各业的逐步落地,一个更现实的问题浮出水面:模型训练只是“一次性投入”,而推理服务却是“持续性消耗”。

    推理优化三板斧:PD分离架构与MoE系统级优化降低Token推理成本

    打个比方,训练就像是你花大力气写好一本书的初稿,而推理则是这本书被复印了亿万份,每一份都需要重新排版印刷。当一本畅销书卖出100万册时,你最关心的就不再是写书花了多少钱,而是每一本的印刷成本能不能再低一点。

    这正是当前AI产业正在经历的转变。2026年初,中国日均Token调用量已突破140万亿,这个数字在两年前还只是个零头。更关键的是,受Agentic AI等应用的驱动,推理计算量在两年间增长了1万倍。这种爆发式增长,直接推动了产业重心的转移。

    二、成本之困:推理为何成为“阿喀琉斯之踵”

    如果说训练是大模型的“面子”,那推理就是大模型真正的“里子”。面子可以靠融资撑着,里子却必须靠真金白银支撑。

    2024年,OpenAI的推理预算已经是GPT-4训练预算的15倍。这个数字让很多人意识到,大模型的商业化之路,远比想象中艰难。训练一个模型,你可以告诉投资者这是“战略投入”;但每天烧掉的推理成本,如果不能被收入覆盖,那就是实打实的亏损。

    2026年5月初,字节跳动旗下豆包App在App Store页面悄然上线了付费订阅方案。标准版68元/月、加强版200元/月、专业版500元/月——这一定价策略的背后,藏着推理成本的焦虑。据接近字节的人士透露,付费功能将主要聚焦PPT生成、数据分析、影视制作等复杂任务场景,而这些场景恰恰是推理资源消耗最大的业务。

    豆包的底气来自于它的用户规模:截至2026年3月,豆包月活已达3.45亿,位居AI原生APP首位。但即便如此,3亿月活背后的推理成本结构依然严峻。知情人士透露,硬件折旧在豆包的推理成本中占比约58%,电力成本约占29%。当DAU持续增长,当用户的使用场景从简单的聊天扩展到复杂的工作流,推理成本的增速往往超过收入的增速。

    这就不难理解,为什么豆包要在免费版的基础上推出付费服务——它需要在“用户体验”和“算力成本”之间找到一个可持续的平衡点。

    三、技术突围:推理优化的“三板斧”

    面对推理成本的压力,AI行业并没有坐以待毙。2026年,一系列推理优化技术正在从实验室走向产业应用,为大模型的商业化落地铺平道路。

    第一板斧:PD分离架构

    PD分离,全称Prefill-Decode分离,是当前大模型推理优化领域最热门的技术方向之一。其核心理念是:把推理过程中的“预填充”阶段和“解码”阶段分开处理,让不同的硬件资源专注于各自最擅长的任务。

    为什么需要分离?因为这两个阶段的计算特性完全不同。预填充阶段处理输入token,类似矩阵运算,擅长并行计算,GPU利用率高;而解码阶段每次只生成一个token,类似向量运算,更吃内存带宽。过去,很多推理系统把两个阶段放在同一个GPU集群处理,结果不是计算资源浪费,就是内存资源吃紧。PD分离让两个阶段各得其所,整体效率提升显著。

    2025年,Moonshot AI推出的Mooncake、字节跳动的Dynamo、阿里巴巴的UCM等工业级方案,都采用了PD分离架构。这些方案通过以存换算、分级存储、分布式内存池等技术,实现了“更快响应、更大吞吐、更长文本处理”的综合提升。

    第二板斧:MoE架构的系统级优化

    当大模型进入MoE(Mixture of Experts,混合专家)时代,推理优化的游戏规则也在改变。MoE模型的核心思路是“专家专精”——让不同的“专家”网络处理不同类型的任务,用多少算多少,避免“一刀切”带来的资源浪费。

    但MoE模型的分布式特性,也给推理系统带来了新的挑战。2026年,头部企业开始探索“跨节点EP+PD分离”的组合优化方案。EP(Expert Parallelism)让不同专家分布在不同计算节点,PD分离则优化了推理的两个阶段。DeepSeek的推理系统是这个方向的典型案例,通过精细的负载均衡和路由优化,在保持模型性能的同时显著降低了推理成本。

    此外,AF(Attention Forward)分离也在快速兴起。MegaScale-Infer、Step-3等方案通过AF分离加定制通信库,实现了专家负载的动态均衡。这种“动态”比“静态”更聪明的地方在于,它能根据实时的请求特征,自动调整资源分配策略。

    第三板斧:AI存储驱动的记忆革命

    大模型有个被广泛吐槽的毛病:上下文窗口虽然越来越长,但模型依然容易“遗忘”。这个问题在推理阶段尤为突出——长上下文意味着需要缓存更多的KV(Key-Value)数据,而当缓存超出显存容量时,要么减慢速度重新计算,要么直接截断丢失信息。

    AI存储技术正在解决这个问题。2026年的新方案不再把存储简单地当作“仓库”,而是让它具备“记忆管理”的智能。具体来说,分层缓存技术把热点数据放在高速显存,把冷数据卸载到SSD或HDD,需要时再快速召回。这种“按需调度”的策略,大幅降低了长上下文推理的显存压力。

    更前沿的探索是“知识存储”和“记忆存储”。未来的推理系统不仅要记住用户说过什么,还要理解这些信息之间的关联,并能在合适的时机调用。举个例子,当用户在聊天中提到“上个月提到的那个项目”,推理系统需要快速定位到上下文中的相关内容,而不是让用户重复一遍。这种能力,正是从“数据存储”向“知识存储”演进的产物。

    四、商业变局:大模型厂商的定价策略分化

    推理成本的焦虑,正在重塑大模型厂商的定价策略。2026年上半年,国产大模型厂商之间出现了明显的策略分化——有的涨价,有的降价,竞争逻辑正在从“抢用户”转向“算账”。

    2026年以来,智谱AI已经三次上调API价格。2月对Coding场景套餐涨价30%,3月对GLM-5-Turbo涨价20%,4月发布GLM-5.1再度提价10%。智谱的逻辑很直接:需求太旺盛,用户规模增长太快,算力成本水涨船高,不得不把压力传导给下游。

    但DeepSeek选择了相反的路线。4月25日,DeepSeek宣布V4-Pro模型API限时2.5折优惠;4月26日,全系列API服务的输入缓存命中价格降至原来的1/10。以DeepSeek-V4-Flash为例,调整后的每百万tokens输入缓存命中价格仅为0.02元——这个价格已经低于很多厂商的成本线。

    DeepSeek的底气来自于它的技术积累。通过持续的推理优化,DeepSeek在保持模型性能的同时,大幅压低了单次推理的成本。降价不是为了打价格战,而是要把竞争对手拖入“亏本抢市场”的泥潭。

    两种策略各有各的道理。涨价适合那些不愁客户、技术领先的头部厂商;降价适合那些需要规模效应、通过低价换取市场份额的后起之秀。但无论哪种策略,背后都指向同一个事实:大模型厂商正在从“融资驱动”转向“盈利驱动”,谁能在推理成本和用户体验之间找到最优解,谁就能在这场长跑中笑到最后。

    五、未来展望:2030年推理成本下降90%意味着什么

    2025年,咨询机构Gartner曾预测:2030年大模型推理成本较2025年将下降90%以上。这个数字听起来像是天方夜谭,但仔细分析技术演进路径,并非不可能。

    首先是硬件升级。HBM(高带宽内存)的容量在持续增长,价格在持续下降;新一代AI芯片的推理效率每代提升30%-50%;存算一体技术正在从实验室走向商用,未来可能在推理效率上实现数量级的突破。

    其次是算法优化。如前文所述,PD分离、MoE优化、投机推理等技术仍在快速迭代。当这些技术从头部厂商的“独门秘籍”变成行业通用的“基础设施”,整个行业的推理效率天花板将被大幅抬高。

    第三是软件生态的成熟。vLLM、SGLang、TensorRT-LLM等推理框架正在快速普及,越来越多的开发者能够以更低的门槛用上最新的优化技术。当技术红利的扩散速度加快,整个行业的前进速度也会加快。

    如果90%的成本下降真的实现,那意味着什么?意味着今天需要花100元的推理服务,2030年可能只需10元。对于企业用户来说,这意味着AI应用的ROI将从“勉强可行”变成“难以置信”;对于普通用户来说,这意味着AI助手、AI创作、AI办公将成为真正的“水电煤”——便宜到无处不在。

    结语

    2026年的AI产业,正在经历一场静悄悄的革命。当媒体还在追逐“谁又发布了新模型”的新闻时,真正的战场已经悄悄转移到了“谁的推理系统更高效、更经济、更绿色”。

    推理时代的到来,不是大模型的终点,而是大模型真正走向成熟的标志。当一项技术从实验室走向千行百业,从技术展示变成日常工具,它就必须学会“省钱过日子”。豆包的付费订阅、DeepSeek的降价策略、智谱的三连涨价——这些看似矛盾的商业决策背后,其实都在指向同一个方向:推理成本才是大模型商业化的真正试金石。

    未来的AI竞争,不会只看“谁最强”,更要看“谁最会过日子”。在这场从“技术竞赛”到“经营竞赛”的转变中,能笑到最后的,一定是那些既懂模型、又懂工程、更懂商业的团队。

  • 地下盐穴储氢突破:氢能产业化从”痛点”到”支点”的跨越

    地下盐穴储氢突破:氢能产业化从”痛点”到”支点”的跨越

    2026年4月25日,亚洲首个百万方级盐穴储氢示范工程在河南平顶山投产,标志着我国地质储氢技术正式从实验室走向商业化应用。这一突破不仅解决了氢能产业”储运难”的核心瓶颈,更…

    阅读更多

    氢能产业的最大”拦路虎”

    要理解盐穴储氢的意义,首先需要理解氢能产业长期面临的一个核心悖论:制氢技术已经相对成熟,但储运环节却始终是产业化的最大制约。

    氢气的物理特性决定了它”不好伺候”。作为宇宙中最轻的元素,氢分子的直径极小,极易从容器缝隙中泄漏。同时,氢气在高压下才能实现较高密度储存,这对容器材料提出了极高要求;低温液态储存虽然效率更高,但能耗大、设备复杂,目前主要应用于航空航天领域。

    在地面储运环节,管道运输需要专用的耐氢脆材料,成本高昂;长管拖车运能有限,运输成本随距离线性增加;液氢槽车则面临蒸发损失和能耗问题。这些挑战使得氢气的储运成本占到最终用氢成本的30%至40%,严重制约了氢能的经济性竞争力。

    氢能产业绿氢制备与储运设施,风光发电驱动电解水制氢场景

    正是这一”卡脖子”问题,让氢能产业长期处于”有产能、难运输”的尴尬境地。西部可再生能源基地生产的廉价绿氢,往往因为运输成本过高而失去市场竞争力;东部氢能应用场景需要的氢气,却因为供应不足而价格偏高。

    盐穴:意外的”天然优势”

    面对这一困境,科学家和工程师们将目光投向了地下。盐穴,这个听起来有些陌生的地质结构,正在成为氢能储运领域的”新星”。

    所谓盐穴,是指地下盐岩层中通过水溶法形成的空洞。中国是盐岩资源丰富的国家,从四川盆地到江汉平原,从塔里木盆地到黄淮地区,广泛分布着适合建造盐穴的盐层。以平顶山项目为例,其所在的叶县地区,盐矿资源储量居全国前列,盐层累计厚度可达数百米。

    盐穴之所以适合储氢,在于其独特的物理化学特性。首先,盐岩具有极低的渗透率,氢气分子难以穿透盐层向外扩散;其次,盐岩具有”自愈合”特性,在高压下能够自动封闭微裂缝,这是金属容器难以企及的优势;第三,深层盐穴本身承受着巨大的地层压力,氢气在自然压力下即可保持高密度状态,无需持续消耗能量维持高压;最后,已有的盐穴可以通过技术改造”变废为宝”,避免了大规模新建设的成本。

    平顶山盐穴储氢项目的技术参数充分说明了这种模式的可行性:腔体埋深1418米,水溶体积超过3万立方米,可储存150万标准立方米氢气。这个数字意味着什么?按照一座氢基竖炉钢铁厂每天消耗100万立方米的用氢量计算,这个盐穴的储氢能力可以支撑该厂连续运行一天半。如果将其串联起来形成盐穴集群,理论上可以实现季节性储能和大规模能源调峰。

    从”一点突破”到”全链贯通”

    盐穴储氢的商业化运营,意义远超一个技术突破本身。它打通了氢能产业链中最重要的”咽喉”环节,让”绿氢东送”从愿景走向现实。

    要理解这一点,需要回顾中国氢能产业的空间布局。中国可再生能源的”富矿”集中在”三北”地区——西北的风光资源、东北和华北的生物质能源、西南的水电资源。这些地区生产的绿氢成本低廉,青海的电解水制氢成本已经可以控制在每公斤15元以内,西部光照条件好的地区甚至更低。然而,如何将这些廉价绿氢输送到东部能源消费中心,一直是产业难题。

    管道运输氢气是理想方案,但专用输氢管道建设投资巨大,且需要沿途足够的氢气消纳场景支撑;长管拖车运输则经济半径有限,超过500公里后成本优势锐减。盐穴储氢提供的解决思路是:在大规模可再生能源富集地附近建设地下储氢库,将波动的绿氢生产”削峰填谷”,实现稳定供应;同时,在下游应用端配套建设盐穴储氢设施,形成”集中生产+分布储存+灵活调度”的物流体系。

    更值得关注的是,盐穴储氢技术与正在快速发展的天然气掺氢技术形成了协同效应。4月19日,全国首个10万户级天然气掺氢规模化应用项目在山东潍坊启动,依托现有燃气管网向居民用户供应掺氢天然气。这条技术路线的逻辑是:利用氢气替代部分天然气,降低碳排放;同时借助成熟的天然气基础设施实现氢气运输。

    然而,天然气管网的掺氢比例受到严格限制——过高的氢气含量会影响管道的力学性能和安全运行。盐穴储氢的介入,可以将高纯度氢气先储存起来,在需要时再以可控速率注入管网,从而实现更高的掺氢灵活性和安全性。这种”盐穴+管网”的耦合模式,为氢能在燃气领域的规模化应用打开了新空间。

    政策共振:从顶层设计到产业落地

    盐穴储氢的技术突破,并非孤军奋战。2026年开年以来,氢能产业迎来了一系列政策层面的”及时雨”,形成了顶层设计与基础设施突破的同频共振。

    4月16日,国务院办公厅发布《关于更高水平更高质量做好节能降碳工作的意见》,在”推广节能低碳运输工具”一节中明确写入”积极发展电动(氢能)重型卡车”。这十个字看似简短,实则意义深远——这是氢能重卡首次被写入中办国办顶层文件,意味着国家层面对氢能在交通领域应用的态度从”鼓励探索”升级为”积极推动”。

    往前推一个月,3月16日,工信部、财政部、国家发展改革委三部门联合发布的《关于开展氢能综合应用试点工作的通知》更为具体。这份编号”工信部联节〔2026〕59号”的文件,第一次将氢能应用场景从传统的燃料电池汽车拓展到绿色氨醇、氢基化工、氢冶金、掺氢燃烧等五个工业领域。文件的核心意图是:打破氢能应用”车端独大”的局面,推动氢能向更广阔的工业场景渗透。

    政策信号的叠加效应正在显现。2026年一季度,中国燃料电池系统累计装机量达到101.96兆瓦,同比增长31.2%;前两个月全国氢能备案项目82个,总投资约474.36亿元,项目覆盖绿氢制备、储运装备等全产业链环节。截至目前,全国已建成加氢站574座,稳居全球首位;全国燃料电池汽车保有量已超过5万辆。三部门试点通知更是设定了明确目标:到2030年,全国燃料电池汽车保有量力争达到10万辆。

    从这一连串数字中可以看出,中国氢能产业正在经历从”技术验证”向”规模扩张”的阶段跃迁。而盐穴储氢项目的投产,正是这一跃迁中不可或缺的”基础设施支撑”。

    商业化之路:成本与技术的赛跑

    当然,欢呼之余也需要清醒地看到,盐穴储氢的商业化之路仍然任重道远。

    从技术层面看,中国在盐穴储氢领域已经实现了关键核心设备的100%国产化,包括高压氢气压缩机、专用盐穴注采管柱、临氢密封材料等。然而,盐穴建造周期长、选址条件苛刻、盐层地质条件评估复杂等问题,仍然制约着规模化推广的速度。平顶山项目从选址到投产历时超过三年,折射出地下储氢工程”慢工出细活”的特性。

    从经济层面看,当前盐穴储氢的成本竞争力尚未完全显现。按照行业测算,大规模运营后的盐穴储氢单位成本有望低于高压气态储氢,但初期投资和建设周期的不确定性,使得这一成本优势存在变数。更重要的是,盐穴储氢的商业模式高度依赖下游用氢规模的增长——只有当绿氢制备和终端应用形成足够的体量,地下储氢的”规模效应”才能真正释放。

    从标准体系看,盐穴储氢作为新兴技术领域,相关安全规范和技术标准仍在完善之中。虽然平顶山项目首创了”地表—井筒—腔体”天地空一体化安全监测技术,但将其推广为行业通行的技术规范,还需要更多的工程实践和经验积累。

    展望:万亿赛道的”关键一跃”

    尽管挑战重重,但盐穴储氢突破的战略意义已经超越了技术本身。它所解决的,不仅仅是氢能产业链的一个”痛点”,更是整个能源转型的”关键节点”。

    国际能源署(IEA)在其《全球氢能评论》中指出,大规模季节性储能将是高比例可再生能源电力系统的”刚需”。氢气作为能量密度最高的化学能源载体,在跨季节、长周期储能场景中具有不可替代的优势。而地下盐穴储氢,恰恰是实现这一优势的最佳技术路径。

    从更宏观的视角看,氢能的战略价值不仅在于能源本身,更在于它作为”工业血液”的特殊地位。钢铁、化工、炼油等传统高排放行业,迫切需要氢能作为深度脱碳的支撑;数据中心、远洋船舶、航空航天等新兴用能场景,氢能也是最具可行性的零碳解决方案。盐穴储氢的突破,为这些潜在需求提供了”供得上、用得起”的现实可能。

    2026年,或许会被未来历史记录为氢能产业化真正的”元年”。不是因为概念喧嚣,而是因为一批像盐穴储氢这样的”硬骨头”被啃了下来。当技术突破与政策推动形成合力,当基础设施与市场需求双向奔赴,一个万亿级的产业新赛道正在从图纸走向现实。

    在河南平顶山那个深达1418米的盐穴中,储存的不仅是150万立方米氢气,更是一个国家能源转型的雄心,以及一个新兴产业从”不可能”到”可能”的信念。

    延伸阅读:2026年4-5月中国新能源领域六大硬核突破包括:宁夏算电协同绿电直供项目、平顶山盐穴储氢、浙江松阳抽水蓄能最深竖井、云南全国产控制系统水光互补项目、山东潍坊天然气掺氢规模化应用、宁波万吨级纯电动智能船舶首航。这些项目共同勾勒出中国能源转型从点到面、系统协同的深刻变革。