分类：硬件前沿

ASML新一代EUV光刻机量产：芯片制造跨入1.8nm埃米纪元
2026年5月20日，荷兰光刻机巨头ASML在比利时imec行业峰会上扔下一颗重磅炸弹：新一代High-NA EUV光刻机（型号Twinscan EXE:5200B）正式进入稳定量产阶段。这意味着，人类制造芯片的精度再次跃升，芯片产业正式跨入所谓的“埃米时代”。

从”纳米”到”埃米”：0.22的跨越意味着什么

在聊High-NA EUV之前，先得搞清楚一件事——光刻机到底是干什么的。芯片的本质，是在硅片上刻画出几十亿甚至上百亿个微小的晶体管。光刻机就是这个“刻画”过程的核心设备，用极紫外光（EUV）在硅片上“画”出电路图案。精度越高，画出来的晶体管就越小，芯片性能越强、功耗越低。

ASML目前是全球唯一能量产EUV光刻机的企业，没有之一。而这次量产的High-NA EUV，堪称EUV的“超级升级版”。

这台机器最关键的突破，是把光学系统的数值孔径（NA）从上一代EUV的0.33大幅提升到0.55。表面看只是0.22的数值增长，但它带来的却是质的改变：

分辨率提升：单次曝光就能刻出8nm的特征尺寸，比上一代小了1.7倍。这意味着同样面积的芯片上，晶体管密度理论上可以提升2.9倍。

工艺简化：过去制造3nm、2nm芯片，需要多次曝光、几十道复杂工序。现在有了High-NA EUV，关键层一次曝光就能搞定，工序减少超过30%，芯片良率大幅提升。

性能飞跃：同等面积下，芯片性能提升约60%，功耗降低约45%。这对于当前AI算力芯片、高端存储芯片来说，简直是久旱逢甘霖。

量产数据：不是实验室概念，已实战验证

ASML官方公布的量产数据，全部基于50万片晶圆的实际加工验证，绝非纸上谈兵：
- 稼动率：当前稳定在80%，2026年底目标提升到90%，已达到大规模量产的成熟标准
- 产能效率：每小时处理175-185片晶圆，比上一代EUV提升明显，单台年产能可支撑数百万片高端芯片
- 稳定性：累计加工超50万片晶圆，套刻精度达到0.7nm，各项指标全部达标
但这台机器的造价同样令人瞠目：单台约4亿美元，折合人民币约27.25亿元，相当于27架波音737的价格。由于技术复杂度极高、供应链要求极严，ASML 2026年全年计划仅出货5-6台，2027年才会逐步提升产能。全球顶尖芯片厂商都在争抢这有限的产能，谁先拿到、拿到更多，谁就能抢占2nm以下制程的先机。

谁先用上：三大巨头已率先布局

ASML从2025年底开始向核心客户交付High-NA EUV，目前三家巨头已经装机并进入试产阶段。

英特尔：首家验收，主攻1.4nm制程。2025年12月，英特尔完成全球首台High-NA EUV的验收，在美国波特兰工厂装机，主要用于Intel 14A工艺（等效1.4nm），目标2027-2028年大规模量产。目前已累计处理超3万片晶圆，进入试产爬坡阶段。

SK海力士：存储芯片领域的首家部署者。2025年9月在韩国DRAM工厂完成安装，用于下一代HBM（高带宽内存）和先进DRAM，解决AI大模型对高速存储的瓶颈问题。首批HBM芯片预计2026年Q3-Q4正式交付，直接供应英伟达、AMD等AI芯片厂商。

三星：2026年上半年接收第二台High-NA EUV，部署在美国得克萨斯州泰勒的2nm GAA晶圆厂，用于2nm及以下先进逻辑芯片，与英特尔、台积电正面竞争。

有意思的是，全球最大芯片代工厂台积电目前明确表示暂不采购High-NA EUV。台积电认为，现有Low-NA EUV通过工艺优化还能支撑到A16制程，暂时不需要花4亿美元买新设备。等未来产能提升、成本下降后，再考虑大规模导入。这种“按需采购”的务实态度，倒是很符合台积电一贯的风格。

三大变革：全球芯片格局彻底改写

High-NA EUV的量产，绝不是简单的设备升级，而是从芯片性能、产业分工、竞争格局三个层面，带来颠覆性改变。

芯片性能：AI算力迎来质变

对于当前火热的AI产业来说，High-NA EUV的意义非凡。1.4nm制程能让AI芯片塞进更多晶体管，AI训练速度提升50%以上，推理功耗降低一半，直接缓解当前AI大模型“算力不够、功耗太高”的痛点。

高端存储领域同样受益匪浅。HBM用High-NA EUV制造后，带宽提升30%-50%，延迟大幅降低，成为AI服务器、数据中心的标配。这将彻底解决AI大模型的存储瓶颈问题。

对普通消费者而言，未来1-2年高端手机、笔记本用上1.4nm芯片后，同样电池容量续航多2-3小时，同样体积性能提升50%，发热控制更好。

产业分工：马太效应加剧

先进制程的门槛被进一步拉高。目前全球只有英特尔、三星、SK海力士、台积电四家有实力玩2nm以下制程，其他厂商基本被排除在外。加上单台4亿美元的高昂成本、一条2nm产线超200亿美元的投资，中小芯片厂彻底与先进制程无缘。

这也意味着，全球芯片代工格局将加速分化：台积电靠现有EUV守住2nm市场，英特尔、三星靠High-NA EUV冲击1.4nm，形成“2nm vs 1.4nm”的双线竞争格局。

供应链博弈：技术封锁更严

需要清醒看到的是，High-NA EUV作为当前最顶尖的半导体制造技术，完全禁止向中国大陆出口，连相关零部件、技术服务都被严格限制。这意味着，中国大陆先进制程芯片的自主研发，短期内难以突破2nm以下瓶颈，只能在成熟制程（28nm及以上）持续深耕。

差距虽然客观存在，但也不必过于悲观。在成熟制程、先进封装、特定芯片设计等领域，中国半导体产业仍有广阔的发展空间。这台机器的量产既是挑战，也是倒逼自主创新的动力。

理性看待：不是万能神器

尽管High-NA EUV意义重大，我们也要客观看待它的局限性。

成本极高，短期难以普及。单台4亿美元，加上良率爬坡、工艺磨合，首批1.4nm芯片的价格注定不菲，只会用在AI服务器、高端HBM等领域，消费电子普及至少要到2028年以后。

产能有限，供不应求。2026年仅5-6台的出货量，面对全球巨大的需求，产能缺口明显，高端芯片短缺的情况还会持续1-2年。

工艺复杂，良率提升需要时间。1.4nm制程对工艺控制、材料、环境要求极高，良率从当前的60%-70%提升到90%以上，需要至少1-2年的时间。

写在最后

ASML High-NA EUV光刻机的量产，标志着全球芯片制造正式进入埃米级时代。这是半导体产业发展的必然结果，也是AI算力需求爆发的必然选择。

对全球产业而言，这是一次技术跃迁，也是一次格局洗牌。对中国半导体而言，这既是挑战，也是机遇。我们既要看到差距，也要保持信心，在成熟制程、先进封装、芯片设计等领域持续突破，走出一条适合自己的发展道路。

毕竟，芯片产业的竞争从来不是百米冲刺，而是一场漫长的马拉松。每一个技术突破，最终都会转化为普通人能感受到的科技进步。

本文信息来源：ASML官方公告、imec行业峰会公开数据、英特尔/SK海力士/三星官方报道。
2026年5月21日
光子芯片换道超车：薄膜铌酸锂国产化如何重写半导体规则
从硅的困境到光的突围

当全球芯片产业仍在硅基制程的纳米级竞赛中焦灼时，一场静悄悄的”换道”革命正在光学领域上演。

2026年5月，中国科研团队在光子芯片领域取得的系列突破，被外媒评价为”换道超车”——在传统硅基芯片受制于EUV光刻机供应的背景下，中国选择了一条完全不同的技术路径：用光子代替电子，用光速重新定义算力竞赛的规则。

太极III：华为的光子AI野心

5月中旬，华为联合中科院正式推出全球首款量产光子AI芯片”太极III”。这款芯片的核心性能数据令人震惊——在特定AI推理任务中，算力提升达到10倍，能耗却降至传统芯片的千分之一。

以当下最火的AI大模型推理为例，传统GPU集群每秒处理数亿次矩阵运算，代价是数兆瓦的功耗和庞大的散热系统。而太极III用光子传输替代电子计算，光速级别的运算让同样的任务可以在更短时间内完成，功耗却只有原来的千分之一。换算成实际场景：一个需要10台服务器机柜的AI推理任务，未来可能只需要一个巴掌大小的光子计算模块。

太极III的核心材料是铌酸锂晶体——一种被称为”光学硅”的特殊介质。华为选择这条路，背后是长达五年的技术布局。一位参与研发的工程师透露，太极III的研制难点不在于电路设计，而在于”光路的雕刻”——如何在毫米尺度的芯片上精确操控光信号的传输、调制和路由，光的波长比电子的最小通道还要精细1000倍。

薄膜铌酸锂：被卡脖子的”光学硅”

如果说太极III是光子芯片的”心脏”，那薄膜铌酸锂就是制造这颗心脏的”特殊钢材”。

铌酸锂是一种非线性光学材料，对光信号的调制效率远超传统硅基材料，被业界视为光子芯片的核心衬底。然而，高端铌酸锂晶圆长期被法国立晶（NLM）和日本光子公司垄断，中国在此领域起步较晚。

2026年，这个局面被彻底打破。

光库科技宣布其高端薄膜铌酸锂调制器实现量产，成为国内唯一能够供应这一核心材料的企业，打破了海外企业长达二十年的技术垄断。

更关键的是超晶科技的突破——这家企业实现了从晶体生长、研磨抛光到薄膜制备的全流程工艺闭环，成为全球唯一可规模化量产8英寸高端薄膜铌酸锂晶圆的IDM企业，良率超过95% ，成本却比海外竞争对手低60% 。

天通股份则在国内率先实现8英寸铌酸锂晶圆量产，其光学级晶圆产品已经供不应求，交付周期已经排到2027年——这或许是近年来最甜蜜的”产能焦虑”。

从跟跑到领跑：跨越二十年的追光之旅

回顾中国光子芯片的发展历程，是一段从追赶到并跑、再到部分领域领跑的典型样本。

2000年代初，当西方国家开始布局光子集成技术时，中国还处于”光通信”时代的初级阶段，主要精力放在光纤铺设和设备组装上。转折点出现在2015年前后，武汉光电国家研究中心、华中科技大学光谷实验室、上海交通大学等一批科研机构开始系统性布局薄膜铌酸锂技术。

中国团队采取了一种”农村包围城市”的策略：不追求一步到位的完整技术链，而是先在某个细分环节突破，建立信心，再逐步向上下游延伸。

2022年，华中科技大学团队率先在薄膜铌酸锂制备工艺上取得突破；2024年，国家信息光电子创新中心实现250GHz带宽调制器的批量交付；2026年，太极III的量产标志着中国光子芯片正式从”能用”进入”好用”阶段。

带宽破纪录：光纤通信的新里程碑

在太极III之外，5月还有一项技术突破值得关注：国家信息光电子创新中心自主研发的超宽带光子芯片，以250GHz带宽刷新了同类器件的世界纪录。

目前商用最高规格的硅基调制器带宽大约在60-80GHz左右，这意味着国家信息光电子创新中心的成果在性能上领先了3-4倍。在光纤通信场景中，该芯片实现了单通道传输速度512Gbps的惊人成绩，太赫兹无线传输单通道速度也达到400Gbps，可以同时为86个用户提供8K超高清视频流。

三维光子神经网络：6554TOPS的算力狂想

光子技术的突破不限于AI和通信领域。华中科技大学光谷实验室张新亮、董建绩教授团队联合上海交通大学唐豪团队，研制出全球首款可编程三维光子神经网络芯片。

研究团队采用飞秒激光直写技术，在玻璃内部直接”雕刻”出三维波导网络，并集成74个微型加热器实现可编程控制。张新亮教授将这一结构比喻为”光路立交桥”——光信号可以在三层互通的空间中自由穿梭，使得芯片面积只需随通道数线性增长，突破了传统平面结构的限制。

性能数据显示，这款芯片的理论计算吞吐量高达6554TOPS（每秒万亿次操作），在手写数字识别测试中准确率超过93% 。更重要的是”可编程”特性带来的灵活性——传统光子芯片往往是针对特定任务优化的专用芯片，可编程三维光子神经网络则可以通过软件配置实现不同功能，大幅降低了光子计算的门槛。

换道超车的底层逻辑

为什么光子芯片对中国如此重要？

答案在于一个被反复讨论却始终无解的困境：EUV光刻机。目前全球能够制造7nm以下芯片的厂商，都离不开荷兰阿斯麦的EUV光刻机。由于美国的技术封锁，中国企业获取EUV设备的渠道长期受阻。

光子芯片的价值在于，它根本不需要EUV光刻机。光子芯片的核心工艺是光波导的刻蚀和调制器的制备，这些工艺在普通的深紫外（DUV）光刻机上就能完成。更重要的是，光子芯片对制程的要求远低于电子芯片——130nm甚至更宽的线宽，已经足够支撑高性能光子器件的制造。

当然，这并不意味着光子芯片会完全替代硅基芯片。两种技术各有优势和适用场景：硅基芯片在通用计算、存储等领域仍是绝对主力，光子芯片则在AI推理、通信传输、传感计算等场景展现出独特价值。未来的芯片竞争，更可能呈现”光电融合”的格局——硅基处理基础计算，光子加速特定任务，两种技术协同配合。

产业化前夜的挑战与机遇

尽管进展喜人，中国光子芯片产业仍面临现实挑战。

首先是产能问题。 目前太极III虽然实现了量产，但产能规模与传统GPU相比仍有数量级的差距。要真正支撑起AI算力的需求，产能爬坡是关键。

其次是生态建设。 光子芯片的编程模型、工具链与传统的电子芯片完全不同，需要从底层重新构建软件生态。

第三是标准制定。 目前光子芯片领域尚无统一的技术标准，不同厂商的芯片在接口、封装等方面存在差异，限制了产业链的协同效率。

但挑战的另一面，往往就是机遇。2026年被业内视为薄膜铌酸锂和光子AI芯片的产业化元年。从材料供应商光库科技、超晶科技的订单暴增，到华为太极III的正式量产，这条原本小众的技术赛道正在加速走向主流。

结语

回望2026年5月的这波光子芯片突破，最让人印象深刻的，或许不是某一项具体的技术成果，而是一种战略方向的笃定。

当全球芯片产业在硅基制程的”纳米战争”中陷入内卷时，中国选择了光子这个新方向——不是因为它更容易，而是因为它更有可能带来根本性的突破。

这条路能否走通，现在下结论还为时尚早。但有一点可以确定：那些曾经认为”中国芯片永远落后西方”的人，需要重新审视这个判断了。

在光子芯片这个赛道上，胜负未定。而中国，已经拿到了入场券。

延伸阅读
相关阅读
- 《量子计算三大技术路线并进：2026年中国量子产业正式步入商业化周期》
- 《光子AI芯片商用元年：如何用光速重新定义算力竞赛》
2026年5月18日

理想自研马赫M100芯片：1280TOPS算力背后的数据流架构革命

一、官宣即炸场：参数拉满背后的行业震动

2026年5月12日，理想汽车扔出一颗技术深水炸弹——自研车规级AI芯片马赫M100正式官宣。这不是一款简单的“期货芯片”，而是已经具备量产能力、即将在旗舰车型L9 Livis上实现装车的硬核产品。

先看这组硬核参数：

制程工艺：台积电5nm车规级工艺
峰值算力：1280 TOPS（INT8）
首发车型：理想L9 Livis（双芯片协同，总算力2560 TOPS）
有效算力：单芯片是英伟达Thor-U的3倍，双芯片协同可达5-6倍

这组数据意味着什么？目前市面上绝大多数车载AI芯片的单颗算力还在500-1000 TOPS区间徘徊，而理想直接用一颗芯片就刷新了行业天花板。更关键的是，这不是通过堆算力单元实现的“暴力美学”，而是通过架构层面的范式革命实现的“精准打击”。

业界对此反应强烈。车规级芯片长期被Mobileye、高通、英伟达等国际巨头把持，国产替代方案要么性能不足、要么功耗感人、要么车规认证难产。而马赫M100的发布，第一次让国产车载AI芯片在算力维度站上了与头部玩家正面交锋的位置。

二、架构大换血：从“仓库搬运”到“高速流水线”

如果只是算力参数的提升，马赫M100还不足以让整个行业为之震动。真正让这款芯片具有划时代意义的，是其底层架构的颠覆性创新。

传统冯·诺依曼架构的“死穴”

理解这个突破，需要先弄清楚传统AI芯片的工作方式。以GPU为代表的传统芯片，沿用的是冯·诺依曼架构——计算单元和存储单元是分离的。数据需要不断在“仓库”（内存）和“工人”（计算单元）之间来回搬运：算一次，搬一次；算得越多，搬得越累。

这带来的结果是：延迟高、功耗大、效率低。就像一个工厂，原料要反复进出仓库，浪费大量时间和人力成本。对于需要实时响应的自动驾驶场景来说，这种架构天生存在瓶颈。

数据流架构的“降维打击”

马赫M100选择了一条完全不同的技术路线——动态数据流架构。其核心理念是：数据驱动，而非指令驱动。

编译器提前规划好所有数据的流动路径，数据从上一个计算单元完成处理后，直接、无损地流向下一个计算单元。整个过程“全程不进仓库，不绕弯路”。就像一条高度自动化的流水线，每个工位只需要专注于自己手头的活，物料自动送达，产品自动流转。

这种架构的优势是全方位的：

表格

对比维度	传统GPU架构	马赫M100数据流架构
数据搬运	频繁访问外部内存	无需外部内存访问
延迟	高（毫秒级）	低（200-300毫秒端到端）
能耗	高（数据搬运耗能大）	同功耗下降低40%
效率	受限于带宽瓶颈	计算资源利用率更高

官方数据显示，在同等功耗下，M100的推理延迟降低了35%，能耗减少了40%。这对于对能效极其敏感的电动车来说，意味着更强的性能释放和更扎实的续航表现。

ISCA认证：汽车企业的学术“高光时刻”

衡量一项技术创新含金量的最好标尺，是学术界是否认可。理想汽车关于数据流架构的论文，被2026年国际计算机体系结构大会（ISCA）工业分会正式录用。

ISCA是计算机体系结构领域全球最顶级的学术会议之一，与MICRO、HPCA并称为“体系结构三大会”。历年入选论文多来自英特尔、AMD、NVIDIA、高通等芯片巨头，以及斯坦福、MIT等顶尖高校。理想汽车是全球第一家以第一作者身份入选ISCA工业分会的汽车企业。

这意味着什么？意味着理想不是在“PPT造芯”，而是真的在底层架构层面做出了具有学术价值的创新突破。

三、用户体验重构：从“辅助驾驶”到“预判式安全”

技术参数再漂亮，最终还是要落到用户体验上。马赫M100对普通车主意味着什么？

自动驾驶：从“反应”到“预判”的质变

当前量产的L2+级辅助驾驶系统，本质上还是“反应式”的——传感器检测到障碍物，系统做出刹车或转向反应。而马赫M100搭配理想自研的3D ViT三维视觉模型，能够实现更高维度的环境感知和预测。

端到端延迟缩短至200-300毫秒，这意味着车辆的决策响应速度比人类驾驶员快将近一倍。在遇到紧急情况时，系统能够在你“反应过来”之前就完成风险评估和规避动作。

智能座舱：从“功能机”到“智能体”的跨越

车载语音助手“秒回”、复杂指令一次听懂执行、车机系统“越用越聪明”——这些体验的背后，是强大算力对车载大模型的支撑。M100能够轻松运行端侧大模型，让车机从“执行固定指令的工具”进化为“理解你、记住你、主动服务你的智能伙伴”。

更重要的是，可编程特性让芯片能够跟随AI算法一起持续迭代。现在的旗舰车型，两三年后可能因为算力不足而“落伍”。而M100的目标是让车辆在全生命周期内都能享受最新的AI能力。

四、为什么要自研：理想的底层逻辑

看到这里，可能有人会问：英伟达、Mobileye的芯片不好用吗？为什么要花四年时间、投入这么大成本去自研？

第一，摆脱“卡脖子”的战略必然

外购芯片，意味着核心技术掌握在别人手里。高昂的专利费和采购成本是一方面，更关键的是——技术迭代节奏和功能定义权都在供应商手中。想加个新功能？芯片不支持，只能等供应商下一代产品。这种被动，在智能化竞争日趋白热化的当下，是致命的。

理想的判断是：智驾系统的差异化竞争力，必须建立在自主可控的硬件底座之上。否则，你永远是在别人的框架里做“定制开发”。

第二，软硬一体才是体验最优解

苹果的A系列芯片+iOS系统组合，为什么在性能和体验上始终领先？因为芯片、系统、软件三方是深度协同设计的，每个指令的执行路径都经过全局优化。

理想正在复刻这条路径：芯片、大模型、操作系统、整车硬件，四位一体自主研发、深度打通。只有这样，才能把硬件性能压榨到极致，把用户体验打磨到“刚刚好”。

第三，长期主义的成本账

自研芯片前期投入巨大，但量产后单颗成本将显著低于外购方案。更重要的是，通过自研建立的技术壁垒，能够在竞争中形成真正的差异化优势——这是花钱买不到的护城河。

五、行业启示：从“中国制造”到“中国定义”

理想M100的意义，远不止于一款新芯片的发布。

过去十年，中国汽车工业走过了“市场换技术”的弯路，也经历了“新能源换道超车”的阵痛。但在核心芯片领域，国产替代更多时候是在“替代”——用性能打折的国产方案填补供应链空白，而非真正在技术上与国际玩家正面竞争。

马赫M100的出现，改变了这一定律。它不是低端替代，而是顶级水准的正面对决：5nm工艺、1280TOPS算力、行业第一的学术认可——这些标签放在一起，代表的不是“够用”，而是“领先”。

从产业逻辑看，这是国产汽车工业从“集成创新”走向“原生创新”的标志性事件。当一家成立不到十年的新势力车企能够在核心硬件领域拿出世界级的技术成果时，意味着中国汽车产业的创新范式正在发生根本性转变。

当然，挑战依然存在。芯片从“发布”到“量产装车”再到“经受市场长期检验”，中间还有很长的路要走。车规级的可靠性要求、极端工况下的稳定性验证、大规模量产的一致性品控——每一关都不好过。

但方向是对的。当越来越多的中国企业在核心技术上选择“自己定义规则”，而非“别人定义规则后我来适应”，中国汽车工业才能真正站上全球舞台的中央。

下一个时代的汽车产业游戏规则制定者名单里，中国的名字，值得期待。

作者：前沿科技网站内容团队

发布日期：2026-05-13

来源：前沿科技网站内容/2026-05-13/01-理想自研马赫M100芯片.md

2026年5月13日

台积电”化圆为方”如何重写先进封装游戏规则
引言：一场迟到三十年的”叛逆”

半导体封装行业有个不成文的规矩：芯片是方的，但封装必须在圆形的晶圆上进行。这种”削足适履”的传统已经维持了近半个世纪。

2026年4月，台积电在圣何塞技术论坛上正式公布CoPoS（Chip on Panel on Substrate）技术路线图，宣告这个”规矩”正式被打破。方形玻璃基板将取代圆形硅中介层，成为下一代AI芯片封装的核心载体。

这不仅仅是材料形态的更替。当芯片面积从3.3个光罩向14个乃至40个光罩演进时，传统的封装思路已经触及物理极限。CoPoS的出现，意味着半导体产业正在经历一次从”在芯片上设计系统”到”在系统里封装芯片”的根本性转变。

一、为什么CoWoS”装不下”了

理解CoPoS的价值，首先要理解它的 predecessor——CoWoS（Chip on Wafer on Substrate）的困境。

CoWoS是台积电旗舰级封装技术的代名词。通过在芯片和基板之间插入一层硅中介层，CoWoS能够将HBM高带宽内存与计算核心高密度互连，是英伟达H100、GB200等旗舰AI加速器的”标准配置”。这种架构的稳定性经过了多年验证，成为行业标杆。

但问题在于：AI芯片正在变得越来越大。

根据台积电2026年公布的路线图，2024年其先进封装面积为3.3个光罩（Reticle），2026年提升至5.5个，2027年达到9.5个。更远期的目标是：2028年实现14个光罩，2029年冲击40个以上。

这意味着什么？14个光罩的封装面积约12000平方毫米，相当于两张扑克牌大小。当芯片需要集成如此多的计算芯粒和HBM堆叠时，传统的圆形硅中介层面临三重困境：

面积利用率低。从圆形晶圆上切割矩形芯片，边缘损耗巨大。以当前主流的12英寸晶圆为例，切割面积利用率不足70%，意味着近三分之一的硅材料被浪费。

翘曲问题严重。大尺寸硅中介层在热处理过程中容易变形，良率随面积增大而急剧下降。

成本不可承受。硅是昂贵的材料，制造更大面积的中介层，成本几乎是线性增长。

英伟达、谷歌TPU、苹果M-Ultra等AI巨头的需求正在推动这个趋势。当”大芯片”成为AI算力的标配，CoWoS的物理极限就成了整个行业的瓶颈。

二、CoPoS：从”圆”到”方”的范式转移

台积电的解决方案出人意料却又合乎逻辑——既然芯片是方的，为什么非要在圆形的基板上封装？

CoPoS用方形玻璃面板替代圆形硅中介层。这一改变带来四个关键优势：

面积不受限制。玻璃面板可以做到510×515mm甚至更大，不再受晶圆尺寸的束缚。面积利用率的提升直接转化为成本优势。

信号损耗极低。玻璃的介电常数比硅更低，在高频信号传输中表现更优。这对于AI芯片中动辄数十GB/s的带宽需求至关重要。

热膨胀系数可调。玻璃材料的热膨胀系数可以通过配方调整，匹配芯片的硅材料特性，从根本上缓解翘曲问题。

通孔密度更高。玻璃通孔（TGV）的深宽比可达50:1，远超硅通孔（TSV）的10:1，这意味着更高的互连密度。

从技术指标看，CoPoS的试产线已在2026年第一季度启动建设。台积电在台南嘉义的产线于2月份开始交付设备，计划6月份完成整条产线建设。这意味着CoPoS从技术发布到工程化落地的时间窗口被压缩到了极致。

三、三星、苹果入局：产业链共振已经启动

CoPoS的价值不仅在于技术本身，更在于它正在引发一场产业链的共振。

苹果公司已开始内部测试三星提供的玻璃基板用于AI封装。这则来自韩国媒体The Elec的报道透露了一个重要信号：终端巨头正在为CoPoS时代的到来提前布局。

三星的玻璃基板计划更为激进。据报道，三星电机计划2026年第四季度运营玻璃基板试点生产线，比原计划提前一个季度。英特尔同样不甘落后，2026年初已推出采用800微米玻璃基板的EMIB封装样品。

从产业链视角看，CoPoS的崛起正在重塑三个领域的价值分配：

玻璃基板与上游材料。康宁、三星电机等玻璃材料供应商迎来新的增量市场。TGV（玻璃通孔）全制程能力成为核心竞争力。

核心设备商。面板级封装需要全新的设备生态：超快激光打孔设备、面板级电镀设备、CMP平坦化设备、直写光刻设备以及AOI自动光学检测设备。每一台设备都是一个新的增量市场。

封装测试厂商。传统封测厂需要向上游玻璃基板及材料领域延伸，而面板制造商则可能凭借玻璃基板加工优势向下游封装环节渗透。

四、TGV：玻璃基板的”神经网络”

如果说玻璃基板是CoPoS的”骨骼”，那么TGV（Through Glass Via，玻璃通孔）就是它的”神经网络”。

TGV工艺是为玻璃基板”打通神经”的关键技术。其完整流程包括：激光诱导改性、刻蚀、清洗、双面电镀、退火、化学机械抛光（CMP）等环节。其中，超快激光打孔设备是最核心的环节。

为什么要用激光而非传统的光刻工艺？原因在于玻璃材料的特性。玻璃不像硅那样容易被化学刻蚀，需要用激光精确改性后才能进行后续加工。而且，TGV的深宽比高达50:1，远超TSV的10:1，这意味着在玻璃上打的孔更深、更窄，对工艺精度要求极高。

另一个关键环节是RDL（Re-Distribution Layer，重布线层）。随着芯片互联密度提升，RDL金属层数翻倍，铜凸点间距缩小至5微米。直写光刻设备、刻蚀、薄膜沉积及检测设备的需求被显著拉动。

这些看似”配角”的设备和材料，实际上正在成为这场封装革命中最确定的受益者。

五、落地节奏：比想象更快

市场对CoPoS的普遍预期存在两点显著低估：

应用范围被低估。当前市场主要关注CoPoS作为”中介层”替代CoWoS的逻辑。但研报指出，玻璃基板的低损耗、高密度优势，使其在IC载板替代、射频FOPLP封装以及CPO（Co-Packaged Optics，共封装光学）领域具备同样广阔的空间。

尤其是在1.6T及以上速率的光模块中，玻璃基板凭借其优异的高频性能和光波导集成能力，被认为是CPO的核心载体。这意味着CoPoS的影响范围远超AI芯片封装本身。

落地时间被低估。尽管台积电将CoWoS的中介层上限提升至14倍光罩，可能推迟CoPoS大规模量产的紧迫性（TrendForce预计2028年量产），但在IC载板和CPO等新兴应用上的进展，将加速玻璃基板的商业化落地。

苹果的测试、三星的加速、英特尔的产品化——这些信号都在指向同一个结论：CoPoS的产业化节奏正在全面加快。

六、封装即系统：重新定义芯片产业

回望半导体产业的发展历程，有一个清晰的演进脉络：
- 1960年代：集成电路时代，在芯片上集成电路
- 2000年代：SoC时代，在芯片上集成系统
- 2020年代：Chiplet时代，在封装里集成芯片
- 2026年开始：封装即系统时代
CoPoS的出现是这个趋势的最新注脚。当封装面积达到14个光罩、整合约10个大型运算芯粒和20个HBM堆叠时，封装本身已经变成了一个系统。

这意味着什么？意味着芯片的设计逻辑正在被彻底改写。

过去，芯片设计师在微缩晶体管尺寸的框架内思考如何提升性能。现在，他们需要在一个更大的封装空间内，优化不同芯粒之间的互连、散热和电源完整性。封装不再是芯片设计的”收尾工作”，而是芯片性能的”第一性因素”。

对于中国半导体产业而言，CoPoS既是挑战也是机遇。

挑战在于：台积电在先进封装领域的领先地位正在进一步巩固，CoWoS市占率超80%，3D封装市占率超60%，CoPoS将使这个差距进一步拉大。

机遇在于：玻璃基板、面板级封装等新兴技术仍在产业化早期，全球供应链尚未完全固化。盛合晶微、长电科技等国内封装厂商在TGV等关键工艺上已有技术积累，有望在新的产业格局中占据一席之地。

结语

2026年，半导体行业正在经历一场静默的革命。

当台积电宣布”化圆为方”，当苹果、三星、英特尔竞相入局玻璃基板，当TGV和RDL设备成为新的”卖铲人”，整个产业的价值链条正在被重构。

这不是某个单点技术的突破，而是整个封装范式的转移。从CoWoS到CoPoS，从硅中介层到玻璃面板，从”封装芯片”到”封装系统”——半导体产业正在用一种全新的方式突破物理极限。

对于从业者而言，理解CoPoS不仅是理解一项新技术，更是理解半导体产业下一个十年的竞争逻辑。谁掌握了封装，谁就掌握了定义系统性能的权力。

本文仅供技术科普，不构成投资建议。
2026年5月8日
国产AI芯片商业化突围：寒武纪净利暴涨185%，华为昇腾2026年营收剑指820亿

四年前，当华为被列入实体清单时，很多人担忧中国AI产业将陷入”无芯可用”的困境。彼时，国产芯片在性能、生态和可靠性上与英伟达的差距，似乎是一道难以逾越的鸿沟。

四年后的今天，局面正在发生微妙而深刻的变化。

2026年第一季度，寒武纪营收28.85亿元，同比增长159.56%，归母净利润10.13亿元，同比暴涨185.04%，更让行业振奋的是，这家公司经营现金流转正至8.34亿元——这意味着国产AI芯片厂商终于实现了从”烧钱研发”到”自我造血”的关键跨越。与此同时，华为昇腾2026年全年营收预计达820亿元，同比增长60%，全年出货量将达75万颗。

这些数字背后，是中国AI芯片产业从技术突破走向商业闭环的完整叙事。

从”备胎”到”首选”：国产替代的三年蜕变

回顾国产AI芯片的发展历程，2023年是一个重要分水岭。在那之前，国产芯片虽然在实验室跑分上逐渐逼近国际水平，但实际部署时却面临”没人敢用”的尴尬——不是因为性能不够，而是因为软件生态不完善、应用适配成本高、售后服务跟不上。

一位国内互联网大厂的算法工程师曾私下告诉我，他们不是不想用国产芯片，而是”不敢用”：”换平台意味着要重新优化所有模型，还要承担迁移失败的风险。没有客户愿意做第一个吃螃蟹的人。”

转机出现在2024年。随着美国芯片出口管制持续收紧，大模型厂商不得不寻求备选方案。这一被迫的”备胎转正”，却让国产芯片获得了难得的实战机会。

“说实话，最初我们也没抱太大期望。”某头部云厂商的技术负责人回忆道，”但测试结果让我们吃了一惊——昇腾910B在一些场景下的表现已经不输A100，而且价格更有优势。”

正是这种”意外之喜”，推动了国产AI芯片的规模化应用。到2026年，国产AI芯片在政务、金融、能源等关键行业中的采购占比已超过70%，彻底打破了”国产=低端”的刻板印象。

寒武纪样本：从亏损到盈利的商业闭环

寒武纪的财务数据变化，是观察国产AI芯片商业化进程的最佳样本。

2022年，寒武纪还处于持续亏损状态，全年营收7.2亿元，净亏损超过12亿元。彼时，这家脱胎于中科院计算所的AI芯片公司，被外界质疑为”PPT公司”——技术听起来很美好，但就是赚不到钱。

转折发生在2023年下半年。随着国内大模型训练需求爆发，寒武纪的思元系列芯片凭借在Transformer架构上的深度优化，获得了互联网厂商的青睐。2024年，寒武纪首次实现年度盈利，2025年营收突破80亿元，2026年仅一季度就完成了28.85亿元营收。

更值得关注的是其毛利率的持续改善。财报显示，寒武纪2026年第一季度毛利率约为65%，较2022年提升了近20个百分点。这一数字的改善，意味着公司不再依赖低价换市场，而是真正凭借产品力和服务能力赢得客户。

“我们不再只是卖芯片。”寒武纪CEO陈天石在近期采访中表示，”现在我们卖的是完整的解决方案——包括硬件、软件栈、技术支持和定制化服务。这种综合能力，才是我们的核心竞争力。”

华为昇腾：生态战法与75万颗芯片的野望

如果说寒武纪代表的是”技术派”路线，那么华为昇腾则是”生态派”的代表。

昇腾芯片的成功，很大程度上得益于华为打造的完整软硬件生态。从底层的CANN计算架构，到中层的MindSpore框架，再到上层的ModelArts平台，华为几乎复刻了英伟达的CUDA帝国模式，只是换了一套更贴合中国市场的”玩法”。

这种”全家桶”式的生态策略，正在显现威力。2026年，阿里巴巴、字节跳动、腾讯等头部互联网厂商纷纷扩大昇腾芯片采购量，用于大模型训练和推理部署。一位知情人士透露，字节跳动2026年的昇腾订单量是其2025年的三倍。

“昇腾最大的优势不是性能，而是稳定。”某AI创业公司的技术VP告诉我，”用昇腾出问题，打个电话就有人来支持；用英伟达显卡，遇到问题可能要找代理商层层反馈。国内厂商更看重这种本地化服务能力。”

更重要的是价格。知情人士透露，昇腾910B的价格比同性能英伟达芯片低30%-40%，在当前大模型竞争进入”拼成本”阶段后，这一价格优势成为客户选择的重要考量。

隐忧与挑战：热闹背后的冷思考

尽管国产AI芯片捷报频传，但我们也要清醒地看到产业面临的挑战。

首先是产能问题。芯片制造是典型的重资产、长周期产业，设计出来不代表能量产。目前，国内AI芯片主要依赖台积电和三星代工，一旦地缘政治出现变数，产能供应存在风险。虽然中芯国际的7nm工艺已有突破，但在先进封装和高性能计算芯片领域，与国际龙头仍有差距。

其次是生态深度。英伟达CUDA生态经过十几年积累，拥有数百万开发者、丰富的工具链和成熟的社区。国产芯片的软硬件生态虽然在快速追赶，但在某些细分场景（如高性能计算、科学计算）仍存在工具链缺失问题。迁移成本，是阻碍更多客户”上车”的现实障碍。

第三是同质化竞争。当前，国产AI芯片赛道已涌入数十家玩家，产品同质化现象严重。当市场从”缺芯”转向”饱和”，价格战和淘汰赛将不可避免。谁能笑到最后，还是一个未知数。

未来已来：AI算力的新格局

尽管挑战重重，国产AI芯片的趋势已经不可逆转。

从宏观层面看，AI算力自主可控已成为国家战略。政策层面的持续支持、庞大的国内市场需求、产业链上下游的协同创新，共同构成了国产芯片发展的”天时地利人和”。

从产业层面看，国产芯片正在从”替代”走向”引领”。在某些细分领域，如大模型推理、边缘计算、特定行业AI应用，国产芯片凭借定制化优势和快速迭代能力，已展现出与国际巨头正面竞争的实力。

“五年前，我说国产AI芯片能追上英伟达，很多人觉得我是在吹牛。”一位从业二十年的芯片老兵告诉我，”现在，我可以说，在某些场景下，我们已经不输给任何人了。”

这句话，或许是国产AI芯片逆袭之路的最佳注脚。

2026年5月7日
量子计算硬件产业化加速：2026年四大技术路线突破与资本布局

一、资本热潮：从”投技术”到”投落地”的逻辑转变

量子计算赛道的融资故事，在2026年发生了质的飞跃。行业数据显示，2026年第一季度，中国量子计算领域融资总额达到33亿元，直接超越2025年全年24.73亿元的融资规模，融资频率与金额均创下历史新高。更值得关注的是，这轮资本热潮的流向发生了根本性变化：资本评估体系正从早期的”投技术、投科研”转向”投落地、投商业化”，具备实际场景应用和工程化能力的企业成为资本追捧的核心标的。

头部企业的融资动态清晰地勾勒出这一趋势。玻色量子在3月31日完成10亿元B轮融资，由北京金控、工银资本等联合领投，资金重点投向深圳专用量子计算机工厂的扩产与技术迭代。这家从创立之初就锁定专用量子计算机赛道的企业，聚焦能够快速落地、为产业创造实际价值的算力产品，契合资本对长期回报的需求。图灵量子在2026年上半年已获得融资近10亿元，其中国家创业投资引导基金长三角基金的首个量子直投项目尤为引人注目——这标志着国家层面的战略资本正式重仓量子赛道。量旋科技C系列累计融资近10亿元，重点投向高比特超导量子芯片的研发与规模化应用，IPO步伐同步加快。

这场资本热潮并非盲目押注。 从国家引导基金首次重仓量子赛道，到多条技术路线实现工程化突破，再到生物医药、金融等场景的应用案例不断涌现，中国的量子计算生态正以前所未有的速度成熟。麦肯锡预测，到2040年，全球量子技术领域市场规模将达到1980亿美元，且主要由量子计算和量子通信产业推动。以色列量子技术创企Quantum Machines联合创始人兼CEO Itamar Sivan的观点更为直接：”这是一场没有输家的游戏。”

二、四路竞速：超导、光量子、离子阱、中性原子的工程化突破

量子计算的实现路径从来不是单选题。当前全球量子计算主要围绕超导、光量子、离子阱和中性原子四条技术路径展开竞争，而中国在每条赛道上均取得了标志性进展，呈现出”多路并行、各有突破”的格局。

超导路线是目前产业化最为成熟的方向。本源量子自主研发的”本源悟空”超导量子计算机，已实现72比特芯片的批量生产，其硬件研制团队负责人孔伟成博士带领团队坚持全栈式自主研发，实现了超过80%的国产率，核心部件完全自主可控。截至2026年4月底，”本源悟空”已为全球163个国家和地区超4700万人次提供量子算力服务，完成90万余次量子计算任务。近期，该设备还上线了量子知识大模型Origin Brain等人工智能工具，推动量子算力在电力、金融、工业等复杂场景中探索应用。中电信量子集团的”天衍-287″计算机搭载”祖冲之三号”同款芯片，在特定问题上的处理速度比当前最快超级计算机快4.5亿倍，并已接入云平台开放量子优越性服务。

光量子路线凭借室温运行、抗干扰强等优势，被视为实用化突破的重要方向。图灵量子构建了国内唯一覆盖芯片、硬件、整机、软件的全栈自主光量子技术体系，在光量子芯片制备和量子光学系统集成方面建立了完整的技术护城河。玻色量子则专注于专用机赛道，其千比特级产品”驭量·山海1000″瞄准新药研发等快速变现场景，2025年于深圳落地的中国首个规模化专用量子计算机制造工厂，预计2026年底实现数十台产能。

离子阱路线被视为实现通用容错量子计算的潜力股。合肥幺正量子作为国内该领域领军者，已搭建起领先的整机系统，并公开达成量子体积32的基准测试。离子阱技术路线的优势在于其极高的量子门保真度和长相干时间，虽然在比特规模扩展上面临挑战，但在量子模拟和量子化学等领域具有独特优势。

中性原子路线在比特规模上取得了惊人突破。清华大学团队利用全自主技术，首次在实验中捕获并操控了10064个原子，将可获取的量子比特资源推进到”万量级”，超越了此前国际纪录。这一突破为大规模量子计算提供了新的技术路径，也为量子模拟和量子优化问题的求解奠定了硬件基础。

四条技术路线的并行突破，打破了外界对量子计算”技术路线不确定”的担忧。更重要的是，这些突破不再是实验室里的演示，而是具备工程化量产能力的实质性进步。量子计算的产业化，不是押注某一条路线，而是多路竞速、相互补充、共同推进。

三、AI融合：双向赋能的产业化催化剂

量子计算商业化的最大障碍之一，是其研发和运维的高成本、长周期。而AI技术的引入，正在从根本上破解这一痛点。2026年，”量子+AI”的深度融合已成为激活产业长期价值的核心抓手，表现为双向赋能的清晰逻辑。

一方面，AI技术大幅降低了量子研发的成本与门槛。 本源量子在”本源悟空”真机上实现十亿参数AI大模型微调，使参数量减少76%，同时训练效果提升8.4%。这一突破意味着，量子计算的编程和优化不再需要专业人员手动调试，AI可以自动完成量子电路的优化和参数调校。国盾量子则通过AI优化量子校准与纠错技术，有效降低量子门错误率，缓解了量子技术研发周期长、成本高的产业痛点。英伟达于2026年4月推出全球首个开源量子AI模型家族”Ising”，一举攻克量子比特校准与纠错两大核心瓶颈，将校准周期从数天压缩至数小时，纠错速度与精度实现数倍跃升，为量子计算实用化打通了关键技术通道。

另一方面，量子算力为突破AI的经典算力瓶颈提供了新路径。 国内首家”AI+量子”融合实体公司量智开物的成立，标志着这一趋势走向系统化产业布局。该公司发布的”追风”算法能在20毫秒内完成万量级原子阵列重排；”扁鹊”解码器则能智能辅助量子纠错。量智开物共同发起人、清华大学教授翟荟的观点颇具深意：”要操控这样规模的量子计算机，人工智能的引入不是锦上添花，而是不可或缺。”

量子计算与AI的融合，正在改变两个领域的游戏规则。对量子计算而言，AI提供了工程化落地的加速器；对AI而言，量子计算提供了突破经典算力瓶颈的新可能。这种双向赋能的关系，使得”量子+AI”成为2026年最具想象力的技术组合之一。

四、场景落地：从”能用”到”好用”的商业验证

技术的价值最终要在产业场景中兑现。2026年，量子计算的”超能力”正在生物医药、金融科技、新材料研发等领域接受检验并开始创造实际价值。

生物医药成为量子计算的首要应用赛场。在精准医疗中，量子计算能加速医学数字孪生开发，辅助实现肿瘤病灶边界的更精准判断。上海市肿瘤研究所PI向冬喜指出，在患者肿瘤病症治疗中，精准确定癌变组织的切除边界是具有挑战性的环节——切除范围太小存在复发风险，切除范围过大则伤害健康组织。引入量子计算后，借助医学分析和模型计算，能够实现对病灶边界更精准的判断，提高临床治疗水平。

基因测序领域的应用同样引人注目。诺禾致源与玻色量子合作，将量子技术应用于单细胞组学数据分析，通过QBM-VAE（量子玻尔兹曼机-变分自编码器）模型实现创新解决方案。诺禾致源首席科学家田仕林介绍，真实的单细胞数据具有高度异质性、多峰分布和强非线性关系，当前主流模型与现实存在”错配”困境，而量子技术的引入能更清晰地刻画细胞分化轨迹，为疾病诊断提供新路径。

金融领域的优化问题天然契合量子计算特性。中科酷原科技已申请一项适配中性原子量子计算机的投资组合优化方法专利，旨在降低电路复杂度，提升计算效率与工程实用性。金融行业对量子计算的热情不仅限于中国——全球主要金融机构都在探索量子计算在风险评估、资产组合优化、欺诈检测等场景的应用。

新材料研发也受益于量子模拟能力。量坤科技通过创新”量子+AI+超算”融合模式，大幅提升了新材料、新药的研发效率。量子计算能够在原子和分子层面模拟材料的量子力学行为，为设计新型电池材料、催化剂、药物分子等提供强大的计算工具。

这些应用场景的落地，证明了量子计算并非”屠龙之术”，而是能够在真实商业环境中创造价值的实用技术。尽管目前的应用仍处于早期验证和小规模试点阶段，但其潜力已经清晰可见。

五、挑战与展望：2029年容错量子计算的目标

尽管融资火热、技术突破频现、应用场景不断拓展，但中国量子产业整体仍处于商业化初期。业内研判，容错通用量子计算机预计2029年前后方能落地。当前发展的关键，在于推动量子算力从”可用”的演示验证，迈向”好用”的规模化商业变现。

硬件稳定性仍是首要挑战。量子比特极其脆弱，需要在接近绝对零度（-273℃）的极低温环境下运行，对硬件制造和工程化能力提出了极高要求。北京计算科学研究中心薛鹏教授指出，量子计算等核心领域仍面临硬件稳定性、纠错效率等基础瓶颈，技术突破与商业回报之间仍存在较大不确定性，产业成熟尚需时间检验。

核心器件与高端装备的部分进口依赖也需要关注。薛鹏教授建议，首先要加强基础工艺研发，联合科研院所攻关关键材料与制备技术；其次通过标准化、模块化设计降低量产成本，避免过度追求极端性能；第三优先在容错率较高的场景（如量子精密测量）推动小规模应用。

从”可用”到”好用”，还有很长的路要走。 东南大学物理学院教授肖磊的观点更为务实：未来3至5年，量子算力融入数字经济基础设施以及”量子+行业”的普及，预计仍以早期验证和小规模试点为主，更现实的路径是少数特定场景（如量子模拟、专用计算）率先试用，但通用容错计算和广泛产业融合仍需更长时间积累。

但这并不意味着悲观。回顾历史，每一项颠覆性技术从实验室走向大规模应用，都需要经历漫长的产业化过程。晶体管从发明到商业化用了数十年，互联网从ARPANET到全民普及也走过了近30年。量子计算正在经历同样的历程，而2026年的这轮融资热潮和技术突破，标志着这场历程正在进入加速期。

结语：算力革命的”合肥答案”

从央视五一特别节目聚焦合肥量子团队，到一季度融资突破33亿元，再到多条技术路线的并行突破，2026年的中国量子计算产业正在给出自己的答案。

这个答案的核心，是技术自主与产业协同的双轮驱动。合肥”本源悟空”超过80%的国产率，证明了核心技术握在自己手里的可行性；而玻色量子、量旋科技、图灵量子等企业的融资和扩产，则展示了产业生态对技术成果转化的放大效应。

这个答案的姿态，是长期主义的战略定力。量子计算仍处于产业化早期，短期内难以产生规模化的商业回报。但正如孔伟成团队用十余年攻坚造出”量子金箍棒”，唐世彪团队在量子通信”无人区”凿出产业化道路，量子计算的成功需要的不是投机式的短期押注，而是愿意陪伴穿越创新周期的长期资本和战略耐心。

这个答案的指向，是从跟跑并跑到领跑全球的跨越。在全球量子计算的竞争中，中国已经在多条技术路线上建立了优势地位。从”量子大道”上93家产业链企业，到国家引导基金的首次重仓，再到生物医药、金融等场景的初步验证，中国的量子计算生态正以前所未有的速度成熟。

量子科技仍处马拉松的早期阶段，但合肥团队的奔跑，全国无数量子科技工作者的努力，已经给出了将发展主动权握在自己手中的清晰答案。2026年的量子计算产业化元年，或许正是这场漫长马拉松中，最具标志性意义的一个里程碑。

2026年5月6日
光子AI芯片商用元年：如何用光速重新定义算力竞赛
引言：当算力竞赛进入”光学时代”

过去十年，AI领域的飞速发展几乎完全建立在GPU集群的算力提升之上。从2012年AlexNet用两张GPU训练出革命性的深度学习模型，到2026年大模型训练需要数万台GPU互联——算力需求的增长曲线陡峭得令人惊叹。

然而，硅基电子芯片正面临物理极限的严峻挑战。当晶体管尺寸逼近原子级别，量子隧穿效应导致的漏电问题让传统芯片的性能提升愈发艰难。更关键的是，芯片内部和芯片之间的数据传输正成为制约AI计算效率的瓶颈——电子在导线中的传输速度远跟不上AI计算的需求。

正是在这一背景下，沉默了数十年的光子计算技术重新进入业界视野。光速是电子速度的一千倍以上，且光子在传输过程中几乎不产生热量。这意味着，利用光子进行AI计算可能彻底绕过电子芯片的物理限制，开辟一条全新的算力提升路径。

2026年，这一看似”科幻”的技术终于开始走向商业化。

光子计算的技术原理：为什么光子更适合AI？

从电子到光子：一场计算介质的革命

要理解光子AI芯片的优势，首先要理解为什么光子比电子更适合AI计算。

传统电子芯片的核心计算单元是晶体管，通过控制电子的通断来表示”0″和”1″。然而，电子在导体中移动时会与晶格发生碰撞，产生热量；随着芯片密度提升，散热问题愈发严重。同时，电子在导线中的传播速度约为光速的三分之一到十分之一，且存在寄生电容和电阻，进一步限制了信号传输速度。

光子（光的粒子）则具有截然不同的特性：

超高速传输：光速在真空中约30万公里/秒，即使在光纤中也能保持20万公里/秒以上的速度。这意味着光子芯片可以同时传输更多信息，且延迟更低。

低功耗高带宽：光子在传输过程中几乎不产生热量，单位带宽的能耗远低于电子。这意味着数据中心可以用更少的能耗实现更高的吞吐量。

天然并行：不同波长的光可以在同一介质中独立传播，实现波长复用。理论上，一根光纤可以同时传输数十甚至数百路信号。

矩阵运算优势：AI神经网络的核心计算是矩阵乘法，而光的物理特性恰好可以高效执行这类运算。

光学矩阵计算：光子AI的秘密武器

神经网络的大规模矩阵运算一直是最耗时的计算任务。传统的GPU通过并行计算来加速这一过程，但本质上仍是串行的电子运算。

光子计算则提供了另一种思路：通过构建光学矩阵乘法器，光子芯片可以在”光速”下完成矩阵运算。

其基本原理是利用马赫-曾德干涉仪（MZI）等光学元件实现可编程的矩阵运算。每个MZI可以独立调节光的相位，从而改变光的传输路径。当大量MZI组成网络时，就可以构建一个可编程的光学矩阵。

这种设计的精妙之处在于：矩阵运算在光学域内完成，无需进行光-电-光的转换，且理论上可以在单一时钟周期内完成整个矩阵乘法。这就是为什么光子芯片在AI推理任务中展现出惊人效率的原因。

硅光子：让光子计算走向规模化

光子计算面临的一个关键挑战是：如何将大量光学元件集成到可量产的芯片上？

传统的分立光学元件体积庞大、价格昂贵、难以大规模集成。硅光子技术的出现解决了这一问题。

硅光子是一种将光学元件直接刻蚀在硅芯片上的技术，与现有的半导体制造工艺高度兼容。这意味着，理论上可以使用成熟的CMOS工艺来批量生产光子芯片，大幅降低成本。

2026年，硅光子代工平台已经相对成熟。多家中美芯片代工厂都推出了面向光子芯片的工艺节点，支持将激光器、调制器、探测器、波导等核心元件集成在单一硅芯片上。

2026年商用化进程：哪些公司正在领跑？

国际巨头：全面布局

在光子AI芯片领域，几家科技巨头早已开始布局。

Intel：作为硅光子技术的先驱，Intel早在2020年就推出了面向数据中心的硅光子模块。2025年，Intel发布了集成光子计算芯片的原型，在特定AI推理任务中展现出10倍于GPU的能效优势。目前，Intel正与多家云服务商合作进行试点部署。

NVIDIA：尽管以GPU闻名，NVIDIA同样在光子计算领域有所布局。2026年初，NVIDIA宣布投资三家光子计算初创公司，并计划将光子互连技术集成到下一代AI服务器中。NVIDIA的策略是先用光子技术解决GPU集群之间的互联瓶颈，再逐步向计算领域拓展。

IBM：IBM在光子集成领域拥有深厚积累。2025年，IBM展示了集成超过1000个光子元件的光学神经网络芯片，在MNIST图像分类任务中验证了技术可行性。IBM的研究团队认为，光子芯片最适合的应用场景是神经网络的推理阶段。

新兴力量：初创公司的创新突破

如果说科技巨头是”正规军”，那么近年来涌现的光子计算初创公司则代表了更激进的创新力量。

Lightmatter：这家2017年成立的波士顿初创公司是目前最受关注的光子AI芯片公司之一。2025年，Lightmatter推出了商用的光子推理加速芯片”Envise”，据称在BERT推理任务中比NVIDIA A100 GPU快10倍、功耗降低6倍。Lightmatter已获得超过2亿美元融资，并与多家大型云服务商建立合作。

Luminous Computing：这家成立于2018年的公司采用了与众不同的技术路线。Luminous的芯片将光子计算与电子计算深度融合，通过定制的3D堆叠封装实现光子和电子元件的紧密集成。2026年，Luminous推出了第二代芯片产品，在多个AI基准测试中刷新了能效记录。

曦智科技：这是唯一进入全球光子AI芯片第一梯队阵列的中国公司。曦智科技脱胎于麻省理工学院，由多位海归博士于2017年创办。公司已发布两代光子推理芯片产品，并在2025年实现了单芯片超过1000 TOPS的算力密度，在多个行业客户中完成部署。曦智科技的竞争优势在于对国内供应链的深度整合，以及对中文大模型推理场景的针对性优化。

中国力量：追赶中的突破

在光子AI芯片领域，中国正在快速追赶。

华为：华为早在2019年就布局了硅光子技术，目前已在武汉建立了专门的硅光子研发产线。2026年，华为发布的光子AI芯片原型采用了自主研发的超低损耗波导工艺，性能指标接近国际先进水平。

中科院半导体所：作为国内光子技术的传统强项研究机构，中科院半导体所在硅光子领域积累了深厚的学术基础。2025年，由该所孵化的某初创公司发布了面向自动驾驶的光子感知芯片，已获得多家车企的投资。

国内初创生态：除曦智科技外，还有多家国内初创公司在光子AI芯片领域积极布局，包括光子算数、鲲游光电等。这些公司各有侧重：光子算数专注数据中心场景，鲲游光电则聚焦光子显微镜等细分应用。

应用场景：光子芯片将首先改变哪些领域？

数据中心：能效比竞争的新筹码

数据中心是光子AI芯片最直接的应用场景。

当前，大型数据中心的能耗问题日益严峻。据估计，全球数据中心的电力消耗已占全球总用电量的2%以上，且仍在快速增长。AI推理任务的增加进一步加剧了这一趋势。

光子AI芯片的超低功耗特性为解决这一问题提供了新思路。以Lightmatter的Envise芯片为例，其BERT推理能效比约为GPU的10倍。这意味着，同样的算力需求可以用十分之一的电力来完成。

2026年，Google、微软等云服务商已开始小规模试点光子AI芯片，主要用于对能效比敏感的推理服务。预计到2027年，光子芯片在数据中心AI推理市场的渗透率将达到5%-10%。

边缘计算：光子芯片的新蓝海

边缘计算场景可能是光子芯片的另一个重要战场。

在边缘端部署AI模型面临两大挑战：算力受限、功耗敏感。传统的GPU难以在严格功耗约束下提供足够的算力，而光子芯片的高能效比特性恰好可以满足这一需求。

2026年，多家芯片公司推出了面向边缘场景的光子AI模块，功耗控制在5-10W区间，可提供相当于中端GPU的AI算力。这些模块已开始应用于智能摄像头、工业边缘网关、自动驾驶域控制器等场景。

AI推理 vs AI训练：谁将首先被颠覆？

值得注意的是，光子AI芯片目前主要适用于AI推理场景，而非训练场景。

原因在于：AI训练需要频繁的参数更新和反向传播，这与光子芯片的架构特点不完全匹配。相比之下，AI推理的矩阵运算更加规则，更适合光子计算。

但多家研究机构正在攻克这一难题。2026年初，MIT的一个研究团队发表了利用光子芯片进行神经网络训练的原型工作，验证了技术可行性。不过，距离实用化可能还需要2-3年的研发周期。

挑战与瓶颈：光子芯片商业化的”最后一公里”

激光器集成：最难啃的骨头

尽管硅光子技术在波导、调制器、探测器等方面已相当成熟，但高功率激光器的集成仍是最大的技术瓶颈。

硅本身不是很好的发光材料，硅光子芯片需要依赖外部激光器提供光源。目前主流方案是将激光器放置在芯片外部，通过光纤耦合输入。这种方式在实验室环境中可行，但在量产和可靠性方面面临挑战。

多家公司正在探索不同解决方案：
- 异构集成：将三五族材料的激光器与硅光子芯片键合
- 氮化硅波导：使用氮化硅代替硅来制作波导，可以承受更高功率
- 混合集成：将多个芯片封装在一起，形成光电混合模块
封装与测试：规模化生产的成本关卡

光子芯片的封装和测试是另一大挑战。

与电子芯片不同，光子芯片需要精确的光学对准和高可靠的耦合封装。目前，光子芯片的封装成本占整体成本的30%-50%，远高于电子芯片。

封装自动化的缺失是成本居高不下的重要原因。由于光子芯片的种类繁多、规格各异，现有的封装设备难以实现完全自动化，大量工序仍依赖手工操作。

多家封装设备公司已注意到这一市场机会，开始研发针对光子芯片的自动化封装解决方案。预计到2027年，光子芯片的封装成本将下降30%-40%。

与GPU生态的兼容问题

当前，主流的AI开发框架（PyTorch、TensorFlow等）都是针对GPU架构优化的。光子AI芯片作为全新架构，面临着软件生态的挑战。

各家光子芯片公司都在积极开发与主流框架兼容的软件栈。Lightmatter推出了专门的CUDA兼容层，曦智科技则开发了基于PyTorch的原生支持。用户可以在几乎不修改代码的情况下，将现有的AI模型迁移到光子芯片上运行。

但从长远来看，光子芯片要真正实现规模化应用，需要软硬件生态的深度融合。这不仅需要芯片公司的努力，也需要框架开发者和云服务商的支持。

未来展望：光子计算将走向何方？

短期：特定场景的加速器

未来1-3年内，光子AI芯片的角色将主要是特定场景的专用加速器，而非GPU的替代品。

在AI推理、边缘计算、特定神经网络架构等场景，光子芯片将展现出独特的价值。预计到2028年，光子AI芯片将在AI推理市场占据15%-20%的份额。

中期：光电融合的异构计算

5-10年内，随着光子技术的成熟和封装成本的下降，光电融合的异构计算将成为主流。

在这种架构下，GPU负责需要频繁更新的训练任务，光子芯片负责大规模矩阵运算，两者通过高速光电接口协同工作。这种架构将充分发挥不同计算介质的优势，实现最优的系统效率。

长期：全光计算的终极愿景

从更长远的视角看，理想中的”全光计算”仍然是一个诱人但遥远的愿景。在这一愿景中，AI模型的训练和推理都将在纯光学系统中完成，实现数量级的效率提升。

要实现这一目标，需要突破诸多基础物理和工程难题：光存储、光非线性计算、光逻辑门等。尽管如此，2026年的进展表明，这一天可能比预想中来得更早。

结语：算力革命的下一个十年

2026年的光子AI芯片市场，像极了2015年前后的GPU市场——技术已经成熟、商业化刚刚起步、但改变世界的潜力已经显现。

当传统的摩尔定律走向终结，当电子芯片的功耗问题日益严峻，光子计算提供了一条突破之路。这条路并不平坦，需要克服激光器集成、封装成本、软件生态等诸多挑战。但正如历史一再证明的，一旦关键技术实现突破，市场爆发的速度往往超出所有人的预期。

对于中国而言，光子AI芯片既是挑战也是机遇。在这一新兴领域，中美之间的差距相对较小，多家中国公司在核心技术上有深厚积累。在全球算力竞争日益激烈的背景下，光子计算可能成为改变格局的关键变量。

光速的算力革命，已经拉开帷幕。

延伸阅读
2026年4月30日
玻璃基板量产元年开启：台积电、英特尔、三星如何重塑封装格局
传统基板的五重困境

要理解玻璃基板为何受到巨头追捧，首先要看看传统有机基板正在面临的问题。

随着AI算力芯片向大尺寸、高集成度快速演进，传统有机基板已经触及五大物理极限：
1. 高温翘曲：大尺寸芯片发热严重，有机材料在高温下形变加剧
2. 信号损耗：有机材料的介电损耗随频率升高急剧恶化
3. 散热瓶颈：有机材料热导率低，芯片散热困难
4. 互连密度不足：有机基板的线宽线距逼近极限
5. 成本压力：追求更高密度导致成本指数级上升
这五大问题相互交织，使得传统有机基板越来越难以满足AI芯片对封装技术的严苛需求。

玻璃基板：五大优势重新定义封装材料

玻璃基板凭什么能够“接棒”？这要从它的材料特性说起。

与硅高度匹配的热膨胀系数

玻璃的热膨胀系数与硅非常接近，这意味着在芯片工作过程中，玻璃基板与硅芯片的形变基本同步，可以大幅降低热应力带来的可靠性风险。

超低介电损耗

玻璃的介电损耗远低于有机材料，特别适合高频信号传输。对于需要处理海量数据的AI芯片来说，低介电损耗意味着更低的信号衰减和更高的传输效率。

极高的TGV深宽比

玻璃通孔（TGV）技术可实现高达20:1的深宽比，这意味着可以在更小的面积内容纳更多的互连通道。

2μm以下的线宽

玻璃基板的线宽可以做到2μm以下，远优于传统有机基板，为更高密度的芯片集成提供了可能。

显著的成本潜力

玻璃是大宗工业原料，来源广泛、成本可控，相比硅中介层具有明显的成本优势。

三大巨头的玻璃基板战略

台积电：CoPoS封装技术

2026年4月17日，台积电发布超预期亮眼业绩，公司董事长暨总裁魏哲家同步透露，正在搭建CoPoS（Chip on Panel on Substrate）封装技术的试点产线，预估几年后可进入量产阶段。

CoPoS是台积电在CoWoS技术路线上的延伸，核心是将“圆形晶圆变为方形面板”，用矩形的大面积玻璃基板替代硅中介层。其最大优势在于更高的面积利用率与成本效益，更大的封装空间允许集成更多芯片与HBM，从而提升单个封装的性能和I/O密度。

台积电已规划2026年设立首条试验线，量产据点为嘉义AP7的P4、P5厂，最快2028年底至2029年上半年量产。

英特尔：10亿美元押注玻璃基板

英特尔已在亚利桑那州累计投入超10亿美元建设玻璃基板专属研发与量产线。2026年1月，英特尔正式宣布玻璃基板技术进入大规模量产阶段。

作为全球领先的芯片制造商，英特尔的这一布局具有风向标意义，表明玻璃基板技术已经跨越了从“能用”到“好用”的关键门槛。

三星与苹果：跟进布局

LG显示已正式切入玻璃基板业务并成立专案小组。苹果则深化自研AI硬件布局，已开始测试先进的玻璃基板，用于代号为“Baltra”的AI服务器芯片。

苹果的加入尤为值得关注。作为全球最大的芯片采购方之一，苹果的转向将极大推动玻璃基板技术的商业化进程。

从技术验证到量产元年

巨头们的密集布局，意味着玻璃基板正从“技术验证”迈入“量产前夜”。

多位产业人士指出，2026年有望成为半导体封装领域玻璃基板小批量商业化出货的元年。这一判断基于几个关键信号：
1. 台积电试点产线加速建设：CoPoS中试生产线已于2026年2月开始向研发团队交付设备，预计将于6月全面建成
2. 英特尔进入大规模量产：10亿美元投资进入收获期
3. 终端厂商测试验证：苹果等终端厂商开始测试玻璃基板方案
4. 产业链配套完善：上游材料供应商、设备制造商跟进布局
玻璃基板的产业影响

玻璃基板的量产将对半导体产业产生深远影响：

对AI芯片厂商

更大的封装面积意味着可以在单个封装内集成更多HBM和逻辑芯片，为AI大模型提供更强的算力支撑。同时，玻璃基板的低损耗特性将有助于提升芯片的能效比。

对封装测试厂商

玻璃基板的加工工艺与传统有机基板有显著差异，这将推动封装设备更新换代。同时，更高的技术门槛也将重塑行业竞争格局。

对整个半导体产业链

玻璃基板的普及将带动上游玻璃材料、TGV设备等相关产业发展，形成新的产业生态。

挑战与展望

尽管前景光明，玻璃基板的大规模应用仍面临一些挑战：

加工工艺成熟度：玻璃材料的脆性使得加工难度高于有机材料，需要开发专用的切割、研磨、抛光工艺。

可靠性验证：玻璃基板与芯片的长期可靠性需要经过充分的验证测试。

产能爬坡：从试产到大规模量产，需要时间来优化良率和成本。

但无论如何，2026年已经注定成为玻璃基板元年。这场从材料到工艺的系统性革命，正在重新定义半导体封装的未来。

当“玻璃”成为“芯片”的新底座，半导体产业的下一场洗牌或许即将开始。
2026年4月29日

液冷渗透率破47%：AI芯片千瓦时代的数据中心散热革命

风冷为什么”吹不动”了

想象一下，你面前有一个烧得通红的铁块，你试图用风扇吹风来给它降温。

这大致就是传统风冷技术面对现代AI芯片时的窘境。

问题的根源在于空气本身。空气的导热系数只有液体的几十分之一，其体积比热容更是相差3000倍以上。这意味着，液体携带热量的能力，是空气的上千倍。

当单芯片功耗突破千瓦，单机柜功率密度从传统的5-10kW飙升至60kW、100kW甚至更高时，风冷就像用一把小扇子试图扑灭一场森林大火——效率已经触及物理极限。

2026年，AI芯片正式迈入千瓦级功耗时代：英伟达H100功耗700W，B200突破1000W，GB200升至1200W，下半年Rubin平台GPU功耗将飙升至2300W，顶配版本更是达到惊人的3700W。

传统风冷机柜散热极限仅20-40kW，而GB200机柜功耗高达130-140kW。风冷完全失去了换热能力。

液冷：不是可选项，而是必选项

液冷技术的核心逻辑极其简单：既然用空气”吹”效率太低，那就让更擅长导热的液体”贴”上去，甚至直接”泡”着。

这就像消防队灭火——风冷是拿着鼓风机试图吹散烟雾和热量，而液冷是接上高压水枪，直接对准火源浇水。

目前主流有两大技术路线：

冷板式液冷（主流方案）

这是当前市场的主流，占比约80%。它相当于给CPU、GPU这些核心发热部件”穿上”一套金属水冷背心（冷板），冷却液在背心内部的微细管道里流动，直接带走热量。服务器其他不那么热的部件，依然用风冷辅助。

这种方式改造成本相对较低，是现有数据中心升级的务实之选，能将单机柜功率提升至30-200kW。

浸没式液冷（未来方向）

这是面向未来的”终极方案”。它将整台服务器浸入绝缘冷却液中，芯片产生的热量直接被液体吸收。这种方式散热能力是冷板式的5倍以上，可以轻松支持单机柜功率超过100kW，甚至达到惊人的900kW。

它几乎消除了风扇和空调，能效表现极致。

谷歌示范：TPU v7打响行业标杆

2026年，谷歌宣布了一个看似普通的生产计划：其新一代AI芯片TPU v7，出货量目标上调50%至600万颗。

但计划背后藏着一个硬性条件：这款单芯片功耗高达980瓦的”电老虎”，必须100%采用液冷散热。

这相当于，谷歌为每一颗芯片都配了一套”水冷系统”。

TPU v7采用大冷板方案覆盖4颗芯片及核心组件，可实现万颗芯片级集群部署，总功率近10兆瓦，算力利用率稳定在95%以上。

对比来看，英伟达GB300采用85%液冷+15%风冷混合方案，而谷歌直接落地全液冷。这释放了一个明确信号：全液冷已成为成熟务实的选择。

渗透率40%-47%：2026年成为液冷普及元年

关于2026年液冷渗透率，多家机构给出明确预测，40%-47%成为行业主流共识：

TrendForce集邦咨询：AI数据中心液冷渗透率将从2024年14%飙升至2026年47%
和众汇富研究：给出40%的预测值，聚焦AI芯片层面液冷采用率
摩根士丹利：明确指出2026年英伟达GB300成为市场主流，高端算力场景渗透率突破50%

而部分机构给出的74%-76%渗透率，仅针对特定超高密度算力场景，不具备行业普适性。

液冷渗透节奏并非单纯由技术决定，芯片迭代、供应链产能、云厂商资本开支共同决定行业普及速度。2026年成为液冷从小众走向主流的关键转折点。

千亿市场开启：国产供应链迎来黄金机遇

液冷渗透率快速提升，直接催生千亿级蓝海市场。

摩根大通预测，2026年全球AI服务器液冷市场规模将突破170亿美元，全年复合增长率达59%。中国市场同步爆发，2026年液冷服务器市场规模超300亿元，AI智算中心液冷市场达200亿元，2030年国内液冷渗透率有望达到82%。

值得注意的是，产业格局正在加速整合。以往被国外垄断的浸没式冷却液，已实现国产化量产，成本仅为进口产品的1/4。谷歌、英伟达开放供应链认证，国内液冷厂商直接进入云厂商供应体系。

国产厂商已在多个环节建立竞争优势：

环节	代表企业	核心优势
系统集成	英维克	英伟达MGX认证，冷板/浸没式双路线覆盖
服务器整机	浪潮信息	全球液冷服务器市占率超50%
浸没式解决方案	中科曙光	相变浸没液冷独家技术，PUE低至1.04
冷却液	巨化股份	电子氟化液国产替代核心供应商

从”耗电大户”到”供热中心”

液冷带来的最直观优势，是电费账单的骤减。

衡量数据中心能源效率的关键指标是PUE（电能使用效率），越接近1越好。传统风冷数据中心的PUE通常在1.5以上，意味着你每花1度电给芯片计算，还要额外花费0.5度以上给空调和风扇散热。

而浸没式液冷可以将PUE压至1.04-1.1，冷板式也能结合自然冷源实现1.1左右。

更颠覆性的是，液冷技术改写了数据中心的能源角色。传统数据中心是纯粹的”电力吞噬兽”，而液冷系统在高效散热时，排出的冷却液温度可达50-60℃。这些”废热”不再是负担，而是资源。

在重庆西部科学城，数据中心的液冷余热被回收，用于为周边13万平方米的建筑提供冬季供暖。这意味着，数据中心在消耗电力生产算力的同时，竟然还能输出热能，从一个能源消耗点，转变为一个区域能源循环的节点。

挑战与机遇并存

当然，液冷的普及并非没有挑战。

短期来看，A股液冷概念股中仅少数企业2025年业绩预增，部分企业技术仍处验证阶段。冷板密封性、漏液风险等技术难点有待突破。

但长期来看，确定性明确：英维克2026年Q1订单排至Q2，海外占比升至20%以上；谷歌、亚马逊2026年AI投入超3500亿美元，液冷占基建成本5%-8%。

华为在贵州、内蒙古、安徽部署了全液冷AI算力集群，年均PUE稳定在1.15。字节跳动自研”大禹”液冷整机柜，曙光数创推出兆瓦级相变浸没液冷方案。

液冷的优势远不止于”散热更好”。它是一次对数据中心能源逻辑的彻底重构：用液体征服”热墙”，释放被高温束缚的极限算力；用极致能效直面电费与合规压力；甚至将废热变废为宝。

2026年，液冷正式从”可选项”变为AI算力时代的”必选项”。这场由AI算力驱动的散热革命，速度与规模远超市场预期。

相关阅读：

2026年4月28日

存算一体芯片重塑AI算力：破解”内存墙”的商业化革命

一个被忽视的瓶颈：为什么AI芯片如此耗电

过去几年，关于AI芯片的讨论几乎都集中在”算力”上——晶体管数量、浮点运算能力、TOPS（每秒万亿次操作）等指标。但2026年的今天，一个更根本的问题开始被业界正视：能效。

传统计算机架构遵循”冯·诺依曼”设计原则：计算单元和存储单元是分开的。CPU或GPU需要数据时，要从内存（RAM）中读取、处理、再写回。这个模式运行了几十年，在通用计算场景下表现出色。但当它遇上深度学习——一种需要反复进行矩阵乘法（神经网络的核心运算）的计算范式——问题就来了。

以GPT-4级别的模型推理为例，每次处理一个token，模型需要将数十亿个权重参数从内存加载到计算单元。一个完整的回复可能涉及数千个token的生成，意味着这些权重被反复搬运数万次。研究数据显示，数据搬运消耗的能量占到AI计算总能耗的62%到80%。这意味着，当我们惊叹于AI模型强大能力的同时，有超过三分之二的电力实际上是花在”搬家”而非”计算”上。

“内存墙”问题不仅影响能效，更限制了计算速度的进一步提升。即使芯片的计算能力再强，如果数据供应跟不上，计算单元就会大量时间处于等待数据的”空闲”状态。摩尔定律还能让晶体管越做越小，但内存带宽的增长速度远远跟不上计算需求的膨胀。这道物理层面的鸿沟，是传统架构无法自我解决的问题。

存算一体：从源头消灭”搬家”问题

存算一体（In-Memory Computing，IMC）的思路极为朴素——与其费力加快搬家速度，不如把计算资源直接搬到数据旁边。

在存算一体架构中，计算单元被嵌入到存储阵列的内部。当需要执行矩阵乘法时，利用存储单元自身的物理特性（电阻、电容等）来完成计算，数据根本不需要离开存储区域。这就像把厨房、餐厅、仓库合并成一个开放空间，厨师直接从仓库取食材、在同一张工作台上处理、直接上桌，省去了仓库到厨房之间的搬运环节。

存算一体有两种主要实现路径。近存计算（Processing-in-Memory，PIM） 将逻辑芯片放置在存储堆叠附近，通过高带宽互连通信，缩短数据传输距离。存内计算（Computing-in-Memory，CIM） 则更进一步，将计算功能直接集成到存储阵列内部，数据在原地完成计算。后者的能效提升潜力更大，但技术难度也更高。

根据麦肯锡全球研究院2026年发布的报告，采用存算一体架构的边缘AI芯片，在端侧大模型推理任务中，能效比（TOPS/W）较传统架构提升了近50倍。这个数字的意义怎么强调都不为过——同等算力下，续航时间延长50倍，或者同等续航下，算力提升50倍。这不是渐进式的改进，而是颠覆性的代际跨越。

类脑芯片：向人脑学习能效秘密

人脑是已知世界能效最高的”计算系统”之一。大脑运行只需要约20瓦的功率——和一只灯泡相当——却能完成感知、认知、推理、决策等复杂任务。存算一体的设计理念，实际上正是借鉴了大脑的工作方式。

2026年3月，剑桥大学材料科学与冶金系的研究团队在《Science Advances》发表封面论文，宣布了一种基于改性氧化铪的类脑忆阻器（memristor）重大突破。这种新型器件能以前所未有的低功耗模拟大脑的神经突触行为。

忆阻器是一种电阻值能根据过去电流历史而改变的电子元件，其特性天然适合模拟神经元的”连接强度可调”机制。传统忆阻器依赖导电细丝的形成与断裂来切换状态，这种机制不稳定、功耗较高，限制了大规模应用。

剑桥团队采用了一种不同的设计思路。通过在氧化铪薄膜中引入锶和钛，并使用两步生长工艺，他们在内界面处形成了p-n结。当改变加在结上的电压时，能量势垒的高度随之变化，从而平滑地调节器件电阻——无需依赖随机性强的细丝形成/断裂过程。这带来的直接好处是：器件在数十万次开关循环中表现出一致的性能，一个周期和下一个周期的行为几乎完全相同，这是构建大规模可靠神经网络硬件的基础条件。

最令人惊叹的是功耗数据。这种新型忆阻器的开关电流比传统氧化物体系器件低约100万倍。在实验室测试中，器件可稳定保持编程状态约一天，能够可靠地执行数万次开关循环，并成功复现了尖峰时序依赖可塑性（STDP）——这是大脑用来强化或弱化神经连接的核心学习规则，被认为是”硬件级学习和适应能力”的关键。

同样在2026年4月，拉夫堡大学物理团队在《Advanced Intelligent Systems》发表的论文，展示了另一种基于纳米多孔氧化物的储备计算（Reservoir Computing）芯片。储备计算是一种特别适合处理时序数据（如语音、传感器读数、天气模式）的神经网络技术，传统上依赖软件实现。拉夫堡团队证明，在特制的纳米多孔氧化铌忆阻器芯片上，同一类任务可以完全由硬件完成，能耗比纯软件方案降低最高2000倍。当然，具体提升幅度取决于任务类型，但即便取保守估计，能效收益依然惊人。

产业落地：2026年的商业化加速

学术界捷报频传的同时，产业界的进展同样令人瞩目。

Yole Développement的分析指出，2026年是存算一体技术从实验室走向商业化落地的关键转折点。基于ReRAM（阻变存储器）和MRAM（磁阻存储器）的存算一体芯片，将在边缘端推理场景率先大规模商用。智能摄像头、可穿戴设备、工业物联网传感器——这些对续航敏感、算力需求又不那么极端的场景，是存算一体芯片的最佳切入点。

在云端训练侧，光计算芯片与光互连技术取得了突破性进展。虽然2026年的光计算还无法完全取代电芯片，但在一类特定任务——线性代数运算——上表现出色，且发热极低。对于超大规模数据中心而言，用光计算处理部分运算，配合电芯片处理其他运算，是极具吸引力的降耗方案。LightCounting数据显示，2026年全球数据中心光模块出货量中，用于AI集群的800G及1.6T光模块占比已超过40%。

与此同时，RISC-V开源架构的崛起为存算一体芯片的普及提供了新的可能性。RISC-V的灵活性允许芯片设计者针对存算一体架构优化指令集，而其开源特性降低了准入门槛，吸引了大量初创企业加入。这正在打破x86和ARM在传统芯片领域的主导格局，为新架构的快速迭代创造了条件。

中国力量：清华、华为的存算一体布局

在这场存算一体的全球竞赛中，中国研究机构和企业的表现相当活跃。

清华大学团队2025年提交的一份专利申请，聚焦于基于NAND Flash和DRAM混合堆叠的边缘端大模型推理系统，分别针对”预填充”和”解码”两个LLM推理阶段进行优化。华为海思在存算一体领域的布局也在稳步推进，其芯片产品线中已出现针对AI推理优化的存算一体模块。

国际专利格局显示，在存算一体领域最活跃的申请机构包括普林斯顿大学、三星电子，以及一批中国高校和科研院所。其中涉及LLM推理存算一体芯片的最新申请，日期已推进到2026年2月，明确针对大模型推理场景进行架构优化。这标志着存算一体的研究方向已从早期的CNN/图像分类任务，全面转向生成式AI工作负载。

挑战与展望

存算一体芯片走向成熟，仍有几道关卡需要跨越。

精度问题是首要挑战。模拟存算一体在处理矩阵运算时使用器件的物理特性进行计算，天然适合”近似计算”，但深度学习模型对精度有一定要求。当前的存算一体芯片在神经网络推理任务上已达到可接受的精度水平，但高精度科学计算场景仍需进一步突破。

软件生态的成熟度是另一短板。传统深度学习框架（PyTorch、TensorFlow等）是针对冯·诺依曼架构设计的，开发者已经习惯了将模型权重存储在内存中、将数据加载到GPU进行计算的工作流。存算一体需要新的编译器、仿真器和映射算法来支持新的编程模型。北京航空航天大学2025年提交的一份专利申请，正聚焦于数字存算一体架构的编译与仿真工具链开发，填补这一软件-硬件协同设计的空白。

工艺兼容性同样需要关注。剑桥团队的新型忆阻器在制造过程中需要约700°C的高温工艺，高于标准半导体制造的容忍范围。降低工艺温度，使其与现有CMOS生产线兼容，是实现规模化制造的前提条件。研发团队正在积极攻关这一挑战。

结语：能效革命的深远影响

存算一体技术的影响，远远超出了芯片行业本身。

当AI推理的能耗降低到原来的五十分之一甚至百分之一，今天被认为”不可能”的场景将变得切实可行：一款智能手表就能本地运行复杂的健康监测模型，不需要云端往返延迟；偏远地区的农业传感器可以全年无休地运行病虫害识别AI，仅靠太阳能供电；工厂车间里成百上千的边缘设备可以实时协作运行机器视觉质检，无需复杂的散热系统。

更宏观地看，随着全球AI推理需求的爆发式增长，能源消耗正在成为AI发展的硬约束。如果不解决能效问题，算力扩张将越来越受制于电力供应和碳排放政策。存算一体从架构层面绕过了这个问题——不是让芯片更拼命地”搬运”，而是从根本上重新设计”搬运”的必要性。

2026年，或许会被未来的产业史学家标记为”存算一体元年”。不是因为这一年技术首次出现，而是因为这一年，存算一体从”有潜力的研究方向”正式蜕变为”可以改变产业格局的商业力量”。

2026年4月27日

分类： 硬件前沿

从”纳米”到”埃米”：0.22的跨越意味着什么

量产数据：不是实验室概念，已实战验证

谁先用上：三大巨头已率先布局

三大变革：全球芯片格局彻底改写

芯片性能：AI算力迎来质变

产业分工：马太效应加剧

供应链博弈：技术封锁更严

理性看待：不是万能神器

写在最后

从硅的困境到光的突围

太极III：华为的光子AI野心

薄膜铌酸锂：被卡脖子的”光学硅”

从跟跑到领跑：跨越二十年的追光之旅

带宽破纪录：光纤通信的新里程碑

三维光子神经网络：6554TOPS的算力狂想

换道超车的底层逻辑

产业化前夜的挑战与机遇

结语

一、官宣即炸场：参数拉满背后的行业震动

二、架构大换血：从“仓库搬运”到“高速流水线”

三、用户体验重构：从“辅助驾驶”到“预判式安全”

四、为什么要自研：理想的底层逻辑

五、行业启示：从“中国制造”到“中国定义”

引言：一场迟到三十年的”叛逆”

一、为什么CoWoS”装不下”了

二、CoPoS：从”圆”到”方”的范式转移

三、三星、苹果入局：产业链共振已经启动

四、TGV：玻璃基板的”神经网络”

五、落地节奏：比想象更快

六、封装即系统：重新定义芯片产业

结语

从”备胎”到”首选”：国产替代的三年蜕变

寒武纪样本：从亏损到盈利的商业闭环

华为昇腾：生态战法与75万颗芯片的野望

隐忧与挑战：热闹背后的冷思考

未来已来：AI算力的新格局

一、资本热潮：从”投技术”到”投落地”的逻辑转变

二、四路竞速：超导、光量子、离子阱、中性原子的工程化突破

三、AI融合：双向赋能的产业化催化剂

四、场景落地：从”能用”到”好用”的商业验证

五、挑战与展望：2029年容错量子计算的目标

结语：算力革命的”合肥答案”

引言：当算力竞赛进入”光学时代”

光子计算的技术原理：为什么光子更适合AI？

从电子到光子：一场计算介质的革命

光学矩阵计算：光子AI的秘密武器

硅光子：让光子计算走向规模化

2026年商用化进程：哪些公司正在领跑？

国际巨头：全面布局

新兴力量：初创公司的创新突破

中国力量：追赶中的突破

应用场景：光子芯片将首先改变哪些领域？

数据中心：能效比竞争的新筹码

边缘计算：光子芯片的新蓝海

AI推理 vs AI训练：谁将首先被颠覆？

挑战与瓶颈：光子芯片商业化的”最后一公里”

激光器集成：最难啃的骨头

封装与测试：规模化生产的成本关卡

与GPU生态的兼容问题

未来展望：光子计算将走向何方？

短期：特定场景的加速器

中期：光电融合的异构计算

长期：全光计算的终极愿景

结语：算力革命的下一个十年

传统基板的五重困境

玻璃基板：五大优势重新定义封装材料

与硅高度匹配的热膨胀系数

超低介电损耗

极高的TGV深宽比

2μm以下的线宽

显著的成本潜力

三大巨头的玻璃基板战略

台积电：CoPoS封装技术

英特尔：10亿美元押注玻璃基板

三星与苹果：跟进布局

从技术验证到量产元年

玻璃基板的产业影响

对AI芯片厂商

对封装测试厂商

分类：硬件前沿