当数据成为新的”原油”,我们该往哪里装?
你有没有想过一个问题:人类产生的数据,正在以惊人的速度膨胀。
根据预测,到2028年全球数据总量将突破400ZB(泽字节)。这是什么概念?如果用传统磁带库存储百万TB数据,需要占用一个足球场那么大的空间。更糟糕的是,这些磁带还需要恒温恒湿的维护环境,耗电惊人。

我们正面临着一个尴尬的局面:数据在爆炸,而传统存储介质已经力不从心。硬盘寿命不过五到十年,磁带稍长一些,但也只有十几二十年。更要命的是,全球数据中心每年消耗的电力已经超过了许多国家的总用电量,而且还在持续攀升。
怎么办?
答案可能藏在一个你意想不到的地方:DNA。
DNA:自然界最古老的数据仓库
DNA,中文名脱氧核糖核酸,是地球上所有生命携带遗传信息的分子。它由四种碱基组成:A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)。这四种简单的化学分子,通过不同的排列组合,编码了从细菌到人类的全部生命信息。
事实上,DNA本身就是一种极其高效的信息存储介质。
让我们来看一组令人震撼的数字:
- 1克DNA可以存储215PB(拍字节)的数据,相当于约1000万小时的高清视频
- 理论极限密度更高,达227.5EB/g(艾字节/克)
- 仅需700克某种特殊物质就能存储2025年全球产生的全部数据
- 用几公斤DNA,理论上就能记录人类文明迄今为止创造的所有数据
除了存储密度惊人,DNA的另一个杀手锏是超长寿命。2026年4月发表的最新研究显示,在25°C干燥条件下,一套新型编解码器预测DNA存储的解码窗口期可长达282年。如果放在低温环境,保存数万年也不成问题。科学家曾将敦煌壁画存进DNA进行极端老化实验,结果显示这些壁画借助DNA存储,可以在9.4°C环境下安然保存超过2万年。
这意味着什么?你今天存入DNA的数据,你的曾孙的曾孙的曾孙都能读取。而你的硬盘或U盘,可能五年后就成电子垃圾了。
还有一个让数据中心运营商垂涎的优点:近乎零能耗。DNA存储不需要制冷,不需要供电,不需要水循环空调维护。除了编码与读取设备,干存储环节几乎不消耗任何能源。对于那些苦于电费和碳排放的科技巨头来说,这简直是”救赎级”的解决方案。
如何把”0和1″写进DNA?
那么,问题来了:计算机用的是二进制(0和1),DNA用的是碱基序列(A、T、G、C),两者怎么对话?
答案在于编码算法。
DNA存储的基本流程是这样的:
第一步:编码。将数字文件的二进制数据转化为碱基序列。这听起来简单,做起来却充满挑战。DNA合成过程中会产生各种错误——碱基插入、缺失、替换,就像打字时会打错字一样。因此,编码算法必须具备强大的纠错能力,确保数据完整无误。
第二步:合成。通过DNA合成技术,将编码后的碱基序列变成实实在在的DNA分子。目前主流的合成方法包括化学合成和酶促反应两种路线。前者技术成熟但成本较高,后者成本更低但错误率也更高。
第三步:存储。将合成的DNA分子封装保存。理想状态是冷冻干燥,在适宜温度下可以保存数百年甚至数千年。
第四步:读取。当需要提取数据时,通过DNA测序技术将碱基序列还原为二进制数据,再通过解码算法恢复为原始文件。
整个过程,就像是打造一个”生物硬盘”。
2025-2026:商业化元年真的来了
如果前几年你还觉得DNA存储只是个实验室里的科幻概念,那么2025-2026年的消息会让你改变看法。
**2025年末,一个里程碑式的事件震动了整个存储行业:全球首个可扩展DNA数据存储商业化服务Atlas Eon 100正式发布。**这标志着DNA存储正式从”论文里的未来”变成”可以买到的产品”。
与此同时,资本市场也在用脚投票。
法国Biomemory在2026年3月宣布收购美国波士顿Catalog Technologies的核心资产,后者多年来深耕可扩展高速DNA打印、高通量读取和极低错误率技术。这场整合的战略意义用四个字概括:端到端商用。合并后的公司目标直指数据中心市场,CEO Erfane Arwani放话,2026年下半年将成为商业化起锚的拐点,这一次交付的不是科幻演示,而是面向真实客户测试和部署的DNA存储柜。
无独有偶。2026年4月9日,全球领先的DNA合成技术提供商金斯瑞宣布与分子存档技术先驱Mimulus Corp达成战略合作。双方的目标是在2030年前实现突破性成本优化,共建规模化分子归档存储基础设施。金斯瑞将利用其成熟的制造平台,推动高通量DNA合成的规模化工业生产,目标从单芯片并行合成数百万条寡核苷酸,提升至数十亿条级别。
Mimulus推出的Glacier数据存储卡尤其值得关注——它的尺寸只有信用卡大小,却能构建完全独立于传统IT架构和电网的物理数据存储载体。Mimulus创始人Todd R. Nelson博士的一句话说得很犀利:”试图用上世纪中期的磁带技术来解决21世纪的AI数据问题,无异于用蒸汽机发射火箭。”
中国力量:站在DNA存储的制高点
在这场存储革命中,中国并没有缺席,反而扮演着重要角色。
天津大学团队在DNA存储领域多点开花。2025年5月,吴华明教授团队在《自然·计算科学》发表论文,提出名为HELIX的全新DNA存储系统,专门用于存储生物医学数据。团队成功将两张60MB的时空组学图像编码为13万条、每条183个碱基的DNA序列,并完整恢复了图像数据。这套系统的核心模块包括图像压缩、图像纠错编码和图像复原,还引入了深度学习技术增强信息恢复能力。
同年11月,吴华明团队又在《自然·通讯》发表最新成果——名为StairLoop的新型DNA存储方案。这套方案专门解决高错误率环境下的数据恢复问题。通过阶梯式交织结构和迭代式软判决解码机制,即使面对核苷酸错误率超过6%、序列丢失率超过30%的极端情况,DNA存储系统仍能准确解码并完整复原原始图像。验证实验中,团队甚至成功将代表早期人类文明的甲骨文图像通过电化学合成方式写入DNA链。
中国科学院院士、天津大学教授元英进团队也在持续深耕。他们成功将人脑的核磁共振影像信息用DNA方式保存,用于脑健康的长期跟踪诊疗。
此外,”毕昇一号“DNA活字存储系统实现了多类型文件的精准存储,中合基因推出了桌面式自动化存储平台DNA-DISK。上海交通大学的DNA存储研究中心牵头的国家重点研发计划”面向PB级DNA存储的系统及合成仪”,更是被定义为解决DNA存储技术”卡脖子”问题的重大战略工程。
从专利布局看,中国在DNA存储领域的专利申请量已占全球28%,整体技术实力不容小觑。
不仅是存储:DNA还能加密
你可能以为DNA存储只是换个”材料”存数据,但科学家们的野心远不止于此。
亚利桑那州立大学的一个研究团队在2025年底至2026年初发表了两项研究,展示了DNA的另一个潜力:信息加密。
第一项研究开发了一种不依赖DNA测序的存储策略,而是利用DNA分子的物理形状来表征信息。科学家创建了纳米级DNA结构,每个结构代表一个信息单元。当这些结构通过微小传感器时,机器学习算法捕获并解读它们产生的细微电信号,重建出原始文本和短消息。这种方法比传统测序更快、更便宜、更易于规模化。
第二项研究则探索了DNA的加密能力。科学家设计了一种名为DNA折纸的结构——通过折叠DNA链形成精确的二维和三维形状。与其把数据简单存储为比特或字母,不如把信息编码进这些纳米结构的排列和图案中,形成一种”分子密码”。没有正确的工具和参考图案,几乎无法解读。
团队使用超分辨率显微镜读取加密信息,机器学习软件分析数千张分子图像,将相似图案分组,再还原为原始信息。没有正确的解码框架,这些图案毫无意义。这种方法极大增加了可创建的分子代码数量,让未授权解码变得极其困难。
“几十年来,信息技术几乎完全依赖硅。”亚利桑那州立大学Hao Yan教授表示,”我们在这里展示的是,生物分子特别是DNA,可以以全新的方式存储和保护信息。将DNA视为信息平台而非仅仅遗传物质,我们可以重新思考数据如何在纳米尺度上存储、读取和保护。”
挑战仍在:成本、速度和标准化
说了这么多DNA存储的优势,我们也必须正视它面临的挑战。
成本仍是最大的拦路虎。虽然DNA存储成本已从2013年的每MB 1.2万美元骤降到2023年的3.5美元,但与传统存储介质相比,这个价格依然高得离谱。要让DNA存储真正普及,成本必须再降低几个数量级。好消息是,产业界普遍预计未来3-5年将实现每GB 10美元的目标。
读写速度是另一个痛点。目前DNA存储的数据吞吐量局限于KB/秒级,比传统数据中心的千兆以太网差了不止一个数量级。对于需要频繁访问的”热数据”,DNA存储暂时还派不上用场。但在访问频率低的”冷数据”和需要保存几十上百年的”超冷数据”领域,DNA存储的优势是压倒性的。
标准化问题也不容忽视。目前DNA存储行业缺乏统一的行业标准,不同技术路线之间兼容性有待优化。微软曾在2024年低调退出DNA存储项目,留下一句意味深长的评论:”鼓吹密度极值的人恐怕还不明白这只是表层优势。”这为行业敲响警钟——技术突破之外,应用生态和标准建设同样重要。
未来图景:DNA存储将如何改变世界?
尽管挑战重重,DNA存储的未来图景已经清晰可见。
在存储分层体系中,DNA存储将占据”超冷数据”的位置。 未来的数据中心可能呈现四级架构:SSD处理热数据(频繁访问),HDD处理温数据(偶尔访问),磁带处理冷数据(长期归档),DNA存储处理超冷数据(永久存档)。医院保存百年病历、银行保留数十年交易记录、政府存档重要文献——这些场景都是DNA存储的用武之地。
在能源消耗方面,DNA存储将推动数据中心绿色转型。 存储1PB数据仅需1瓦功率,能耗仅为传统数据中心的0.1%。在全球碳中和的大背景下,这项优势将越来越受重视。有分析师估算,如果DNA存储大规模普及,仅数据中心制冷一项,每年就能节省数十亿千瓦时的电力。
在文化遗产保护领域,DNA存储可能带来革命性变化。 敦煌壁画已经证明可以存进DNA并保存超过2万年。人类所有的绘画、音乐、电影、书籍,理论上都可以用DNA永久保存。只要还有人类在读写DNA,这些文明结晶就不会丢失。相比之下,纸张会腐烂,磁盘会消磁,光盘会老化,DNA几乎是不朽的选择。
在市场规模方面,DNA存储正在爆发的前夜。 预计2025至2030年,全球DNA存储市场年复合增长率将达到68%,2030年市场规模将突破85亿美元。中国市场增速高于全球均值,有望在这场技术竞赛中占据有利位置。
结语
回顾人类信息存储的历史,从甲骨文到竹简,从纸张到磁盘,每一次存储介质的革命都深刻改变了文明的形态。DNA存储,可能是下一个改变游戏规则的技术。
它不依赖电力,可以在常温下保存数百年;它密度惊人,一粒沙子大小的DNA就能存下整座图书馆;它几乎永恒,只要你我还在读写DNA,信息就不会消失。
当然,DNA存储不会取代你手机里的闪存或电脑里的固态硬盘。但在那些需要海量存储、超长保存、极低能耗的场景中,DNA的优势是压倒性的。
当数据成为新的”原油”,DNA或许就是那个储量最丰富、成本最低的”油田”。
参考资料:
- Science Advances、Nature Communications等期刊相关论文
- Biomemory、Catalog Technologies、金斯瑞、Mimulus等企业官方公告
- 天津大学、上海交通大学、中国科学院等科研机构公开研究成果
- 太平洋科技、科普中国等媒体报道

发表回复