人类细胞发现”黑暗蛋白”:改写蛋白质组认知的颠覆性突破 | 前沿科技

细胞冰山:已知蛋白为冰山一角,黑暗蛋白隐于深海

作者:

你可能不知道,我们从小学生物课时就牢牢记住的那个数字——”人类基因组大约有2万个编码蛋白质的基因”——可能要加上一个巨大的注释了。

2026年5月6日,国际顶级期刊《自然》发表了一项颠覆性研究:由TransCODE联盟主导的国际科研团队,在对7264个候选”黑暗蛋白”进行严格验证后,首次确认人类细胞中存在大量此前被完全忽视的微小蛋白质。科学家们为这类分子创造了一个全新的名称:peptideins(肽蛋白)

这不是简单的命名游戏。这是生命科学版图的一次大扩张——它意味着,人类对自身蛋白质组的认知,只是冰山一角;那些至今无解的疾病、发育之谜、癌症机制,很可能就藏在这片从未被探索的”黑暗地带”里。

peptideins与癌症、基因突变、发育障碍关联示意

被扔进”暗物质”垃圾桶的万亿遗产

过去几十年,生物学家在测序和注释人类基因组时,有一套严格到近乎苛刻的标准:一段DNA序列要被认定为”编码蛋白质的基因”,必须满足几个条件——

长度足够长:氨基酸链必须达到一定的长度阈值,才能被视为”正经”的蛋白质。
功能明确:必须有清晰的生物学功能,并且在进化过程中被保留下来。
位置标准:必须位于典型的编码区域。

那些不符合这些条件的小分子,命运就只有一个:被系统性地排除在官方基因库和蛋白质数据库之外。它们被当作转录翻译的”垃圾副产物”,随手丢进一个叫作”基因组暗物质”的垃圾桶。

而这些被丢掉的东西,就是科学家现在所说的”黑暗蛋白”(dark proteins)。

它们有几个鲜明的特征:

体型极小:氨基酸链远短于传统意义上的蛋白质,小到过去根本没有检测手段能发现它们。
位置隐蔽:常常位于已知基因的”阴影区”——旁边、甚至和已知编码区重叠。
来源神秘:来自过去被认为”绝对不会编码蛋白”的基因组区域。
身份模糊:在其他物种里很少见,缺乏进化上的”亲戚”。
功能未知:绝大多数不知道在细胞里干什么,甚至不知道有没有用。

它们就像细胞世界里的”幽灵分子”——明明真实存在,却长期没有姓名、没有户口、没有合法身份。

海德堡大学生物信息学家Christoph Dietrich评价这项发现时直言:“这是重大突破!这些微小蛋白,有望掀起新一轮生命科学浪潮。”

生物学版”矮行星事件”

有人可能会问:不就是给小分子起了个名字吗?至于这么轰动?

答案是:至于。而且意义堪比天文学发现矮行星。

2006年,冥王星被”踢”出太阳系九大行星。但科学家并没有否定它的存在,而是创造了一个新分类——”矮行星”。这一重新定义,打开了柯伊伯带研究的大门,催生了大量新发现。

peptideins(肽蛋白)的命运如出一辙。

在此之前,这些黑暗蛋白:

  • 不被数据库收录——GENCODE、UniProt等国际核心数据库里根本没有它们的位置
  • 拿不到研究经费——申请资助时,审稿人会质疑”这东西有没有功能都不确定,为什么要研究”
  • 论文很难发表——主流期刊认为”没有明确功能验证的研究”不够”solid”
  • 被主流领域视为”旁门左道”——大量生物学家的默认认知是:能被传统方法漏掉的分子,肯定不重要

现在不同了。

TransCODE团队的研究结果获得了国际学术界的高度认可,这15个经过严格验证的肽蛋白已被正式接纳进GENCODE等国际核心数据库。这意味着全球的实验室,从此可以名正言顺地研究、测序、靶向、开发药物——不再需要面对”你研究的东西到底存不存在”这样的灵魂拷问。

被忽略的生命密码:它们和癌症、罕见病直接相关

最让医学界坐不住的,是研究揭示的另一层真相:这些”黑暗蛋白”并非无用的细胞副产物,它们很可能深度参与了人类重大疾病的发生发展。

已有研究强烈暗示,peptideins与以下几类问题密切相关:

儿童肿瘤:部分肽蛋白在儿童癌细胞中异常活跃,疑似是驱动癌变的”幕后黑手”。过去科学家把已知基因翻了个底朝天也找不到病因,现在有了全新的排查方向。

细胞核心功能:它们参与细胞生长、分裂、信号传递等最基础的生命活动——这些过程一旦出错,后果可想而知。

机制不明的遗传病和代谢病:在一些发病机制长期成谜的疾病中,肽蛋白呈现异常表达。答案可能一直藏在”黑暗区”里。

胚胎发育与组织分化:发育生物学中许多悬而未决的问题,可能都与这些此前未被记录的分子有关。

想象一下这个场景:一位疑难杂症患者走访了全国最顶尖的专家,把已知的2万种蛋白质查了个底朝天,依然找不到病因。而真正的致病元凶,几十年来一直躲在”黑暗区”里,连个名字都没有。

这就好比警察查案:把明面上的嫌疑人全部排查一遍,却忽略了躲在暗处、从未登记在册的那个人。

peptideins的”正名”,等于给医学研究提供了一份全新的靶点清单。未来,新药研发、疾病诊断、癌症治疗,都将因此多出一条全新路径。

当然,科学界也保持了应有的审慎。伦敦大学学院计算生物学家Anders Krogh指出:”大多数肽蛋白,可能真的只是细胞副产物,没有实际功能。” 但他也承认:”哪怕只有1%有功能,这都是数千个全新的研究方向、上百个潜在新药靶点。”

这背后是一整套技术革命

peptideins之所以在今天才被发现和确认,背后是几项关键技术的成熟和叠加效应:

大规模蛋白质组学检测:质谱技术的灵敏度在过去五年里提升了两个数量级,使得检测极微量的短链蛋白成为可能。

RNA测序数据的深度挖掘:大量公开的RNA-seq数据中隐藏着肽蛋白存在的证据——它们虽然不产生经典蛋白质,但确实有RNA转录本。TransCODE团队利用计算方法从这些”噪音数据”中挖掘出了有效信号。

功能验证的严格标准化:研究团队为肽蛋白验证建立了一套严格的评判标准,确保每个被认定的peptideins都有足够的实验证据支撑,经得起同行评审。

国际协作网络的支撑:TransCODE联盟汇集了来自欧洲、北美、亚洲十余个研究机构的数百名科学家,这种规模的协作在过去几乎是不可想象的。

加州大学戴维斯分校的分子生物学家Elizabeth Tseng评论道:”这项研究证明了科学界长期存在的一种偏见:’如果方法看不见,那它就不存在。’peptideins的存在其实从未被否定,只是我们一直没有能力正视它们。”

打开生命科学的”暗门”之后

peptideins的发现,指向一个比”发现了几个新分子”更深刻的命题:

我们对自身生命密码的了解,可能还停留在幼儿园阶段。

我们以为基因组已经测序完毕。
我们以为蛋白质组的基本轮廓已经清晰。
我们以为生命的主要逻辑已经摸清。

但现实给了我们一记清醒的耳光:

  • 我们连细胞里有哪些重要分子都没认全
  • 大量关键物质长期被当作”垃圾”丢掉
  • 数据库里的”标准答案”,遗漏了一个庞大的未知世界

这种认知冲击,历史上并不罕见。人类以为原子是最小粒子,直到发现了电子、质子、中子;以为经典力学能解释一切,直到量子力学横空出世。

peptideins的出现,标志着**”微蛋白质时代”**的正式开启。

未来几年,我们很可能会目睹一连串连锁突破:

新的疾病标志物:某些肽蛋白可能成为肿瘤、早衰、代谢病的早期预警信号,比传统指标更灵敏、更特异。
新的抗癌靶点:如果某些peptideins确实是癌细胞存活的”必需品”,靶向它们可能成为全新的治疗策略。
新的发育调控机制:困扰生物学界多年的发育谜题,可能在肽蛋白层面找到答案。
新的药物开发路径:成百上千个此前不存在的药物靶点,将进入研发人员的视野。

对普通人意味着什么?

你可能会说:这是科研圈的事,跟我有什么关系?

关系太大了,而且可能比你想象的来得更快。

更精准的诊断:未来体检报告中,可能增加一项”肽蛋白谱检测”,用于筛查癌症、代谢病等风险——就像今天做肿瘤标志物检测一样常规。

更多”无药可医”的病迎来特效药:很多罕见病、疑难杂症长期查不出基因缺陷,答案很可能就藏在peptideins里。一旦找到对应的致病肽蛋白,药物研发就有了明确方向。

靶向药物的范式升级:现有的靶向药主要针对”经典蛋白”,peptideins正名之后,药企可以光明正大地针对这些新靶点开发药物。尤其是儿童肿瘤领域,目前治疗选择极为有限。

教科书全面改写:再过几年,学生物学的年轻人将学到:人类不仅有2万种经典蛋白,还有成千上万种肽蛋白,它们共同构成生命运转的秘密网络。

推动精准医学走向更深层次:精准医学的核心理念是”不同人的疾病机制不同,需要个性化治疗”。peptideins的多样性和特异性,恰好为这一理念提供了全新的物质基础。

一扇从未被打开的门

这项研究的真正意义,或许不在于发现了多少个新分子,而在于它彻底打碎了人类的一种认知傲慢:我们以为已经足够了解自己,但事实上还有一整个”平行宇宙”隐藏在视线之外。

人类花了数十年建立起的基因组和蛋白质组”标准地图”,现在被迫大幅修订。这不是科学的失败,恰恰相反——这是科学自我纠错、自我扩展能力的最好证明。

正如论文作者在讨论部分所写:“科学史上许多最重要的发现,都始于我们意识到自己曾经忽视了什么。”

peptideins的发现,不是终点,而是一扇从未被打开的门的开启钥匙。

接下来的问题更令人兴奋:这些黑暗中的生命密码,究竟在控制着什么?它们如何参与疾病的进程?能否被安全地靶向?

这些问题,将在未来十年甚至更长时间里持续推动生命科学的发展——而今天被正名的这15个peptideins,只是冰山露出水面的第一个小角。

参考来源

  • Nature, “Systematic identification and validation of human peptideins”, TransCODE Consortium, May 2026
  • GENCODE Database v48 Update
  • Christop Dietrich评论, BioRxiv preprint, 2026

相关阅读推荐

  • 《AI驱动的蛋白质设计革命:从折叠预测到全新氨基酸序列》
  • 《改写遗传病治疗规则:基因编辑疗法如何走出实验室》
  • 《微生物细胞工厂:合成生物学如何重塑制药业》

标签:黑暗蛋白、肽蛋白、蛋白质组学、基因组注释、TransCODE、疾病靶点、生命科学突破、基因编辑、精准医学

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注