人类的基因组里有大约20000条基因,其中有多少条基因得到了科学家的积极研究?

  答案是约2000条,占人类基因的十分之一。那么,一个很合理的问题随之而来:科学家们为啥对剩下90%的基因视而不见?

▲每条基因都是一个点,颜色越蓝,说明相关研究越少(图片来源:CC-BY-Thomas Stoeger)

▲每条基因都是一个点,颜色越蓝,说明相关研究越少(图片来源:CC-BY-Thomas Stoeger)

  本周发表在《PLOS Biology》上的一项研究回答了这个问题:限制科学发展的,正是科学界本身。在当今学术氛围的影响下,只有专注于这10%的基因,才能获得更好的职业发展,申请到更多科研经费。

  我们这么做对吗?这是一个值得反思的问题。

  先回到现状本身。自人类基因组计划完成以来,科学家们就期待能对人类的基因进行广泛而全面的研究,可现状却不尽如人意。据统计,90%的论文集中在10%的基因上,而有30%的基因一直没有引起科学界的广泛注意。

  “人类基因组计划应当带来改变,可一切都没有改变,”本研究的通讯作者之一Luís Amaral教授说道:“科学家们一直停留在原地,研究同样的基因。我们应该把所有的注意力都花在这一小群基因上吗?”

▲少数几个特征决定了基因会不会得到大量研究(图片来源:参考资料[1])

▲少数几个特征决定了基因会不会得到大量研究(图片来源:参考资料[1])

  为了搞清背后的原因,这支团队给每一条基因都加上了430个各种各样的特征,并使用机器学习的方法,做了大数据分析。分析结果表明,其中的15个特征起到了主导性的作用。总体来看,如果一个基因表达水平越高,蛋白越稳定,相关的论文就越多。这听起来很合理——越容易被研究的基因,也越容易得到更多的研究。

  这好像是生物学上的“马太效应”。用研究者的原话说,“有钱人会变得更有钱”(“rich” can get “richer”)。某些基因研究取得的成功吸引了科学家和资金,从而进一步让这些基因研究变得更为知名。

  这不是一个好的循环。研究人员们发现,如果博士后研究员与博士生的课题专注于不那么知名的基因,他们成为独立研究者的概率就要比同僚们低50%。

 ▲有些研究领域,注定要更困难一些(图片来源:Pixabay,https://pixabay.com/en/research-science-laboratory-lab-1029340/)

▲有些研究领域,注定要更困难一些(图片来源:Pixabay)

  也许有人会提,这10%的基因之所以得到那么广泛的研究,是因为他们与人类的健康最为相关。这句话说对了一半。诚然,这些基因与疾病的关联更甚,参与疾病发展的可能性要比其他基因高上3-5倍。但和这些基因相关的论文,数目却比其他基因的研究高出数千倍,不成比例。

  这其实在一定层面上,影响了对于新靶点的开发。研究人员们发现,有30%的在研药物,其靶点来自于1981年之前发现的基因。而2001年后发现的基因,只占新药研发的2%。

  “我们发现目前对于人类基因的研究,没有反映出许多基因在医学上的重要性,”本研究的另一名通讯作者Thomas Stoeger博士说道:“许多基因和人类疾病之间有着非常强的关联,但它们没有得到充分研究。相反,社会影响和经费机制不断让现在的科学家集中于过去的研究主题。”

▲没有被光照亮的地方,其实大有天地(图片来源:Pixabay,https://pixabay.com/en/spot-night-view-the-scenery-light-1531921/)

▲没有被光照亮的地方,其实大有天地(图片来源:Pixabay)

  正如一些评论所指出的那样,即便是我们研究最为透彻的基因,也依旧有许多未解之谜等待我们去解开,这无可厚非。但我们也应该认识到,在人类的基因组中,在聚光灯照亮的10%基因之外,还有许多新的空间值得我们去探索。