在过去的三十年里,纳米孔测序已成为最经济、最有效的 DNA 测序方法。该方法涉及通过纳米宽的通道将 DNA 链拉过膜,可以读取比传统技术更长的 DNA 序列。纳米孔测序使科学家能够分析基因组的复杂部分,但虽然该技术在解析 DNA 方面非常出色,但它不适用于其他可以作为疾病标记的生物分子。
现在,伦敦帝国理工学院的研究人员找到了解决这一限制的方法。通过使用小片段 DNA 作为其他生物分子的条形码,研究人员利用纳米孔测序的力量来识别血液样本中的数十种不同的疾病生物标志物。在 9 月 25 日发表在《自然纳米技术》杂志上的一篇论文中,该团队证明该策略可以同时检测人类血清中的 40 种生物标志物,包括蛋白质、称为 microRNA 的小 RNA 片段以及脑细胞传输的化学物质(神经递质)。
研究人员表明,他们的技术可以检测人体血液样本中 40 种不同的生物标志物。但他们现在正在努力检测 100 个。
这一进展为个性化医疗打开了一扇大门,可以让医生尽早准确诊断癌症和心脏病,并为患者定制治疗方案。“这项技术的许多组成部分以前就已经存在了,”伦敦帝国理工学院化学教授、这项进步背后的研究团队成员亚历山大·伊万诺夫(Aleksandar Ivanov)说。“正是将所有这些结合在一起产生的协同作用使得这项工作变得重要。这包括测序的精度、控制分析物传输的能力,以及能够重建信号的机器学习要素。”
伊万诺夫、化学教授约书亚·埃德尔和他们在帝国理工学院的团队与牛津纳米孔技术公司的研究人员合作,该公司制造了世界上唯一的商业纳米孔测序仪。该机器产生电场,将长 DNA 链拉过窄于 3 纳米的孔。当一条链穿过一个孔时,该孔限制了样品中存在的离子的通过,导致电场发生微小变化,可用于识别单个核苷酸——通常以字母 A、C、G、和T。
但伊万诺夫说,其他生物分子要么太小而无法通过纳米孔测序检测到,要么太大而无法通过。他说,即使它们可以挤过孔隙,测序仪产生的信号也可能是非特异性的。例如,两种蛋白质可以具有相似的电子签名,但具有完全不同的生物功能。
为了解决这个问题,该团队制作了 30 个核苷酸长的小型 DNA 片段,就像不同生物标记物的独特条形码一样。他们将每个条形码连接到特殊的“探针”分子,这些分子与特定的疾病生物标志物结合,无论是蛋白质、神经递质还是其他东西。将这些 DNA 条形码探针添加到血液样本中后,研究人员将其通过纳米孔测序仪。
这时机器学习算法就开始发挥作用了。该团队训练了算法,从同时读取不同生物标记物的多个条形码时产生的混乱信号中识别每个独特条形码的核酸序列。
“我们使用这些探针来找出样品中感兴趣的分子,”伊万诺夫说。“我们知道哪个条形码对应哪个探针。这使我们能够检测溶液中是否存在分子。在某种程度上,我们正在对解决方案中的内容进行指纹识别。”
“正是将所有这些结合在一起产生的协同作用使得这项工作变得重要。这包括测序的精度、控制分析物传输的能力,以及能够重建信号的机器学习要素。”——亚历山大·伊万诺夫,伦敦帝国理工学院化学教授
Edel 表示,将 DNA 条码编码和纳米孔测序相结合,形成了一种强大的技术,将选择性和灵敏度结合在一起,可以更有效地筛查疾病。“在个性化[医学]和能够进行更有效的诊断和筛查的背景下,有两个方面在发挥作用。其中之一是通过检测一系列生物标志物来更好地了解患者。对于某些疾病,生物标志物(尤其是在早期阶段)的浓度非常低。因此,能够在低浓度下进行个体检测绝对至关重要。”
研究人员在论文中表明,他们的技术可以检测人类血液样本中 40 种不同的生物标志物。但埃德尔说,他们现在正在努力检测 100 个。“就上限而言,可能接近 1,000,”他说。“这是更大的图景,更长远的愿景。”