探索未来医学 | 复合纳米材料与机器学习,共谱泛癌诊断之曲!

2024-04-12 07:48:47 412

  近年来,越来越多的研究表明癌症是一种代谢紊乱性的慢性疾病,随着质谱技术的成熟和应用,该技术已通过检测肿瘤的血清代谢物表达谱成为癌症早期检查和筛查的重要方法。


  该方法具有高通量并且具有良好的准确性和较低的样本消耗,因此是一种很有前途的非侵入性癌症诊断解决方案。


  本文中研究者的工作是利用两个独立纳米结构材料结合机器学习进行高灵敏度检测和高通量分析,建立多重纳米材料辅助LDI的癌症识别的模型MNALCI(Multiplexed Nanomaterial-Assisted LDI for CancerIdentification)。以数据分析的角度解析如何利用非靶代谢数据建立泛癌的识别模型。


  01课题方案设计


  样本队列介绍

  本文通过利用1183个人的代谢组学样本,其中包括233个健康人和950个肿瘤病人,这些病人中患癌的种类包括肝癌,肺癌,胰腺癌,大肠癌,胃癌和甲状腺癌。

图1试验方案设计原理示意图


  通过利用两个独立的纳米结构材料,结合多种机器学习模型,对健康人群和患癌人群进行数据分析,建立数学模型对不同肿瘤类型进行分类。试验方案设计如上图所示。


  02研究结论

图2 MNALCI模型的预测能力展示


  图2a和图2b表明利用文章中提到的两种纳米材料检测出来的非靶代谢数据分别进行单独的模型预测和两者结合检测出来的数据进行预测,发现由两种纳米材料结合的方法检测数来的数据建立的模型预测在训练数据集中的准确性和敏感性要优于单独的纳米材料,分别用ROC曲线和混淆矩阵做了展示。


  图c图d以及图e图f也说明了同样的道理,即基于该方法建立的模型在内部测试集和外部测试集的性能指标展示,其中MNALCI对区分癌症和健康对照组的敏感性为93%,特异性为91%,而在外部验证队列中,MNALCI对区分癌症和健康对照组的敏感性为84%,特异性为84%。


  ROC曲线越靠近左上方表明该模型的预测能力越好,混淆矩阵中位于对角线上的数字百分比越大表明预测能力越好。


  

图3根据MNALCI模型筛选出来的泛癌标记物


  图3中的小提琴图展示的是利用MNALCI模型筛选出来的泛癌代谢标记物;

  图a和图b是找到的肝癌肿瘤标志物;

  图c和图d对应的是在肺癌中的代谢标志物;

  图e和图f是在胰腺癌中的标志物;

  图g和图h是在大肠癌中的代谢标志物;

  图i和图j是在胃腺癌中筛查到的肿瘤标志物;

  图k和图l是甲状腺癌中筛选出来的疾病标志物。

  这些图表明利用MNALCI模型结合两种纳米材料进行质谱检测可以比较准确的找到相应肿瘤的标志物,充分证明模型的准确性和可靠性。


  03总结与启发


  虽然文中有很部分内容与质谱实验技术中的纳米材料相关,由两种纳米材料单独使用和结合使用对血清代谢物进行检测,可以肯定该项实验技术的突破对质谱检测性能的重要提升。


  而站在数据分析的角度而言,通过利用机器学习模型对代谢组学数据进行挖掘来预测泛癌的肿瘤标志物亦是很难得的科研思路的尝试。


  该项研究有三大亮点:

  1.前面提到的质谱技术,将两种纳米材料进行结合使用,提升检测性能。

  2.研究中采用了大队列的样本数据,模型预测的准确性有很大一部分取决于样本量的大小与数据的均衡情况。

  3.通过利用机器学习的模型,研究者找到了相对比较准确的预测不同癌种的代谢物标志物。


  最后,该研究建立了一种基于微量血清的低成本、高通量程序,以高精度诊断和分类不同类型的癌症,展示了癌症诊断在标准临床实践的巨大潜力。


  参考文献

  Zhang,H.,Zhao,L.,Jiang,J.et al.Multiplexed nanomaterial-assisted laser desorption/ionization for pan-cancer diagnosis and classification.Nat Commun 13,617(2022).

免费获取更多专业咨询
我已阅读并同意 《CTI华测检测隐私政策》 《会员注册协议》

*新号码将自动注册

立即咨询
相关资讯
热门服务 更多 >
  • 热线电话
  • 业务咨询
  • 快速询价
  • 在线客服
  • 报告验证