自闭症(Autism)已成为中国儿童主要精神疾病,引发社会广泛关注,该疾病病因尚不明确,涉及遗传和环境多个层面,目前临床治疗存在一定限制,常规治疗方法的选择和评价存在实际困难。
本研究旨在揭示自闭症儿童的尿液代谢特征,并利用机器学习方法,来区分出自闭症代谢标志物,通过了解自闭症的代谢特征,为早期筛查、诊断提供科学依据。
01研究方法
研究队列包括52名自闭症儿童和40名正常发育儿童,禁食4小时后收集尿液样本,尿液样本以UHPLC/Q-TOF-MS进行分析。机器学习模型构建采用Lasso回归进行特征选择,并运用逻辑回归、支持向量机、随机森林和极端梯度提升等机器学习方法进行显著性分层。统计学分析包括卡方检验,Wilcoxon秩和检验,t-检验,应用PCA、PLS-DA和OPLS-DA等多变量统计方法,分析代谢谱差异。此外还进行了通路富集分析,以识别相关的代谢途径。
02研究结果
研究发现了92种差异代谢物在自闭症儿童和正常发育儿童之间存在显著差异,通过应用四种不同的机器学习方法,揭示了与儿童自闭症有关的不同代谢物,如前列腺素E2、磷酸盐、赖氨酸、苏氨酸和苯丙氨酸。
此外,运用四种不同的ML方法,鉴定出前列腺素E2、磷酸盐、赖氨酸、苏氨酸和苯丙氨酸等与自闭症有关的特异性代谢物。发现磷脂酰肌醇和肌醇磷酸代谢途径的改变与自闭症病理生理过程相关(p<0.05)。
03研究结论
研究针对自闭症,首次系统地利用机器学习技术,分析儿童尿液的代谢特征,揭示了与自闭症有关的差异代谢物及其关联的代谢通路,如磷脂酰肌醇和肌醇磷酸代谢途径。机器学习在处理高维、非独立、多重共线性的组学数据方面展现出优势,有助于识别与自闭症疾病强相关的代谢物群体。
研究发现前列腺素E2、磷酸盐、赖氨酸、苏氨酸和苯丙氨酸等与自闭症存在关联,磷脂酰肌醇和肌醇磷酸盐途径在自闭症的病理生理学中扮演潜在角色。这些发现为自闭症的早期筛查和诊断提供了新的思路,为自闭症的机制研究提供了方向。
04研究结果展开
图1.显示课题分析流程图,展示从原始样本收集到最终结果解释的整个研究过程
过程涵盖:
1.样本收集;
2.UHPLC/Q-TOF-MS技术对尿液样本进行代谢物整体分析;
3.原始数据处理;
4.多种统计方法应用,包括主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)和正交偏最小二乘判别分析(OPLS-DA),来区分疾病与正常儿童的代谢谱;
5.机器学习特征选择运用Lasso回归机器学习方法;
6.模型验证使用逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)和极端梯度提升(XGB)等方法对选定的代谢物进行验证;
7.通路富集分析KEGG通路,以识别与自闭症疾病有关的代谢途径。
表1.提供了自闭症儿童(case children)和典型发育儿童(typical children)两组样本的相关临床信息。
表中数据涵盖分类变量(如性别、种族、胎龄、分娩方式)和连续变量(如年龄、出生体重、出生长度、父母年龄)。
图2.展示样本分析的总离子色谱图(Total Ion Chromatogram,TIC)
TIC图伴随质谱分析而产生,质量控制(Quality Control,QC)的TIC图可评估分析的数据可靠性与可重复性。a.正离子模式下的TIC图。b.负离子模式下的TIC图。
图3.通过OPLS-DA得分图和置换检验图,显示自闭症儿童和正常儿童在代谢水平上的差异
a.显示正离子模式下的OPLS-DA得分图,得分图上的点代表了每个样本,点的分布模式可以帮助识别两组之间的代谢差异。
b.显示负离子模式下的OPLS-DA得分图,得分图上的点代表了每个样本,点的分布模式可以帮助识别两组之间的代谢差异。
c.显示正离子模式下的置换检验图,用于评估OPLS-DA模型的稳健性。通过随机置换样本的组别标签,并重新计算模型,生成一个置换检验图。如果原始模型的得分图与随机置换后的得分图有显著差异,这表明模型具有很好的区分能力,不是由偶然因素造成的。
d.显示负离子模式下的置换检验图,用于评估OPLS-DA模型的稳健性。通过随机置换样本的组别标签,并重新计算模型,生成一个置换检验图。如果原始模型的得分图与随机置换后的得分图有显著差异,这表明模型具有很好的区分能力,不是由偶然因素造成的。
图4.展示通过统计分析方法和机器学习方法所识别的差异代谢物
a.显示正离子模式下的代谢物水平变化倍数(Fold Change),显示自闭症儿童与正常儿童差异代谢物的变化情况。
b.显示负离子模式下的代谢物水平变化倍数(Fold Change),显示自闭症儿童与正常儿童差异代谢物的变化情况。
c.显示正离子模式下的变量重要性投影(Variable Importance in Projection,VIP)图,VIP值是OPLS-DA模型中,用于评估代谢物对模型分类能力贡献大小的一个指标,高VIP值的代谢物是区分两组样本的关键因素。
d.显示负离子模式下的变量重要性投影(Variable Importance in Projection,VIP)图,VIP值是OPLS-DA模型中,用于评估代谢物对模型分类能力贡献大小的一个指标,高VIP值的代谢物是区分两组样本的关键因素。
e.显示正离子模式下的代谢物差异火山图,用于观察识别潜在的生物标志物。
f.显示负离子模式下的代谢物差异火山图,用于观察识别潜在的生物标志物。
表2.展示了研究中通过机器学习,以及其他模型分析筛选,选出的自闭症关联代谢物
表中包含代谢物类别、代谢物名称、VIP值、p值、Fold Change、相关方法。通过这些数据,研究者可以进一步验证和研究这些代谢物在自闭症中的作用。
表3.展示了研究中机器学习模型的性能评估结果,用于衡量模型在区分自闭症儿童和正常儿童方面的准确性和可靠性
表3包含:
模型名称,如支持向量机(SVM)、随机森林(RF)、极端梯度提升(XGB)以及逻辑回归(LR);
ROC-AUC,即接收者操作特征曲线下面积(Receiver Operating Characteristic-Area Under the Curve),ROC-AUC值越接近1,表示模型的分类性能越好;PR-AUC,即精确度-召回率曲线(Precision-Recall Curve)下面积,适用于不平衡数据集,反映模型在正类(如自闭症儿童)中的识别能力;
F1分数,是精确度(Precision)和召回率(Recall)的调和平均数,用于衡量模型的总体效能,F1分数越高,表示模型的分类性能越均衡;
MCC,即Matthews相关系数(Matthews Correlation Coefficient),可以综合考虑真正例、真负例、假正例和假负例的指标,用于衡量分类模型的整体性能,MCC值的范围从-1到1,值为1表示完美预测,值为0表示预测性能等同于随机猜测,负值表示模型表现不佳。
图5.箱线图(Boxplots)显示不同代谢物在自闭症儿童和正常儿童尿液样本中的浓度差异
代谢物包括:前列腺素(Prostaglandin E2 Ethanolamide,PGE2-EA);磷酸盐Phosphonic acid;氨基酸代谢物Lysine Lysine Threonine(Lys Lys Thr);苯丙氨酸-赖氨酸-苏氨酸Phenylalanine Phenylalanine Threonine(Phe Phe Thr);脂类代谢物Lcaceine;脂类代谢物Karacoline:苯类代谢物5-Nonadecylresorcinol。
图6.显示差异代谢物的KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析结果
揭示了自闭症可能涉及的关键代谢途径,这些途径包括磷脂酰肌醇信号系统、肌醇磷酸代谢等,它们在细胞信号传导、细胞生长和分化、以及神经发育等过程中起着关键作用。
05总结与启发
该篇文献发表于Frontiers In Psychiatry(IF>5),这项研究通过结合尿液代谢物检测和机器学习方法,为自闭症的生物标志物研究提供了新的思路。
研究结果不仅揭示了自闭症儿童尿液中的特定代谢物变化,而且还指出了与自闭症有关的代谢途径。这些发现为开发新的诊断工具和治疗策略提供了科学基础。
未来的研究可以在此基础上进一步探索这些代谢物在自闭症发展中的具体作用,以及它们是否能够作为有效的生物标志物用于临床实践。此外,研究还提示了未来研究需要关注大样本验证、性别差异以及其他潜在的混杂因素,以确保研究结果的准确性和可靠性。
参考文献
Liu X,Sun X,Guo C et al.Untargeted urine metabolomics and machine learning provide potential metabolic signatures in children with autism spectrum disorder.Front Psychiatry.2024 Feb 20;15:1261617.doi:10.3389/fpsyt.2024.1261617.eCollection 2024.
华测多组学科研服务AI+靶向代谢组学智能临床转化平台亮相第二届多组学科研大会
2024年3月30日至31日,第二届多组学科研与临床应用大会在上海丽昂豪生大酒店盛大开幕,大会以“聚焦多组学,从科研到临床”为主题,吸引了国内外众多专家学者相关的基础研究、临床应用、产业从业者参与,全场座无虚席。
2024-04-02 00:59:15
CTI华测艾普满分通过2023年“全国血液微生物cfDNA宏基因组高通量测序室间质量评价预研活动”
11月15日,国家卫生健康委临床检验中心公布了2023年全国血液微生物cfDNA宏基因组高通量测序室间质量评价预研活动结果报告,经过严格的考核与评估,华测艾普医学检验所(以下简称“华测艾普“)满分通过了此次考评,以优秀的成绩展现了其精准化医疗服务的实力,代表着华测艾普的检测能力获得国家权威机构的充分认可,是华测艾普医学技术实力和高质量水平的充分体现,也印证了华测艾普在病原微生物宏基因组检测领域的重要地位。
2023-11-20 22:34:55
会议预告|CTI华测艾研邀您参加第二届单细胞技术及组学应用发展大会
为促进单细胞及组学应用领域的交流与发展,2023年5月19-20日第二届单细胞技术及组学应用发展大会,以“聚焦技术前沿,加速科研转化”为主题,特邀70+行业领袖,1000+专家代表;多形式打造全方位产学研资交流平台,邀请单细胞及组学领域的科学家、企业家、投资人等各界代表共商行业发展。
2023-05-15 10:30:55