Regeneron ISEF 2025 大奖:BCHM030 - 代谢中机器学习的酶距离概念

理解和重建代谢途径有助于识别与全身性疾病(例如癌症和心血管疾病)相关的生物标志物和代谢变化。然而,在大多数代谢组学数据集中,超过一半的实验检测到的代谢物可能未经注释,这使得它们在特定途径中的参与程度在很大程度上未知。本研究表明,距离概念可以通过确定未注释代谢物与已知代谢物之间的“距离”来帮助将其定位到代谢网络的特定部分。“酶促距离”这一新概念的提出是为了量化代谢过程中任意两种代谢物在酶促步骤和它们之间的物质流动方面的分离。酶促距离由两个指标来评估:共享原子映射数和反应中心原子数,这两个指标是两种化合物反应路径的平均数。然后,对单变量和多变量多层感知回归模型进行了超过 100 个周期和 30 次交叉验证迭代的训练和评估,以仅根据目标代谢物的化学结构特征来预测它们之间的酶促距离指标。单变量(R2=0.961)和多变量(R2=0.958)回归模型能够稳健地预测原子映射,而单变量(R2=0.876)和多变量(R2=0.859)回归模型对反应中心的预测准确率则显著降低。单变量回归模型对这两个指标的预测准确率高于多变量回归模型(p值<0.001),因为分别预测这两个指标的准确率更高。量化和预测已知和未知代谢物之间的关系有助于解释人体中未注释的代谢物,从而有助于代谢疾病的检测和解释。

相关文章:

国际科学与工程大奖赛 ISEF(STEM),科创竞赛天花板!有何含金量?该如何参赛?
ISEF 英特尔国际科学与工程大奖赛:申请美国大学最有价值的竞赛之一
科创天花板!ISEF竞赛参与方式/晋级途径/学科设置/奖项设置一文讲清
科创天花板——2025 ISEF竞赛新改革变化!附带竞赛全面介绍
ISEF国际科学与工程大赛有哪些科目?为什么推荐ISEF竞赛?
国际高中生偏爱的ISEF到底是什么?一文详解ISEF比赛内容/适合学生/晋级路径/含金量
如何找到ISEF的导师或实验室资源?
中国学生参加ISEF需要通过哪些国内赛事(如青创赛)晋级?ISEF获奖率高吗?
中学生英才计划与ISEF:探索青少年科技创新之路