今日概览
- 电子结构描述符实现天然产物骨架跃迁 ESI描述符+XGBoost在NP库上达到R²=0.85的pIC₅₀预测精度,可跳出已知骨架发现新结构。
重点关注
01电子结构描述符实现天然产物骨架跃迁
α-葡萄糖苷酶抑制剂常因结构冗余导致专利悬崖,而天然产物(NP)化学空间庞大,传统相似性检索难以跳出已知骨架。作者将量子化学计算得到的电子结构信息学(ESI)描述符引入机器学习,用XGBoost回归直接预测pIC₅₀,在保留集上取得R²=0.85,显著优于传统2D/3D描述符组合,为NP库挖掘提供了新的数值化视角。
in silico筛选2623条NP后,模型不仅重新挑出theasinensin A、chebulagic acid、casuarictin等已知活性物,还给出与现有抑制剂相似度低、骨架全新的中等活性候选;分子对接显示其结合分数高于上市药物acarbose。然而研究止步于计算层面,缺乏体外酶抑制实验与细胞毒性数据,ESI描述符对蛋白-配体相互作用细节的物理可解释性也未验证,骨架跃迁的实际合成可及性仍是未知数。
也值得关注
在四种癌症靶点评分管线中,用匿名编码替换实体名的推理时盲化协议可审计 16% 的 Top-20 预测差异,同时保持验证靶标召回率不变。 链接
今日观察
今日两条 featured 工作均把“跳出已知骨架”当成核心卖点,却都只停在 in silico 层面。第一篇用 ESI 描述符 + XGBoost 在 NP 库上把 pIC₅₀ 预测推到 R²=0.85,并靠对接分数筛出优于 acarbose 的新 scaffold;第二篇用 3D-MGM 在 2.2 M 分子库里生成 334 个化学多样性>0.9 的 GPCR 调节剂,重合成 6 个后 3 个在 10 μΜ 水平显示活性。共同点是把“生成分子-预测活性-对接过滤”做成一条无需蛋白结构即可扩展的流水线,且都靠内部或公开模型完成快速迭代,提示 scaffold-hopping 的 AI 方案已趋于工程化。
不过,两条摘要都承认实验验证仍极单薄:NP 研究尚无任一人造或生物活性数据,3D-MGM 也仅走到体外单点初筛。对 AI 药物发现团队的可执行观察是:下一阶段应把“in silico 成功”直接对接可合成的 BB 库并预设毒理/理化阈值,在生成模型里同步加入可合成性打分;同时把阳性对照、阴性对照与药化同行评审前置,避免“只讲故事、不见数据”的 scaffold 堆积。
以上内容为个人解读,仅供参考。权威内容请以原论文为准。