论文解读+代码复现【AIDD】贝叶斯、决策树、随机森林+2种机器学习模型在癌症治疗药物发现中的应用

AIDD(AI Drug Discovery & Design):是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒。 覆盖了机器学习和深度学习,能与新药研发相结合并实质性的应用到靶点预测、高通量筛选、药物设计、药物的ADMET性质预测等;且算力方面,由早期应用于药物发现领域的决策树、随机向量机等机器学习模型,进展到深度神经网络、卷积神经网络、循环神经网络等深度学习算法。 具体到新药研发环节:如靶点识别,基于决策树来预测与疾病相关的基因,有研究者发现了多种EF在信号通路和胞外定位中的调控作用,并进一步基于靶点的结构和几何特征,选取一定量蛋白的数十个结合位点以及大量的非药物结合位点,构建随机森林分类器来预测药物靶点,并有研究者进一步采样提升了随机森林算法,成功的从非药物靶点中区分了药物靶点。

本期带领大家学习的是一篇在影响因子6.514《欧洲药物化学杂志》发表的论文--《基于配体和结构的潜在小分子发现靶向微管蛋白秋水仙碱位点用于癌症治疗的潜在小分子》。我们将从研究背景,设计思路,研究内容这三部分课题研究思路去将论文中所涉及的问题思考并学习。

ps~:文字部分是文章的具体内容,具体的机器学习代码复现过程在文章底部链接或者二维码中。该教学视频感谢“互动派” 的倾情奉献。

课题研究背景:

        微管是由α/β微管蛋白组成的异二聚体,是细胞骨架的重要组成部分。微管不断地聚合与解聚的动力学特性使其在细胞的多种生理过程中扮演着重要的角色。通过干扰微管蛋白聚合和解聚的动态动力学平衡,可以干扰肿瘤细胞的有丝分裂,抑制肿瘤生长。

论文解读+代码复现【AIDD】贝叶斯、决策树、随机森林+2种机器学习模型在癌症治疗药物发现中的应用_第1张图片

       因此,微管成为抗肿瘤药物研究的有效靶点之一。作用于紫杉醇位点和长春碱位点的微管蛋白抑制剂是目前临床上应用广泛的抗有丝分裂剂,但具有一定的神经毒性和骨髓抑制毒性。另外,耐药性的产生,尤其是P-gp介导的多药耐药性,也降低了这些药物的有效性。

       此外,紫杉醇等微管蛋白抑制剂的溶解性较差,需使用化学助溶剂溶解,容易引起过敏反应等问题。靶向秋水仙碱结合位点抑制剂一般不是多药耐药外排泵的底物,可以克服由P-gp介导的耐药性的产生,对多药耐药肿瘤细胞依然有效。靶向秋水仙碱位点的抑制剂除了抗有丝分裂外,还具有血管阻断(扰乱)作用,作为血管破坏或阻断剂,发挥抗肿瘤作用。

       本论文针对目前临床应用的微管靶向抑制剂存在的不足,以LL01的结构为基础,致力于发现高效低毒、高水溶性、抗耐药的靶向秋水仙碱结合位点的微管蛋白抑制剂。

课题研究思路:

       在前期研究中,本课题组以秋水仙碱结合位点为靶点,基于茚并吡唑这一优势结构,通过在茚并吡唑的7位引入不同的取代基,发现了强效微管蛋白抑制剂LL01。LL01不是P-gp底物,对多药耐药细胞、紫杉醇耐药肿瘤细胞同样有效,并具有良好的体内外抗肿瘤活性和药代动力学性质。

课题研究内容:

一、茚并吡唑类微管蛋白抑制剂。

为进一步明确茚并吡唑类微管蛋白抑制剂的构效关系,提高该类化合物的水溶性,本研究对茚并吡唑6位和7位酚羟基上的取代基、3位的芳胺,进行了系统的结构修饰。茚并吡唑衍生物的合成以5,6-二羟基-1-茚酮为起始原料,将两个酚羟基选择性地进行保护或取代,经与LiHMDS或NaH反应,再与各种取代异硫氰酸苯酯亲核加成,经水合肼环合后,将茚并吡唑NH甲基化。脱去酚羟基保护基,引入各种取代基或再经过衍生,构建N-甲基茚并吡唑衍生物系列化合物。基于保护基(TBS、MOM或其组合)的不同、取代基引入的次序不同等,共设计了5条合成路线,合成了茚并吡唑类衍生物33个,发现了一系列高活性茚并吡唑衍生物。构效关系研究表明,茚并吡唑6位酚轻基上的取代基以乙基为活性所必需,其它取代基,如甲基、丙基和体积大的基团均影响其与微管蛋白的结合,活性大大降低或丧失;茚并吡唑7位酚羟基的取代基必须长度适中,且含一个氢键供体,如末端酰胺、羟基、氨基等,能与Ⅰ区与β-微管蛋白交界处的α微管蛋白亚基,如Ser178α等形成氢键结合。茚并吡唑3位的芳胺占据微管蛋白秋水仙碱结合位点的Ⅲ区,当该区结合基团为苯环时,间位取代为活性必需,而对位取代导致活性丧失。间位的取代基必须含氢键受体杂原子,如乙氧基、丙酰基、甲酯、乙酯等,以维持与Ⅲ区Tyr202β和Asn167β的氢键结合;在酯类衍生物中,乙酯为优选,其次为甲酯,而异丙酯的活性降低;Ⅲ区结合基团也可以是杂环,如6-乙氧基吡啶。7-(3-氨基丙氧基)-3-(3-乙氧基苯基氨基)茚并吡唑衍生物的盐酸盐ID08和7-(3-氨基丙氧基)-3-(6-乙氧基吡啶-2-氨基)茚并吡唑衍生物的盐酸盐ID25具有良好的水溶性(1 mg/mL)。ID08和ID25能抑制微管蛋白的聚合,IC50分别为3.65和3.13μM。对包括紫杉醇耐药的多株肿瘤细胞具有极高的抗增殖活性,GI50在3-15 nM。在细胞水平,ID08和ID25能够抑制或干扰微管和微丝的形成。通过EBI竞争实验,证明了它们作用于秋水仙碱结合位点。ID08和ID25能使HepG2细胞有丝分裂停滞于G2/M期,诱导HepG2细胞细胞凋亡。ID08还具有抑制肿瘤细胞迁移的作用。此外,ID08可以抑制cMet和AKT激酶的磷酸化。在HCT116和HepG2异种移植小鼠模型中,口服给药ID08或ID25(25mg/kg)可以有效抑制肿瘤生长,抑制率超过50%。在HepG2异种移植小鼠模型中,尾静脉注射给药5mg/kg或10mg/kg,每两天一次,ID08对肿瘤的抑制率分别达到54%和68%,且对动物体重没有影响。化合物ID08和ID25有望作为临床候选药物或候选化合物,进行系统性临床前抗肿瘤活性评价。

二、苯并呋喃并吡唑衍生物的合成与生物活性评价。

在前期对茚并吡唑6位、7位和3位结构修饰的基础上,本部分拟对茚并吡唑母核进行修饰,采用生物电子等排原理,将茚并吡唑母核4位的亚甲基替换为氧原子,设计、合成苯并呋喃并吡唑衍生物。以间苯二酚为起始原料,与氯乙腈经Hoesch反应引入乙酰基,再在在弱碱条件下分子内环合,将6位羟基甲基化,得到6-甲氧基苯并呋喃-3-酮。将6-甲氧基苯并呋喃-3-酮与LiHMDS反应后,与间位取代的异硫氰酸苯酯亲核加成,再经水合肼环合。研究发现,除了生成苯并呋喃并吡唑衍生物外,还伴有开环而生成的吡唑衍生物,二者分离困难。因此,对合成的5个苯并呋喃并吡唑类衍生物和5个吡唑衍生物进行了初步抗肿瘤增殖活性研究。所有的苯并呋喃并吡唑类衍生物对人乳腺癌MCF-7细胞均没有活性。除了苯并呋喃并吡唑3位为间乙氧基苯胺取代的化合物BF01外,其它苯并呋喃并吡唑类衍生物活性对人白血病K562细胞和非小细胞肺癌A549细胞的抑制活性较弱。BF01对K562和A549细胞的GI50分别为0.26和0.19μM。相反,5个吡唑衍生物对这三株肿瘤细胞均有活性,吡唑3位苯胺的间位取代基为甲酸甲酯时活性最高,其次依次为乙氧基、氰基、N-甲基甲酰胺和甲酰胺。甲酸甲酯衍生物PY02对K562、MCF-7和A549细胞具有良好的抑制活性,GI50分为0.021、1.7和0.19 μM。PY02能够抑制微管蛋白的聚合,IC50为7.30μM。由于合成及分离的原因,没有对该类化合物进行系统深入地研究,但PY02的发现为后续吲唑类微管蛋白抑制剂的设计奠定了基础。

三、吲唑类衍生物的设计合成与抗肿瘤活性评价。

为进一步提高吡唑衍生物PY02的活性,本部分采用构象限制的化合物设计策略,将PY02分子中的苯环和吡唑环骈合,引入天然抗微管蛋白抑制剂秋水仙碱、CA-4、鬼臼毒素等分子中常见的3,4,5-三甲氧基苯基药效团,设计了新型吲唑类微管蛋白抑制剂。以不同取代的2-氟苯甲酸为原料,与含不同取代基的苯胺反应,合成各种取代的2-氟苯甲酰胺中间体。经劳森试剂将羰基转换为硫羰基,再经水合肼环合,合成了 23个吲唑类衍生物。构效关系研究表明,吲唑环上6位取代优于其它位置的取代,6位甲基或甲氧基为优选;吲唑环上3位的3,4,5-三甲氧基苯基为活性必需基团,当3,4,5-三甲氧基苯基被其它烷氧基苯基取代后,抗增殖活性明显降低。其中,6-甲基吲唑衍生物IZ03和6-甲氧基吲唑衍生物IZ06对人肝癌HepG2细胞,人结肠癌HCT116、HT29、SW620细胞,非小细胞肺癌A549细胞,包括紫杉醇耐药的A549细胞,具有强抗增殖活性,GI50在8-96 nM。IZ03和IZ06靶向微管蛋白秋水仙碱结合位点,抑制微管蛋白的聚合,破坏肿瘤细胞内微管网络,使肿瘤细胞有丝分裂停滞于G2/M期,并诱导细胞凋亡。此外,IZ03和IZ06还具有抗血管生成作用。 通过对肿瘤相关的15种激酶进行抑制实验,证明IZ06对这些激酶没有脱靶效应。在HCT116异种移植小鼠模型中,以25 mg/kg的剂量口服给药,IZ06较IZ03和阳性对照5-Fu表现出更好体内抗肿瘤作用,肿瘤生长抑制率达58.9%,对小鼠体重没有明显的影响,可以作为先导化合物或候选化合物作进一步研究。

 课题研究结论:

        综上所述,本研究对茚并吡唑类微管蛋白抑制剂进行了较为系统的结构修饰,明确了该类化合物的构效关系,发现了水溶性好的强效微管蛋白抑制剂ID08和ID25,解决了微管蛋白抑制剂常见的溶解度差和耐药性问题。通过苯并呋喃并吡唑衍生物的研究,进而设计、合成和发现了新型吲唑类靶向秋水仙碱位点的微管蛋白抑制剂IZ06。这些强效微管蛋白抑制剂,特别是ID08和ID25,具有优良的体内外抗肿瘤活性,将继续开展药代动力学、毒理学等临床前系统药学研究,为其临床应用奠定基础。

ps~:论文解读到这里就结束了,具体机器学习中的代码复现过程在接下来的网址中。该教学视频感谢“互动派” 的倾情奉献。

论文解读+代码复现【AIDD】贝叶斯、决策树、随机森林+2种机器学习模型在癌症治疗药物发现中的应用_第2张图片

【论文解读+代码复现【AIDD】贝叶斯、决策树、随机森林+2种机器学习模型在癌症治疗药物发现中的应用】

欢迎大家一起进行专业学术交流

感谢大家的阅读

你可能感兴趣的:(AIDD,算法,人工智能,决策树,数据挖掘)