对于人工智能药物设计技术的初学者,因缺乏对人工智能数据算法、平台、软件的掌握与深入理解,导致无从下手。那下面这些内容你了解吗?
1.什么是分子描述符?
所谓分子描述符,是指分子在某一方面性质的度量,既可以是分子的物理化学性质,也可以是根据分子结构通过各种算法推导出来的数值指标。
定量构效关系(quantitative structure-activity relationship,QSAR)是化学计量学的重要工具,它采用数理统计方法解释化合物活性或物理化学特征与其分子结构之间的定量变化规律。
分子描述符的计算是QSAR研究的基础,精确定义并且合理使用分子描述符在QSAR研究中非常重要。能否得到具有较高信度和效度的QSAR模型很大程度上取决于选择的描述符是否正确。目前,各种软件提供提供的分子描述符已经超过5000多种。因此,如何从中选择出于研究对象最密切相关的,成为QSAR研究中首先要面对的问题。文献提及的描述符选择方法,主要有逐步回归(SR)、主成分分析(PCA)、因子分析(FA)以及偏最小二乘法(PLS)等。
2.SMILES表示法——SMILES符号是“线性符号”之一,用于用单行文本表达化合物的结构。
3.pandas—— 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
4.sklearnsklearn——是针对Python编程语言的免费软件机器学习库。sklearn又称Scikit-learn,是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归、降维、分类、聚类等方法。是一项简单高效的数据挖掘和数据分析工具。它包含了从数据预处理到训练模型的各个方面,因此在实战使用scikit-learn中可以极大的节省我们编写代码的时间以及减少我们的代码量,使我们有更多的精力去分析数据分布,调整模型和修改超参。
5. 在过去几年里,以人工智能为代表的新技术的引入,通过利用自然语言处理、深度学习、机器学习和图像识别等对传统的计算机辅助药物设计带来显著的效率提升,并极大地增加了研发成功的可能性。目前,我国AI药物研发主要应用在药物发现阶段,其中,靶点发现、先导化合物研究和化合物筛选、化合物合成是AI+药物研发最热门的领域,按照应用场景的发展速度来看,未来药物发现、合成或将成自动化程度最高的方向。
但是AI药物研发也面临着急需要解决的问题,AI药物研发兼具信息科技和医药双重属性,需要AI的人才也需要懂药物研发的人才,需要培养一批具备交叉学科的复合型人才队伍。
6. 那下面这些内容重点你又知道多少呢?
1)分子表征及特征提取:分子描述符和分子指纹,分子描述符/指纹计算软件;
2)结构预处理、数据预处理:PyBioMed结构预处理、ChemSAR结构预处理、 KNIME 结构预处理、Excel数据预处理及注意的问题;
3)人工智能药物设计算法与软件:KNIME软件介绍,特征选择,模型的评价与解释;
4)类药性和ADMET评价实践:ADMET、ADMET计算软件和实操、KNIME软件构建ADMET模型等;
5)GRK2抑制剂筛选实践。
如果你想要了解更多关于人工智能药物设计技术与应用实践的知识技能,请查看:https://mp.weixin.qq.com/s/AKITWP6WOVgOMpBB3tJHWQ
或者联系我。欢迎大家前来询问!
1.什么是分子描述符?
所谓分子描述符,是指分子在某一方面性质的度量,既可以是分子的物理化学性质,也可以是根据分子结构通过各种算法推导出来的数值指标。
定量构效关系(quantitative structure-activity relationship,QSAR)是化学计量学的重要工具,它采用数理统计方法解释化合物活性或物理化学特征与其分子结构之间的定量变化规律。
分子描述符的计算是QSAR研究的基础,精确定义并且合理使用分子描述符在QSAR研究中非常重要。能否得到具有较高信度和效度的QSAR模型很大程度上取决于选择的描述符是否正确。目前,各种软件提供提供的分子描述符已经超过5000多种。因此,如何从中选择出于研究对象最密切相关的,成为QSAR研究中首先要面对的问题。文献提及的描述符选择方法,主要有逐步回归(SR)、主成分分析(PCA)、因子分析(FA)以及偏最小二乘法(PLS)等。
2.SMILES表示法——SMILES符号是“线性符号”之一,用于用单行文本表达化合物的结构。
3.pandas—— 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
4.sklearnsklearn——是针对Python编程语言的免费软件机器学习库。sklearn又称Scikit-learn,是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归、降维、分类、聚类等方法。是一项简单高效的数据挖掘和数据分析工具。它包含了从数据预处理到训练模型的各个方面,因此在实战使用scikit-learn中可以极大的节省我们编写代码的时间以及减少我们的代码量,使我们有更多的精力去分析数据分布,调整模型和修改超参。
5. 在过去几年里,以人工智能为代表的新技术的引入,通过利用自然语言处理、深度学习、机器学习和图像识别等对传统的计算机辅助药物设计带来显著的效率提升,并极大地增加了研发成功的可能性。目前,我国AI药物研发主要应用在药物发现阶段,其中,靶点发现、先导化合物研究和化合物筛选、化合物合成是AI+药物研发最热门的领域,按照应用场景的发展速度来看,未来药物发现、合成或将成自动化程度最高的方向。
但是AI药物研发也面临着急需要解决的问题,AI药物研发兼具信息科技和医药双重属性,需要AI的人才也需要懂药物研发的人才,需要培养一批具备交叉学科的复合型人才队伍。
6. 那下面这些内容重点你又知道多少呢?
1)分子表征及特征提取:分子描述符和分子指纹,分子描述符/指纹计算软件;
2)结构预处理、数据预处理:PyBioMed结构预处理、ChemSAR结构预处理、 KNIME 结构预处理、Excel数据预处理及注意的问题;
3)人工智能药物设计算法与软件:KNIME软件介绍,特征选择,模型的评价与解释;
4)类药性和ADMET评价实践:ADMET、ADMET计算软件和实操、KNIME软件构建ADMET模型等;
5)GRK2抑制剂筛选实践。
如果你想要了解更多关于人工智能药物设计技术与应用实践的知识技能,请查看:https://mp.weixin.qq.com/s/AKITWP6WOVgOMpBB3tJHWQ
或者联系我。欢迎大家前来询问!