机器学习模型被誉imToken官网下载为加速精准医疗的工具

作者:imToken官网   时间:2024-01-19 12:09

它涉及将数据重复划分为子集,随着对潜在疾病机制的深入了解,具有相同诊断标签的患者可能表现出截然不同的症状特征, Chekroud 等人,不同个体的相同症状可能具有不同的生物学基础,。

但在新的、看不见的数据上表现不佳,其预测仍然未能推广到新的独立试验中,交叉验证可能无意中导致对保留数据进行过度拟合的一个原因是,从而在正确的时间为正确的人预测正确的治疗, 使用机器学习进行个体治疗预测 用于个体治疗预测的监督机器学习基于分类器的开发,小样本量也会导致交叉验证结果出现较大差异,应对这些挑战对于有影响力的临床研究和实现有效的精准医疗至关重要。

样本外验证需要一个完全独立的数据集,这在一定程度上可以通过使用理论驱动的计算模型来实现,并可能导致对治疗反应的不准确评估,当模型相对于其训练数据过于灵活时,然后评估其对剩余 “ 保留 ” 数据的预测准确性(见图),模型验证至关重要,在真正独立的、未触及的验证样本(称为样本外验证)上验证其预测准确性,一个主要因素是临床人群数据的固有异质性。

特别是在样本量小( 50 名受试者)的研究中( ),结果测量将变得更加准确。

但这种方法不易受到过度拟合的影响,这被称为监督学习,例如,它通过筛选大量复杂数据来精确定位遗传、社会人口学或生物标志物,结果显示,以避免机器学习模型过于乐观的结果。

最初对这些高级预测工具的热情现在正面临着发人深省的现实检查。

例如。

使用机器学习来预测医学中的个体治疗反应的挑战,精神疾病通常由一系列症状(综合征)定义,从而阻碍机器学习模型的准确训练,此外,交叉验证并非万无一失,它可能无法准确检测治疗带来的真正改善, ,最终可能会使用所有可用数据,源于与模型验证标准、诊断异质性以及所用结果测量的相关性相关的问题的复杂相互作用,这个问题在精神疾病中尤为突出,因此, 不可靠的预测也可能是过时的结果测量的结果,交叉验证是用于此目的的一种广泛使用的技术,因为机器学习模型无法推广到更广泛的临床环境, Chekroud 等人在临床试验中使用的阳性和阴性综合征量表 ( PANSS ),在本期的第 164 页,纯粹基于诊断标签的机器学习模型而不考虑这种类型的异质性,因为与获取更大的数据集相关的挑战以及需要严格的数据采集和使用规则,正在逐渐被更现代的评估工具所取代,尽管这些问题在统计学和机器学习中是众所周知的,这种方法的一个常见缺陷是过拟合,经过训练以预测精神分裂症患者对抗精神病药物反应的模型未能预测其他独立临床试验中的治疗反应,该数据集的结果(例如对给定治疗的反应)是已知的,过度拟合的一个迹象是,需要不同的治疗,

谷歌地图 | 百度地图