利用上述元件对模型性能进行评估时,作者的分析结果发现:将两种算法分别构建的模型应用于大型训练人群(如泛癌组)以及应用于测试元件集时,均显示出出色的性能(图1b-c)。
图1.两种算法分别构建的模型的性能评估
其次,作者分析发现,随机lasso+GLM和GBM均可用于以不同方式对特征重要性进行排名。两种方法的特征选择排名均显示H3K9me3(与异染色质相关)和H3K27ac(或其拮抗组蛋白标记H3K27me3)是BMR最重要的预测因子(图S2)。
图S2.特征重要性排名
2.功能校正
在以往大多数基于负荷的方法中,均会对突变进行加权处理。但并非所有突变都具有相同的功能结果。为了合并功能结果等信息,DriverPower实现了功能校正。功能校正步骤可以增强具有较高预测功能影响的突变。在当前实施中,作者使用四个已发布的评分方案(CADD16,DANN17,EIGEN18和LINSIGHT19评分)来评估功能影响分数(图2a-b)。
图2.功能影响评分(functional impact scores)