在这项工作中,我们研究预测非同义SNP对几种癌症的影响。 我们对从受影响的基因中提取的序列特征和结构特征进行分类器训练,并使用交叉验证评估了训练后的分类器做出的预测。 具体来说,我们调查了如何通过在单体型和受影响基因编码的蛋白质相互作用位点的背景下连接SNP来改善预测性能。 我们发现,通过将顺序和结构特征相结合,精度一直得到提高,范围从几个百分点到超过20个百分点。 将SNP置于相互作用位点的情况下,结果不一致。 与单个SNP相比,以单倍型形式出现的SNP彼此之间以及与表型之间显示出更强的相关性