背景。 与Sanger测序相比,下一代测序平台可产生更短的读数,更深的覆盖范围和更高的通量。 这些短读可以在某些特定的基因组分析之前从头组装。 到目前为止,这些当前的组装机的组装重复件的性能非常差。 结果。 为了解决这个问题,我们提出了一种新的基因组组装算法,即SWA,它具有四个属性:(1)组装重复和非重复; (2)采用新的重叠扩展策略来扩展每个种子; (3)采用滑动窗口滤除排序偏差; (4)提出了一种针对低覆盖率数据集的补偿机制。 在仿真和实际测序数据集中都对SWA进行了评估和验证。 重复组装