容错对于虚拟化系统变得越来越重要,因为现在越来越多的关键任务应用程序部署在虚拟机上,而不是直接部署在物理机上。 然而,现有的基于硬件的容错系统需要对现有硬件进行大量修改,这使得它们对于行业从业者而言是不可行的。 尽管基于软件的技术无需任何硬件修改即可实现容错功能,但它们却遭受了显着的延迟开销,通常比可接受的延迟高几个数量级。 为了在虚拟化环境中实现实际的低延迟容错能力,我们首先确定现有方法中的两个瓶颈,即在软件中跟踪脏页的开销和在检查点系统状态下的长顺序依赖性。 为了解决这些瓶颈,我们设计了一种