系统架构师:数据库的故障与恢复

yumo6668个月前 (03-27)技术文章58

一.故障类型

数据库的故障可用事务的故障来表示,主要分为四类:

  • 事务故障。事务在运行过程中由于种种原因,如输入数据的错误、运算溢出、违反了某些完整性限制、某些应用程序的错误,以及并发事务发生死锁等,使事务未运行至正常终止点就被撤销,这种情况称为“事务故障”。
  • 系统故障。系统故障是指系统在运行过程中,由于某种原因(如操作系统或数据库管理系统代码错误、操作员操作失误、特定类型的硬件错误(如 CPU 故障)、突然停电等造成系统停止运行),致使事务在执行过程中以非正常方式终止,这时内存中的信息丢失,但存储在外存储设备上的数据不会受影响。
  • 介质故障。系统在运行过程中,由于某种硬件故障,如磁盘损坏、磁头碰撞或由于操作系统的某种潜在的错误、瞬时强磁场干扰,使存储在外存上的数据部分损失或全部损失,称为“介质故障”。这类故障比前两类故障的可能性虽然小得多,但破坏性却最大。
  • 计算机病毒。计算机病毒是一种人为破坏计算机正常工作的特殊程序。通过读写染有病毒的计算机系统中的程序与数据,这些病毒可以迅速繁殖和传播,危害计算机系统和数据库。目前大多数病毒是在 PC 和其兼容机上传播的。有的病毒一侵入系统就马上摧毁系统,有的病毒有较长的潜伏期,有的病毒则只在特定的日期发生破坏作用,有的病毒感染系统所有的程序和数据,有的只影响特定的程序和数据。在数据库系统中,恢复的基本含义就是恢复数据库本身。也就是说,在发生某种故障使数据库当前的状态已经不再正确时,把数据库恢复到已知为正确的某一状态。目前数据库系统中最常用的恢复方法是转储和登记日志文件,可根据故障的不同类型,采用不同的恢复策略。

二.故障的恢复

事务故障的恢复。事务故障是指事务未运行至正常终止点前被撤销,这时恢复的系统应对此事务做撤销处理。事务故障的恢复是由系统自动完成的,不需要用户干预,步骤如下:

  1. 反向扫描文件日志,查找该事务的更新操作。
  2. 对该事务的更新操作执行逆操作。
  3. 继续反向扫描日志文件,查找该事务的其他更新操作,并做同样处理。
  4. 如此处理下去,直至读到此事务的开始标记,事务故障恢复完成。

系统故障的恢复。系统故障发生时,造成数据库不一致状态的原因有两个:一是由于一些未完成事务对数据库的更新已写入数据库;二是由于一些已提交事务对数据库的更新还留在缓冲区没来得及写入数据库。系统故障的恢复是在重新启动时自动完成的,不需要用户干预,步骤如下:

  1. 正向扫描日志文件,找出在故障发生前已经提交的事务,将其事务标识记入重做(Redo)队列。同时找出故障发生时尚未完成的事务,将其事务标识记入撤销(Undo)队列。
  2. 对撤销队列中的各个事务进行撤销处理:反向扫描日志文件,对每个 Undo 事务的更新操作执行逆操作。对重做队列中的各个事务进行重做处理:正向扫描日志文件,对每个 Redo 事务重新执行日志文件登记的操作。
  3. 介质故障与病毒破坏的恢复。在发生介质故障和遭病毒破坏时,磁盘上的物理数据库被破坏,这时的恢复操作可分为三步:
    1. 装入最新的数据库后备副本,使数据库恢复到最近一次转储时的一致性状态。
    2. 从故障点开始反向读日志文件,找出已提交事务标识将其记入重做队列。
    3. 从起始点开始正向阅读日志文件,根据重做队列中的记录,重做所有已完成事务,将数据库恢复至故障前某一时刻的一致状态。

具有检查点的恢复技术。检查点记录的内容可包括:

建立检查点时刻所有正在执行的事务清单。

这些事务最近一个日志记录的地址。采用检查点的恢复步骤如下:

  1. 从重新开始文件中找到最后一个检查点记录在日志文件中的地址,由该地址在日志文件中找到最后一个检查点记录。
  2. 由该检查点记录得到检查点建立时所有正在执行的事务清单队列A。建立重做队列R和撤销队列U,把 A 队列放入 U 队列中,R 队列为空。
  3. 从检查点开始正向扫描日志文件,若有新开始的事务 T1,则把 T1 放入 U 队列,若有提交的事务 T2,则把T2从U队列移到R队列,直至日志文件结束。
  4. 对 U 队列的每个事务执行 Undo 操作,对 R 队列的每个事务执行 Redo 操作。

DBA 要做的基本操作是:

  1. 重装最近转储的后援副本。
  2. 运行日志文件,执行系统提供的恢复命令。

数据库安全和恢复是数据库系统正常运行的保证。大型数据库管理系统一般都提供了实现安全机制的保证,即由系统提供了相应的功能,但小型的数据库管理系统并非都具有相应功能,因此有时需要人工的辅助措施,用以保证数据库的安全和恢复。

相关文章

数据库数据恢复——MySQL数据库Delete命令删除数据的数据恢复

MySQL数据库是一种关系型数据库。MySQL数据库相比较其他数据库有以下特点:体积小、速度快、性价比高。MySQL数据库的源码开放,且支持绝大多数操作系统,便于搭建和维护,所以MySQL数据库被广泛...

如果数据库误操作, 如何执行数据恢复?

如果数据库出现误操作,导致数据被删除或修改,可以通过以下步骤进行数据恢复:停止MySQL服务:在误操作发生后,立即停止MySQL服务,防止数据被覆盖。找到备份数据:如果有备份,可以通过备份文件进行数据...

Oracle数据库的备份与恢复,实用易学简单,转发收藏备用

Oracle数据库非常强大,有其自己的备份与恢复机制,并且细分,只要配置合理,完全可以保证数据库的完整,免去运维人员的后顾之忧。Oracle数据库使用RMAN备份,需要把数据库的非归档模式改成归档模式...

电脑硬盘数据库恢复的方法

在现代社会,电脑已经成为人们生活中不可或缺的一部分。然而,由于各种原因,我们的电脑硬盘中的数据库可能会丢失或损坏,这对我们的工作和生活都会带来很大的影响。那么,数据库丢失文件怎么恢复?下面,我们将为大...

「数据库数据恢复」SQL SERVER数据库MDF (NDF)或LDF损坏的数据恢复

SQL SERVER数据库故障类型:MDF(NDF)或LDF损坏。SQL SERVER故障原因:1、数据库正在操作过程中,机器突然断电;2、人为误操作。SQL SERVER故障表现:1、数据库在管理器...