网络安全 频道

基于XFS文件系统 文件碎片重组恢复方法

编者按:随着数据恢复技术的不断发展,基于磁盘数据逻辑层恢复技术日益完善,但目前在逻辑层恢复技术中存在一项巨大的挑战,那就是当删除文件存在多段碎片的状态时,数据重组恢复将变得十分困难。本期,数据恢复四川省重点实验室科研人员将以一种XFS文件三系统中文件在存储时被散列多个片段的情况下,被删除后的恢复为例,讲解基于XFS文件系统的碎片重组恢复方法。

一、XFS文件系统简介

      XFS 最初是由 Silicon Graphics,Inc.于 90 年代初开发的一种高性能日志文件系统。XFS极具伸缩性,非常健壮,之后SGI将其移植到了Linux系统中。它是一个64位的文件系统。

      XFS文件系统具有良好数据完全性,能够在断电以及操作系统崩溃的情况下保证文件系统数据的一致性,如果文件系统开启日志功能,磁盘上的文件不再会因意外情况而遭到破坏,文件系统可以根据所记录的日志在一定时间内恢复磁盘文件内容,这与文件系统上存储的文件多少与数据量大小无关。另外,XFS 是一个全64-bit的文件系统,它可以支持上百万T字节的存储空间。对特大文件及小尺寸文件的支持都表现出众,支持特大数量的目录。最大可支持的文件大小为263 = 9 exabytes。


二、XFS文件存储原理

      通过解析XFS文件系统存储原理发现,分配组是XFS抽象程度最高的概念,XFS文件系统内部被分为多个“分配组”(AG),它们是文件系统中的等长线性存储区。每个分配组各自管理自己的inode和剩余空间。文件和文件夹可以跨越分配组。这一机制为XFS提供了可伸缩性和并行特性——多个线程和进程可以同时在同一个文件系统上并行执行I/O操作。这种由分配组带来的内部分区机制在一个文件系统跨越多个物理设备时特别有用,使得优化对下级存储部件的吞吐量利用率成为可能。

      在一个磁盘上创建XFS文件系统之后,磁盘会被格式化成如下格式,如图1。

图片1_副本.png

图1

      在CentOS7上默认的是创建4个AG。每个AG都相当于是1个独立的文件系统,维护着自己的free space以及inode,其主要包括以下信息:

      1、superblock:描述整个文件系统的信息。

      2、空闲空间管理。

      3、inode的分配和记录管理

      在超级块superblock中记录着AG中的所有元数据信息,其中几个核心的元数据为:

      1、blocksize,文件系统中使用的block的大小,以及整个文件系统用于存放data和metadata的block个数。

      2、sectorsize,指定底层磁盘一个扇区的大小,数据的最小对齐粒度。

      3、AG_blocks/AG_count,文件系统中一个AG包含的block个数,以及整个文件系统AG的个数。

      4、inodesize/inopblock,记录inode的大小以及每个block中包含inode的个数。

      5、logstart/logblocks,如果使用同一块盘存放XFS的journal,这两个值用于表示存放journal的第一个block以及用于存放log的总block个数。

      6、icount/ifree,文件系统中已经分配的inode个数以及剩余可用的inode个数,这个只在AG Primary的Superblock中维护。

      需要说明的是XFS文件系统中采用的字节序为大端,在Superblock中记录着AG中的所有元数据信息结构,如图2所示。

图片2_副本.png

图2

      在XFS存储数据文件时,会产生一个extend链表来存储文件占用的块结构的编号,并且按照顺序来进行记录,在每一记录项中包含了块地址的编号与使用块的个数。为了更为方便阐述,我们将使用IRIX 5.3版本发布的XFS文件系统为例,文件链表的基本结构如图3所示。

图片3_副本.png

图3

      XFS文件系统中每一个文件链表的长度为一个块的长度,其结构如图4所示。

图片4_副本.png

图4

      文件特征头为0x424D4150,长度为4字节,其后2字节表示当前文件链表的级别,紧接着2字节记录的值表示当前文件链表中的记录项的个数,后面左右兄弟节点的地址均占有8字节来存储,在其后的数据为若干个记录项数据,每一记录项的长度为16字节,若某一记录项未被使用时,其16字节长度的内容全用00表示。

      在每一个记录项中记录着存储文件的块地址信息,具体的每一个记录项的结构,如图5所示。

图片5_副本.png

图5

      在记录项中存储结构的划分单位为bit(位),由于每一个记录项的长度为16字节,也即是16*8=128bit,在相对每一记录项起始偏移1bit的值为记录项的标记位;在相对每一记录项起始偏移2bit~55bit的值为记录项所记录的块数据在文件中的相对偏移的块数;在相对每一记录项起始偏移56bit~107bit的值为文件所使用的块地址,在该处记录地址的信息包含的文件所使用块所在的AG编号及块在AG中的相对偏移编号,其中块在AG中的相对偏移编号在该结构中占有的位数处于低位,长度的值为在XFS文件系统中相对超级块起始偏移0x7C字节的处记录的值,由此可计算出块所在的AG编号的值位于相对记录项起始偏移56bit~107bit的高位处,其长度为52减块在AG中的相对偏移编号的长度值;在相对每一记录项起始偏移108bit~128bit的值为文件所使用的块个数。

三、XFS文件系统的碎片重组恢复思路

      通过对XFS文件系统的深入分析,发现当文件在存储时分配的块不连续,会使用extend文件链来记录文件存储信息。通过对比文件删除前后的变化情况发现,文件删除后会清除记录文件inode节点信息,而文件链表信息不会丢失,如图6,这就为数据恢复提供了理论支持。

图片6_副本.png

图6

      由于XFS在存储数据文件时,会产生一个链表来存储文件占用的块结构的编号,并且按照顺序来进行记录,在每一记录项中包含了块地址的编号与使用的块的个数。根据以上特征,只需通过快速定位存储文件占用块编号的链表来进行查找数据,并按照链表中记录的信息读取相应块地址的数据内容,然后按照链表的记录的顺序将提取到的数据进行拼接重组,即可实现XFS文件系统的碎片重组。这种方法不仅能够快速高效提取删除的视频数据,还能将删除的视频数据进行拼接重组。

四、XFS文件系统的碎片重组恢复流程

      基于XFS文件系统的碎片重组恢复方法,主要通过以下流程来完成:

      1.加载并解析磁盘扇区信息

      加载磁盘,读取磁盘中AG内的超级块所在扇区信息并解析。需要解析的内容包括块大小,块总数,AG所包含的块数,每一个块在AG中的相对偏移值。具体地,superblock位于AG数据中的第一个扇区,在相对于超级起始地址偏移0x04~0x07记录的值表示块大小,在相对于超级起始地址偏移0x08~0x0F记录的值表示块总数,在相对于超级起始地址偏移0x54~0x57记录的值表示单个AG所包含的块的总个数,在相对于超级起始地址偏移0x7C记录的值表示在文件链表记录项中块在AG的相对偏移编号。

      2.匹配文件链表结构

      获取单个文件链表的大小,即块大小的值。将整个硬盘的数据按照块大小分成若干个块,匹配每一个块是否符合文件链表的结构,文件链表的结构特征包含如下特征:

      特征一:文件链表特征头为0x424D4150;

      特征二:文件链表特征头后两个字节表示文件链表的级别,该处记录值的范围是0~255;

      特征三:文件链表级别后两个字节表示文件链表的记录项的个数,该处记录的值应小于超级块中记录的总块数;

      特征四:在特征三之后的8个字节表示该文件链表所记录的文件之前有数据内容的状态,该处记录的值应小于超级块中记录的总块数;

      特征五:在特征四之后的8个字节表示该文件链表所记录的文件之后有数据内容的状态,该处记录的值应小于超级块中记录的总块数;

      3.解析文件链接结构

      首先通过2中特征四来判断该文件链表所记录的文件在此文件链表记录的地址之前是否包含数据。若2中特征四描述的地址的值为-1,则表示在此之前无文件数据,也表明该文件链为文件存储的root节点;若2中特征四描述的地址的值不为-1时,该值表示该文件链表所记录的文件在此文件链表记录的地址之前的文件链表所在的块号,跳转至相应块号读取块中的文件链表结构,按照3所描述的方法进行解析文件链表结构;同理判断2中特征五所描述的该文件链表所记录的文件在此文件链表记录的地址之后是否包含数据;依次文件链表中每一记录项数据,按照记录项的结构特征读取记录文件数据的块号和所占用的块个数。

      4.读取对应块地址数据

      根据3中解析的内容,依据文件链表中记录的顺序,依次读取每一记录项对应块地址的数据内容;

      5.重组新文件

      将4中读取的数据,按照文件链表中记录的文件链表间的关系和记录项的顺序,依次拼接项中记录的块地址的数据,重新组合为一个新的文件;

      6.遍历硬盘扇区

      将一个文件链表中记录的值解析完成后,继续向下搜索文件链表结构并判断该文件链表是否被使用,若被使用继续向下,未使用则进行解析,重复2到5的步骤,直至遍历整个硬盘扇区。

      通过以上步骤,即可实现XFS文件系统的碎片重组恢复。

四、结语

      本期,数据恢复四川省重点室科研人员介绍了一种基于XFS文件系统的视频删除数据的快速提取与恢复方法,这种方法不仅能够快速高效提取删除视频数据,还能将删除视频数据进行拼接重组。目前,此方法已经在效率源DRS数据恢复系统、VIP视频侦查单兵系统、VIE视频全能提取系统等产品中应用,取得了很好的效果。


特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章