Anonim

从星期六晚上开始,我的妻子问为什么我们的DVR突然停止播放她正在观看的节目。 我告诉她,这很可能只是一些小故障,但我会看一看。 我走进家庭房去看,该错误基本上表明底层磁盘不再可用。 不好! 这是我三天恐怖故事的开始……

一点背景

我的DVR实际上只是在PC上运行的专用软件(对于好奇的人来说是SageTV)。 该软件非常灵活,可让您分离出软件的所有各个方面。 我有一台用于集中控制,调度和记录的单独机器,一台用于回放的机器,而这个故事的明星,一台用于存储的机器。 对于存储,我使用Linux文件服务器,该服务器使用LVM(逻辑卷管理器)将许多单独的,不相同的驱动器聚集到操作系统可以看到的一个大的逻辑驱动器中(目前约为6TB)。 由于备份多个TB的数据是不切实际的,并且由于所说的数据只是“电视”节目,因此我对此的备份原则始终是“不在乎”。 直到最近发生的事件,这一理念没有被真实世界的事件进行测试。

尝试恢复数据

见状DVR上的错误,我立刻开始寻找存储服务器。 文件系统非常缓慢,响应速度很慢,因此我向LVM查询其逻辑卷下的物理驱动器的状态。 长时间延迟后,它出现,并说缺少750 GB驱动器。 哦! 我重新启动服务器,令人惊讶的是,驱动器又回来了。 我发出了一个pvmove命令,以自动从该驱动器上迁移所有数据,但是它失败的次数不到2%。

面对一个在读取数据方面非常不合作但至少在BIOS中显示的驱动器,我转向了我最喜欢的驱动器恢复工具Spinrite。 尽管Spinrite通常从可移动媒体启动,但是几年前我还是在家里为各种实用程序设置了网络启动功能,因此我不必担心跟踪任何媒体。 通常,我只是连接到我的网络,选择从网络启动,并且我可以使用各种工具来解决许多问题。 问题是,这一切成为魔术的工作是在同一台机器这是目前关闭机器。 我说没什么大不了的,我只是从Spinrite CD引导。 除了几年前我的文件服务器上的光驱就断了。 当时,我决定因为我从未在那台机器上使用光学介质,所以不需要更换它。 不用担心,我告诉我自己,我只是把光盘驱动器从我的电脑主机。 我关闭主计算机电源,然后取出光盘驱动器。 然后,我寻找我的Spinrite启动CD。 找不到! 我们在几个月前搬进了新房子,所以一切都在一个趁乱一点的。 我想,我就烧一个新的副本,但我甚至无法找到任何空白光学介质! 下一个计划是可启动的闪存驱动器! 之后在谷歌几分钟刷新我的记忆中,我有一个可启动的Spinrite闪存驱动器。 我从中启动Linux机器并启动Spinrite。 计算机死机,似乎崩溃了。 为了消除变量,我将坏的驱动器从插入PCI-e扩展卡中移到了直接插入主板中。 现在Spinrite启动正常,但需要年龄和年龄来枚举连接到它的驱动器。 我会系统地拔出除坏驱动器之外的所有其他驱动器的电源,但是无论我等待多长时间,它都无法完成枚举驱动器。 进入下一个计划! 我从Linux盒子中取出驱动器,将其连接到主计算机,然后从闪亮的新Spinrite闪存驱动器启动。 Spinrite启动后立即看到驱动器,我告诉它开始恢复数据,并确信我终于取得了一些进展。 我可能在10分钟后再去检查它,屏幕上出现错误,看来驱动器再次消失了。 沮丧的是,我尝试了几次,然后告诉Spinrite从驱动器的各个部分开始,但是每次都得到相同的结果。 看来这毕竟对我没有帮助。

在一阵非理性的希望,我把车回到我的Linux系统中,并打开其电源。 令我惊讶的是,该驱动器出现了,并且LVM激活了所有功能。 进一步试试运气,我发出了另一个pvmove命令,尝试再次将数据移出驱动器。 早期,我看到有关无法读取驱动器的错误消息,但是令人惊讶的是,pvmove仍在不断进步,越来越接近100%完成。 混乱,轻松和激动的混合情绪笼罩着我。 我要摆脱这毫发无损吗? 令人遗憾的是,LVM彻底完成pvmove要做的最后一件事是将更新的日志写入其控制下的所有驱动器。 当它试图写入坏的驱动器,因此中止的全过程这当然会失败。 再次从胜利的jaw子中夺走胜利! 我重新回到Google,发现可以控制pvmove命令移动多少数据,而不是一次移动所有数据。 我试验这个,并具有良好的成功同时移动我的数据的一小部分。 我很贪婪,驱动器消失了几次,但是在计算机重新启动后总是恢复。 理论化的驱动器的也许只有某些部分是坏的,我开始跳来跳去而不是在驱动器的开始工作。 经过几次迭代之后,除了750 GB中的40 GB,我已经安全地移出了驱动器。 对于剩余的40 GB,它没有移动不管是什么我试过了。 现在是星期天晚上,我筋疲力尽了,所以我决定去睡觉,第二天解决这个问题了。

第二天,一些睡眠,我一天工作的上半年之后,我决定咬咬牙,因为我不关心过去的40 GB的录制的电视节目,并着手从我的LVM配置中删除驱动器。 我已经做过很多次,所以它会比较顺利。 清理名单上的下被修复的文件系统的中间的孔。 我只有40 GB,而不是750 GB的身影缺少它不能是太糟糕了,对不对? 错误! 修理后,我有900 GB的额外可用空间相比考验开始之前,让刺痛了不少。 哦,好吧,我告诉自己,这只是电视呢。 我的DVR终于其3天沉寂后重新正常工作,我可以在最后一站想着这与所有业余时间脑循环。

得到教训

那我从这一切中学到了什么? 对于真正重要的事情,我应该做得更好。 这发生在几周前,那时我什至没有错过任何消失的电视内容。 但是,我确实后悔阻止自己(更重要的是我的家人)不能使用电视三天,并且在这三天里使自己陷入高压力危机模式。 如果我一开始就放弃恢复数据,那么功能将在大约一个小时内恢复,而不是三天。 我都非常清楚,我们的大部分数据是宝贵的时间,但在这种情况下它不是。

其次,如果您的数据确实很宝贵,并且有99%的时间确实是您的数据,那么您需要对其进行保护! 备份数据,没有任何借口。 对于不可替代的数据,例如我在计算机上保存的数千张儿子的照片,我确保将其备份在不少于三个位置,其中一个是云备份提供商。 至于DVR存储,我仍然认为将其备份到云中并不可行,但是由于这些天的驱动器价格昂贵,我没有理由不对其进行RAID保护,而这正是我的意思。将要去做。 多年前,当我第一次建立存储集群时,我认为花了10个或更多驱动器才能进入多个TB的池。 我刚查了价格,现在就可以购买3 TB硬盘远低于$ 100。 我只是没有理由不让自己的数据受到保护,如果再次发生像我这样的数据丢失,那确实是我自己的错。

悲伤,沮丧和数据丢失的故事