陈宏斌   2024-8-3
 高级软件工程师

概要
S.M.A.R.T.(自我监控、分析和报告技术)是一种硬件监控工具,用于检测硬盘故障的早期预警信号,有助于防止数据丢失或损坏。它既适用于HDD也与部分SSD兼容。该技术通过让驱动器运行并记录自我测试作为维护程序的一部分来工作。每个驱动器厂商都会设定特定的属性和阈值进行监控,以便在引发重大问题之前识别潜在问题。



自我监控、分析和报告技术 (简称 S.M.A.R.T. )是一种 硬件监控工具 ,旨在检测 硬盘故障的早期预警信号 。此技术允许用户采取必要措施防止 数据丢失损坏S.M.A.R.T. 兼容 硬盘驱动器HDD )和部分 固态硬盘SSD ),多年来已拯救了无数文件和数据。

什么是 S.M.A.R.T.?

S.M.A.R.T. 是一个监控硬盘问题并报告的程序。硬盘会运行并记录自检作为维护例行程序。默认情况下,所有硬盘都启用了 该功能
固态硬盘智能属性

S.M.A.R.T. 如何工作?

在最基本的层面上,S.M.A.R.T. 通过扫描和监控硬盘驱动器的健康状况来工作。现代硬盘故障一般分为两种类型:
- 可预测: 这些故障包括 机械磨损数据存储表面的退化 。机械故障占消费系统中硬盘故障的 约60%
- 不可预测 :无法合理预测的故障,通常源于 硬件误用
S.M.A.R.T.协议关注 可预测的故障 ,并 自动记录和跟踪 。您可以使用硬盘制造商提供的各种专用工具检查硬盘的 S.M.A.R.T.状态

常见的 S.M.A.R.T. 警告信号

S.M.A.R.T. 可跟踪与硬盘健康有关的约 50 种不同属性。其中最重要的属性包括
- 重新分配扇区计数 :跟踪损坏的驱动器扇区被重新分配或重新映射的次数,表明 过度磨损

- 当前待处理扇区计数:跟踪尚未 重新映射 的不稳定或 损坏扇区 数量。

对于固态硬盘来说,还有一些重要的属性:
- 擦除失败计数 :跟踪删除失败的次数,指示 SSD故障
- 磨损均衡计数 :提供硬盘整体健康状况的估计,数值越高表示磨损越大。

BIOS 级别故障

固态硬盘 SMART Bios 故障
SMART 失败范例 2
SMART 失败范例 3
SMART 失败示例

操作系统级故障

1. S.M.A.R.T. 故障 – Windows 系统级别
Windows 系统中的 SMART 故障
2. S.M.A.R.T. 故障 – MacOS 系统级别
MacOS 系统中的 SMART 故障

检查 S.M.A.R.T. 状态

使用 CrystalDiskInfo 检查 S.M.A.R.T. 状态

CrystalDiskInfo 是一款 免费易用开源 的Windows应用程序,显示机械硬盘(HDD)、固态硬盘(SSD)和非易失性内存快闪(NVMe)驱动器的 S.M.A.R.T.属性 。该应用程序可作为 便携版安装版 使用。
crystaldiskinfo
将 Windows 系统移动到新的 SSD 后,您可以使用 CrystalDiskInfo 检查您的 SSD。
使用 CrystalDiskInfo 有两个层面:
1. 总体健康状况: 蓝色 表示 “良好”黄色 表示 “注意”红色 表示 “差”
2. 详细 S.M.A.R.T. 属性 :提供每个驱动器的详细信息列表。
如果驱动器健康状况显示 “警告” ,请备份数据并计划更换驱动器。如果健康状况显示 “糟糕” ,请小心备份数据。

在命令提示符下检查 S.M.A.R.T.

您也可以通过 Windows命令提示符 查看 基本的S.M.A.R.T.状态
打开 命令提示符 ,点击 开始 ,输入cmd并按回车
以管理员身份运行 cmd
键入以下命令并按 Enter:

wmic diskdrive get status

显示如何使用 SMART 数据检查硬盘健康状况的 Windows 终端窗口。
如果一切正常,系统中的每个硬盘 状态应显示为 “OK”“Bad”“Caution”“Unknown” 等状态可能表示硬盘有问题或 S.M.A.R.T. 信息检索错误。

在硬盘发生故障前用 都叫兽™备份还原软件 备份重要数据

1. What is 都叫兽™备份还原软件?

都叫兽™备份还原软件 是一款专业的系统和硬盘数据备份还原工具,帮助备份和还原 程序系统配置邮件照片视频文档书签 等重要数据。利用先进的 增量差异备份技术 ,节省时间和磁盘空间。支持 系统分区硬盘文件备份 以及 磁盘克隆 。软件还支持 自动备份计划 ,节省时间和精力。
都叫兽™ 备份还原-安全高效迁移至SSD

自动4K对齐自动进行4K对齐以提高SSD性能。

支持GPT和MBR 迁移系统时,为SSD自动匹配合适的分区格式。

支持FAT/NTFS可迁移不同的文件系统格式。

备份速度快 可高达3,000MB/分钟的备份速度。

全方位备份方案 支持系统迁移/系统备份/分区备份/硬盘备份/文件备份/磁盘克隆。

自动4K对齐 提高SSD性能

支持GPT和MBR分区格式

支持NTFS和FAT32文件系统

免费试用免费试用已有800位用户免费体验!

2. 如何使用都叫兽™备份还原软件来备份 Windows 10 系统?

步骤 1 :下载、安装并运行 都叫兽™备份还原软件 ,选择 “系统备份” 选项。
system backup 都叫兽™备份还原软件
步骤 2 :选择源文件 和目标位置。源文件一般默认为系统分区,目标位置则是您要保存系统备份的位置。在备份计划中,请根据您的需求选择合适的方案。 都叫兽™备份还原软件 提供了5种方案可供选择: 版本链模式单一版本模式 、完整 模式增量模式差分模式
系统备份模式
都叫兽™备份还原软件 offers 5 backup plans:
版本链模式 :保留最新 5个版本 ,每次备份后自动删除较旧版本。

* 单版本模式 :每次备份后只保留 最新版本 ,删除之前的版本。

* 完整模式: 创建完整备份。
增量模式 :在初次全量备份后,仅创建 增量备份
差异模式 :在进行初始完整备份后,仅创建 差异备份
此外,通过使用 调度程序 ,您可以设置 每日 / 每周 / 每月 的自动备份计划和开始备份的时间。点击 “确定” 启用自动备份。
按住电源键和音量调节键
步骤 3 :完成所有设置后,点击 备份 。您可以在 都叫兽™备份还原软件主界面 切换到 任务标签 查看备份进度。如需还原系统,请阅读 系统还原 指南。
system backup 都叫兽™备份还原软件

S.M.A.R.T. 属性

标准 S。M。A。R。T 属性 - ATA

标准属性用于大多数驱动器,并且各供应商之间没有差异。

身份证
属性名称
理想
说明
010x01 读取错误率 (供应商特定原始值)存储与从磁盘表面读取数据时发生的硬件读取错误率相关的数据。不同供应商的原始值结构不同,通常不具备十进制意义。对于某些驱动器,该数值在正常操作期间可能会增加,但并不一定表示错误
020x02 吞吐量性能 硬盘驱动器的总体吞吐性能。如果该属性值下降,则硬盘可能存在问题。
030x03 启动时间 主轴从零转速加速到全速的平均时间(毫秒)。
040x04 开始/停止计数   主轴启停次数统计。硬盘通电或从休眠模式恢复时,主轴启动并增加计数
050x05 重新分配的部门数 重新分配扇区的数量。原始值表示已发现并重新映射的坏扇区数量。因此,属性值越高,驱动器需要重新分配的扇区越多。这个值主要用作驱动器预期寿命的指标;任何发生重新分配的驱动器在接下来的几个月内都更有可能出现故障。
060x06 读取通道余量   读取数据时通道的边距。此属性的功能未明确说明
070x07 搜索错误率 视情况而定 磁头寻道错误率。机械定位系统部分故障会导致寻道错误,可能由多种因素引起,如伺服损坏或硬盘热膨胀。不同厂商的原始值结构不同,通常不具备十进制意义。对于某些硬盘,此数值在正常操作中可能增加,但不一定表示错误。
080x08 搜索时间性能 磁头寻道操作的平均性能。如果该属性下降,表示机械子系统出现问题。
090x09 开机小时数   通电状态下的小时数。此属性的原始值显示通电状态下的总小时数(或分钟数,或秒数,取决于制造商)。默认情况下,硬盘在完美状态下的预期寿命5年(每天24小时不间断运行)。这相当于1825天43800小时。在一些2005年之前的硬盘上,此原始值可能会不规律地增加和/或周期性地重置为零。
100x0A 旋转重试次数 重试旋转启动尝试次数。此属性存储达到全速运行的旋转启动尝试总次数(在首次尝试失败的情况下)。此属性值增加表示硬盘机械子系统存在问题。
110x0B 重新校准重试次数或校准重试次数 此属性表示重新校准请求的次数(在首次尝试失败的情况下)。该属性值的增加表明硬盘机械子系统存在问题
120x0C 电源周期计数   此属性表示硬盘完整开关机次数
130x0D 软读取错误率 向操作系统报告的未修正读取错误。
220x16 当前氦气水平

针对HGST的He8硬盘,此数值衡量硬盘内的氦气量。当硬盘检测到内部环境不符合规格时,此预警属性会触发

1700xAA 可用预留空间   见属性 E8
1710xAB SSD 程序故障计数   驱动器部署以来闪存程序操作失败的总次数。[36] 与属性181相同。
1720xAC SSD 擦除失败计数   统计闪存擦除失败的次数。此属性返回自驱动器部署以来闪存擦除操作失败的总次数。此属性与属性182相同。
1730xAD SSD 磨平计数   计算任何区块的最大最坏擦除次数。
1740xAE 意外断电次数   也被称为“断电收缩计数”,这是传统硬盘术语。原始值报告SSD生命周期内的不正常关机次数,不正常关机是指在没有执行STANDBY IMMEDIATE命令时断电(不考虑使用电容电源的PLI活动)。标准化值始终为100
1750xAF 断电保护故障   最后一次测试结果为微秒放电电容饱和最大值。 最大值。还记录上次测试后的分钟数和测试次数。 测试次数。原始值包含以下数据
  • 字节0-1:上次测试结果(微秒),饱和于最大值。测试结果应在25 <= 结果 <= 5000000之间,较低值表示特定错误代码。
  • 字节 2-3:上次测试后的分钟数,在最大值时达到饱和。
  • 字节4-5:测试总次数,不随电源循环增加,饱和后达到最大值。
归一化值在测试失败时设为1,电容器在过高温度条件下测试时设为11,否则设为100
1760xB0 擦除失败计数   S。M。A。R。T。 参数显示多次闪存擦除命令失败。
1770xB1 磨损范围   最常用和最少用的Flash块之间的差异。这描述了SSD的磨损均衡在技术层面上的表现。
1810xB5 程序失败次数 总访问次数或非 4K 对齐访问次数 自驱动部署以来Flash程序操作失败总次数。[40] 用户数据访问次数(包括读取和写入),其中LBA不对齐4 KiBLBA % 8 != 0)或大小不是4 KiB倍数块计数 != 8),假设逻辑块大小(LBS)= 512 B
1840xB8 端到端错误 / IOEDC

此属性属于惠普的SMART IV技术,也是其他厂商IO错误检测和纠正方案的一部分,包含通过驱动器缓存RAM到媒体数据路径中发生的奇偶校验错误计数

1870xBB 报告的无法纠正的错误 无法通过硬件ECC恢复的错误数量
1880xBC 命令超时 由于硬盘超时导致的操作中止计数。通常此属性值应为
1900xBE 温差 或 气流温度 视情况而定 值等于 (100-温度°C),允许制造商设置一个最低阈值,对应最高温度。这也遵循了100为最佳值较低值为不理想的惯例。然而,一些较旧的硬盘可能会在此报告原始温度(与 0xC2 相同)或温度减去 50
1910xBF G-sense 误差率 外部冲击和振动导致的错误数量
1920xC0 断电缩回计数, 紧急缩回周期计数 (富士通),或 不安全关机计数 断电或紧急缩回循环次数
1940xC2 温度 或 摄氏温度 指示设备温度(需安装相应传感器)。最低字节包含准确的温度值(摄氏度)。
1950xC3 硬件 ECC 恢复 视情况而定 (供应商特定的原始值。)该原始值在不同供应商中结构不同,通常不具有作为十进制数的意义。对于某些驱动器,此数值在正常操作期间可能会增加,但不一定表示错误
1960xC4 重新分配事件计数 重映射操作计数。此属性的原始值显示尝试将数据从重新分配的扇区传输备用区域的总次数,包括成功失败的尝试
1970xC5 当前待处理部门数量 不稳定”扇区的数量(等待重新映射,因为存在不可恢复的读取错误)。如果某个不稳定扇区随后成功读取,该扇区将被重新映射,且该值会减少。扇区读取错误不会立即重新映射(因为无法读取正确值,无法确定重新映射的值,且有可能以后可以读取);相反,硬盘固件会记住该扇区需要重新映射,并在下次成功读取时重新映射。

有些硬盘在成功读取问题扇区后不会立即重新映射这些扇区,而是首先尝试写入问题扇区。如果写入操作成功,扇区将被标记为良好(在这种情况下,“重新分配事件计数” (0xC4) 不会增加)。这是一个严重的缺陷,因为如果这样的硬盘包含一些在成功写入后经过一段时间才会出现故障的边缘扇区,那么硬盘将永远不会重新映射这些问题扇区。

1980xC6 (离线)无法校正的扇区计数

读取/写入扇区时的不可恢复错误总数。该属性值上升表示磁盘表面缺陷和/或机械子系统问题

1990xC7 UltraDMA CRC 错误计数 通过 ICRC(接口循环冗余校验)确定的接口电缆数据传输错误计数。
2000xC8 多区误差率 写入扇区时发现的错误数量。数值越高,磁盘机械状况越差
2000xC8 写入错误率 写入扇区时的错误总数
2010xC9 软读取错误率 或
检测到 TA 计数器
计数表示无法纠正的软件读取错误数量
2020xCA 数据地址标记错误 或
TA 计数器增加
数据地址标记错误计数(或特定于供应商的错误计数)
2030xCB 用完 取消 校验和错误导致的错误数量
2040xCC 软 ECC 校正 内部错误校正软件修正错误数量
2050xCD 热膨胀率 高温导致的误差计数
2060xCE 飞行高度   磁头距盘面高度:过低易导致磁头撞击过高则易出现读写错误
2070xCF 旋转大电流 硬盘启动时使用的浪涌电流大小
2080xD0 旋转嗡嗡声   由于电力不足,需要启动驱动器的蜂鸣例程次数
2090xD1 离线搜索性能   硬盘在内部测试中的寻道性能
2100xD2 写入过程中的振动   在迈拓 6B200M0 200GB 和迈拓 2R015H1 15GB 磁盘中发现。
2110xD3 写入过程中的振动   操作过程中遇到的振动记录
2120xD4 写入过程中的震动   记录写入操作过程中遇到的冲击。
2200xDC 磁盘移位 磁盘相对于主轴位移(通常由于冲击温度)。单位未知。
2210xDD G-Sense 误差率 由于外部冲击和振动导致的错误数量。通常在0xBF处报告。
2220xDE 装载时间   磁头臂数据负载下的运行时间
2230xDF 加载/卸载重试次数   头部改变位置的次数。
2240xE0 负载摩擦 机械零件运行时的摩擦阻力
2250xE1 装载/卸载周期计数 负载周期总计数。 一些硬盘使用193 (0xC1)作为加载循环计数。请参阅193的描述了解该数值的重要性。
2260xE2 加载时间   磁头执行器加载总时间(不包括停放区时间)。
2270xE3 扭矩放大计数 补偿盘片速度变化的尝试次数
2280xE4 断电缩回周期 断电周期次数是指每次发生“收回事件”并且磁头从介质上卸载时(如机器断电进入睡眠闲置时)所记录的次数。
2300xE6 GMR 磁头振幅 磁性 硬盘)、 硬盘寿命保护状态 (固态硬盘)   “抖动”幅度(操作间反复移动头部的动作)。

在固态硬盘中,指示使用情况是否超出预期寿命曲线

2310xE7 生命之左 (固态硬盘) 或 温度   表示剩余的大致SSD寿命,以程序/擦除周期可用的保留块数计算。 100表示新硬盘,10表示需要更换。0可能表示硬盘处于只读模式以便数据恢复。

以前(2010年之前)偶尔用于驱动温度(通常报告为0xC2)。

2320xE8 剩余耐力 或 可用预留空间   SSD已完成物理擦除循环次数设计最大物理擦除循环次数的百分比

英特尔固态硬盘以初始预留空间的百分比报告可用预留空间

2330xE9 介质磨损指示器 (固态硬盘) 或 开机小时数   英特尔固态硬盘的归一化值新硬盘的100开始最低为1。随着NAND擦除周期0增加到最大额定周期该值会逐渐减少

以前(2010年前)偶尔用于电源开启时间(通常在0x09报告)。

2340xEA 平均擦除次数和最大擦除次数   解码为:字节0-1-2 = 平均擦除计数(大端)和字节3-4-5 = 最大擦除计数(大端)
2350xEB 良好区块数和系统(空闲)区块数   解码为:字节0-1-2 = 良好块计数(大端序),字节3-4 = 系统(空闲)块计数。
2400xF0 头顶飞行小时 或 '传输错误率   驱动头定位所花费的时间。 一些富士通驱动器在数据传输期间报告链接重置次数
2410xF1 书写的本地账单总数   写入的 LBA 总数。
2420xF2 读取的 LBA 总数   读取的 LBA 总数。

一些S。M。A。R。T。工具会报告负数的原始值,因为实际上它有48位而不是32位

2430xF3 已编写的 LBA 总数 扩大   设备已写入的总LBA数的前5个字节。后7个字节位于属性0xF1
2440xF4 已扩展读取的 LBA 总数   从设备读取的12字节LBA总数中的前5字节。后7字节值位于属性0xF2
2490xF9 NAND 写入(1GB)   NAND写入量。原始值以1GB为单位报告写入次数
2500xFA 读取错误重试率 读取磁盘时的错误计数
2510xFB 最低剩余备件   剩余最小备用块属性表示剩余备用块可用备用块总数的百分比。
2520xFC 新增不良闪存块   新增的坏块属性表示自制造初始化以来驱动器检测到的坏块总数
2540xFE 自由落体保护 检测到的 "自由落体事件 "次数

 

标准 S。M。A。R。T 属性 - NVMe

NVMe规范定义了不同硬盘制造商统一的S。M。A。R。T。属性

偏移
长度
属性
说明
00x00 1 严重警告 控制器状态的重要警告。

位定义:
位 00,值 1:可用备用件低于临界值。
位 01,值 1:温度超过阈值。
位 02,值 1:驱动器可靠性降低。
位 03,值 1:驱动器处于只读模式。
10x01 2 复合温度 开尔文为单位表示控制器及其命名空间的当前综合温度。
30x03 1 可用备用 可用备用电池的百分比。
40x04 1 可用备用阈值 可用备用阈值的百分比。
50x05 1 使用百分比 硬盘使用寿命的百分比。
70x07 25 保留 -
320x20 16 读取数据单位 主机从控制器读取的512字节数据单元数量。此值不包括元数据。该值以千为单位报告(即,值为1表示写入了1000个512字节的单元)并四舍五入。
480x30 16 写入的数据单位 主机写入控制器的512字节数据单元数量。不包括元数据。此值以千为单位(即,值为1表示写入了1000个512字节单元)并向上取整
640x40 16 主机读取命令 控制器完成的读取命令数量。
800x50 16 主机写入命令 控制器完成的写入命令数量。
960x60 16 控制器忙时 控制器忙于处理 I/O 命令的时间。
1120x70 16 动力循环 电源循环次数。
1280x80 16 开机时间

开机时长,不包括在非工作状态下的开机时间。

1440x90 16 不安全的停机 未接收到关机通知断电时,记录不安全关机次数
1600xA0 16 媒体错误 控制器检测到未恢复的数据完整性错误次数,包括不可纠正的ECCCRC校验和失败LBA标签不匹配
1760xB0 16 错误信息日志条目数 控制器生命周期内的错误信息日志条目数量
1920xC0 4 错误信息日志条目数 控制器生命周期内的错误信息日志条目数量
1760xB0 16 警告 复合温度 时间 -
1960xC4 4 临界复合温度 时间 -
2000xC8 2×8 温度传感器
1-8
-
2160xD8 4×2 热管理 温度 1/2 过渡计数 -
2240xE0 4×2 温度管理总时间 1/2 -
2320xE8 280 保留 -

结论

S.M.A.R.T. 技术对于监测硬盘健康至关重要,能提前预警潜在故障。通过了解和使用 CrystalDiskInfo 等工具,你可以有效管理数据存储,防止数据丢失。无论是 HDD 还是 SSD ,关注 S.M.A.R.T. 属性能避免意外的硬盘故障及其带来的麻烦。此外,使用 都叫兽™备份还原软件 进行系统和数据备份,确保数据始终安全且易于恢复。
都叫兽™ 备份还原-安全高效迁移至SSD

自动4K对齐自动进行4K对齐以提高SSD性能。

支持GPT和MBR 迁移系统时,为SSD自动匹配合适的分区格式。

支持FAT/NTFS可迁移不同的文件系统格式。

备份速度快 可高达3,000MB/分钟的备份速度。

全方位备份方案 支持系统迁移/系统备份/分区备份/硬盘备份/文件备份/磁盘克隆。

自动4K对齐 提高SSD性能

支持GPT和MBR分区格式

支持NTFS和FAT32文件系统

免费试用免费试用已有800位用户免费体验!