En este artículo, aprenderás cómo identificar un disco duro defectuoso en un Servidor Dedicado Windows con software RAID y cómo preparar un reemplazo de disco duro.

Nota

Para seguir correctamente los pasos descritos en este artículo se necesitan conocimientos básicos de la administración de servidores de Microsoft Windows. Si tienes alguna pregunta o necesita ayuda con respecto a la sustitución de un disco duro defectuoso, ponte en contacto con la Atención al Cliente.

Para asegurar la mayor fiabilidad posible, es necesario que monitorees el software RAID de tu Servidor Dedicado. Si te das cuenta de que un disco duro está defectuoso o recibes una notificación por correo electrónico sobre un disco duro defectuoso, debes ponerte en contacto con el servicio de atención al cliente para proeceder con la sustitución del disco duro. Esto requiere que antes identifiques el disco duro defectuoso y prepares el servidor para reemplazarlo.

Atención

Los sistemas RAID ofrecen una mayor fiabilidad y/o una mayor velocidad. Sin embargo, no pueden sustituir la realización de copias de seguridad regulares. Para evitar la pérdida de datos, te recomendamos que realices copias de seguridad de tus datos con regularidad. Asegúratede realizar una copia de seguridad de tus datos antes de realizar los siguientes pasos para garantizar la seguridad de tus datos.

Identificar fallos y determinar los datos necesarios para la sustitución del disco duro

Para detectar errores en el disco duro, te recomendamos que procedas de la siguiente manera:

Instala el programa Smartctl, un programa de línea de comandos para monitorear volúmenes utilizando SMART (Self-Monitoring, Analysis and Reporting Technology). Con este programa puedes comprobar si un disco duro está defectuoso.

Nota

En algunos casos puede ocurrir que un defecto del disco duro no pueda ser detectado por los valores SMART. Por lo tanto, recomendamos que también analices los archivos log del servidor.

Instalar Smartctl

En el siguiente enlace encontrarás las instrucciones para instalar Smartctl:

https://www.smartmontools.org/wiki/Download#InstalltheWindowspackage

 

Visualización de la información del disco duro

Smartctl funciona igual bajo Windows que bajo Linux. Por esta razón, puedes utilizar los mismos comandos. Para utilizar Smartctl para la resolución de problemas, debes abrir la línea de comandos y cambiar al directorio donde se encuentran los Smartmontools. A continuación, puedes introducir los comandos de Linux que se enumeran a continuación para ver información detallada para la resolución de problemas.

Para ver una lista de discos duros, escribe el siguiente comando:

smartctl --scan

Ejemplo:

C:\Program Files\smartmontools\bin>smartctl --scan

/dev/sda -d sat # /dev/sda [SAT], ATA device
/dev/sdb -d sat # /dev/sdb [SAT], ATA device
/dev/csmi0,2 -d ata # /dev/csmi0,2, ATA device
/dev/csmi0,3 -d ata # /dev/csmi0,3, ATA device

Para ver información detallada para la resolución de problemas, escribe el siguiente comando:

smartctl -iHAl error [NOMBREDELDISCODURO]

Ejemplo:

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

Nota

Ten en cuenta que las interfaces de los dispositivos deben especificarse en el siguiente formato:

Dispositivos SCSI / SATA:

smartctl - iHAl error /dev/sd[a-z]

Ejemplo:

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

Después de introducir el comando, se muestra, por ejemplo, la siguiente información:

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

smartctl 7.0 2018-12-30 r4883 [x86_64-w64-mingw32-2016] (sf-7.0-1)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG   VALUE WORST THRESH TYPE     UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f 200   200   051    Pre-fail Always      -       0
  3 Spin_Up_Time            0x0027 141   140   021    Pre-fail Always      -       3933
  4 Start_Stop_Count        0x0032 100   100   000    Old_age  Always      -       15
  5 Reallocated_Sector_Ct   0x0033 200   200   140    Pre-fail Always      -       0
  7 Seek_Error_Rate         0x002e 200   200   000    Old_age  Always      -       0
  9 Power_On_Hours          0x0032 100   100   000    Old_age  Always      -       34
 10 Spin_Retry_Count        0x0032 100   253   000    Old_age  Always      -       0
 11 Calibration_Retry_Count 0x0032 100   253   000    Old_age  Always      -       0
 12 Power_Cycle_Count       0x0032 100   100   000    Old_age  Always      -       10
 16 Gas_Gauge               0x0022 000   200   000    Old_age  Always      -       1822115874
183 Runtime_Bad_Block       0x0032 100   100   000    Old_age  Always      -       0
192 Power-Off_Retract_Count 0x0032 200   200   000    Old_age  Always      -       6
193 Load_Cycle_Count        0x0032 200   200   000    Old_age  Always      -       9
194 Temperature_Celsius     0x0022 113   109   000    Old_age  Always      -       30
196 Reallocated_Event_Count 0x0032 200   200   000    Old_age  Always      -       0
197 Current_Pending_Sector  0x0032 200   200   000    Old_age  Always      -       0
198 Offline_Uncorrectable   0x0030 100   253   000    Old_age  Offline     -       0
199 UDMA_CRC_Error_Count    0x0032 200   200   000    Old_age  Always      -       0
200 Multi_Zone_Error_Rate   0x0008 100   253   000    Old_age  Offline     -       0

SMART Error Log Version: 1
No Errors Logged

Interpretar los parámetros e identificar los fallos

Analiza la información detallada que recibiste utilizando el comando smartctl -iHAl error[NOMBREDELDISCODURO]. La primera sección enumera la información para identificar el disco duro:

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Esta sección muestra, entre otras cosas, el modelo del dispositivo y el número de serie del disco duro que se está probando.

En la segunda sección se evalúa el estado actual del disco duro mediante Smartctl. Si, por ejemplo, en lugar de "PASSED" aparece el valor "Failed" o "UNKNOWN", deberás sustituir el disco duro lo antes posible.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

En la tercera sección, se enumeran en detalle los valores SMART. Junto a cada valor porcentual actual (VALUE), se listan el peor valor medido (WORST)y el correspondiente valor límite (THRESH). Si el valor porcentual actual (VALUE) o el peor valor medido (WORST) supera el valor límite (THRESH), aparece una advertencia SMART en la columna WHEN_FAILED (p. ej. FAILING_NOW).

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED     WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always      0
  3 Spin_Up_Time            0x0027   183   183   021    Pre-fail  Always      3833
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always      9
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always      0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always      0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always      2560
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always      0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always      0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always      9
 16 Unknown_Attribute       0x0022   000   200   000    Old_age   Always      26802171994
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always      0
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always      4
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always      67
194 Temperature_Celsius     0x0022   116   111   000    Old_age   Always      31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always      0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always      0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline     0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always      0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline     0

Los siguientes parámetros pueden indicar un fallo inminente del disco duro antes de que se muestre una advertencia SMART:

Reallocated_Sector_Ct: especifica el número de sectores reasignados debido a errores de lectura. Si un sector ya no se puede leer, escribir o verificar correctamente, se le asigna automáticamente un sector de reemplazo. El sector defectuoso se marca permanentemente como ilegible. Esta es una clara señal de advertencia para problemas incipientes en la superficie. Si este valor no es igual a cero, un fallo del disco duro es a menudo inminente. Este valor es el indicador más importante para el reemplazo de un disco duro.

Current_Pending_Sector_Ct: especifica el número de sectores inestables que esperan una redistribución. Si un sector no se puede leer y escribir correctamente, recibe primero el status Sector pendiente actual. El sector no se reasigna en este estado, ya que se desconocen los datos del sector. Sólo después de varios intentos fallidos de lectura o escritura se asigna un sector de reemplazo y el sector defectuoso se marca permanentemente como ilegible. El valor Current_Pending_Sector_Ct es un indicador importante para la sustitución de un disco duro. Si este valor no es igual a cero, un fallo del disco duro es a menudo inminente.

Offline_Uncorrectable: especifica el número de errores de escritura y lectura no corregibles.

La última sección trata del registro interno del disco duro. Los errores se registran aquí si las órdenes de trabajo del servidor no han sido procesadas correctamente por el disco duro. Si el número de errores en esta sección es de al menos dos dígitos, debes reemplazar el disco duro lo antes posible.

SMART Error Log Version: 1
No Errors Logged

Acceder a información detallada para la sustitución del disco

La siguiente información es necesaria para reemplazar el disco duro defectuoso:

  • Designación del disco duro en el RAID (por ejemplo, sda)

  • Número de serie

  • Modelo

  • Archivo log/archivo de registro (opcional)

Crear un SMART log

Para crear un SMART log completo, escribe el siguiente comando:

smartctl -x[NOMBREDELDISCODURO]

Ejemplo:

C:\Program Files\smartmontools\bin>smartctl -x /dev/sda -x 

Notas
  • Si el SMART log se ha creado como se ha descrito anteriormente, dispones de suficiente información. A continuación, podrás proceder con la sustitución el disco duro defectuoso. Ponte en contacto con la Atención al Cliente.

  • Si no puedes acceder al número de serie del disco duro defectuoso utilizando Smartctl, puedes proporcionar al servicio de atención al cliente el número de serie de los discos duros en funcionamiento.

Proceder con la sustitución del disco duro

Ahora, el disco duro defectuoso puede ser reemplazado. Para ello, ponte en contacto con la Atención al Cliente.

Después de reemplazar la unidad de disco duro

Después de reemplazar el disco duro defectuoso, es necesario reconstruir el software RAID. Para obtener más información sobre cómo reconstruir un software RAID, haz clic aquí:

Reconstruir el software RAID (Windows)