Monitorizar y reconstruir un hardware RAID (Linux)
Utilice la función «Imprimir» al final de la página para crear un PDF.
Para Servidor Dedicado y Servidor a precio especial
En este artículo te mostramos cómo comprobar el estado de tu hardware RAID, cómo reconocer un RAID defectuoso y cómo reconstruirlo.
En los servidores raíz de IONOS se utilizan controladores de hardware de 3ware, Areca, Adaptec, Broadcom o Dell.
Identificar el tipo de controlador de hardware
Con el comando lspci puedes comprobar qué controlador de hardware está instalado en tu servidor. Este comando lista todos los dispositivos del bus PCI.
Si estás usando un sistema mínimo, debes instalar este programa manualmente. Para ello, introduce el siguiente comando:
CentOS 7
yum install pciutils
Ubuntu 16.04 y Ubuntu 18.04
sudo apt-get install pciutils
Para comprobar qué controlador de hardware se ha montado en tu servidor, introduce el siguiente comando:
lspci|grep RAID
Ejemplos:
[root@localhost ~]# lspci|grep RAID
01:00.0 RAID bus controller: Adaptec Series 6 - 6G SAS/PCIe 2 (rev 01)
[root@localhost ~]# lspci|grep RAID
02:00.0 RAID bus controller: Broadcom / LSI MegaRAID Tri-Mode SAS3408 (rev 01)
[root@localhost ~]# lspci|grep RAID
01:09.0 RAID bus controller: 3ware Inc 7xxx/8xxx-series PATA/SATA-RAID (rev 01)
[root@localhost ~]# lspci|grep RAID
02:0e.0 RAID bus controller: Areca Technology Corp. ARC-1110 4-Port PCI-X to SATA RAID Controller
Controladores del RAID: programas
Los programas de software que se encargan de la gestión de los controladores del RAID están instalados de manera predeterminada. Si lo necesitas, puedes descargar el software necesario para tu controlador a continuación:
Adaptec:
https://storage.microsemi.com/en-us/downloads/
Broadcom:
https://www.broadcom.com/support/download-search
Dell:
https://www.dell.com/support/home/de-de?app=products
3ware:
Areca:
Mostrar los detalles del controlador de hardware RAID
Adaptec
El controlador de red de Adaptec se gestiona con la herramienta de línea de comandos arcconf. Los siguientes comandos hacen que se muestre infomación detallada acerca del controlador de RAID de Adaptec y de la configuración:
COMANDO | EXPLICACIÓN |
---|---|
arcconf GETCONFIG 1 | Con este comando se muestra información acerca del controlador del RAID, de la configuración, de las matrices del RAID, así como de los discos duros disponibles y su estado actual. |
arcconf getconfig 1 PD | Con este comando se muestra información acerca de los discos duros existentes. |
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] | Con este comando se muestran las entradas de logs. Puedes introducir los siguientes parámetros para especificar el tipo de entradas que se muestran: |
Ejemplo: arcconf getlogs 1 device tabular | DEVICE: Muestra todas las entradas de logs con errores que el controlador ha podido encontrar en los dispositivos vinculados. |
DEAD: Muestra todas las entradas de logs en los que se registró una avería de los dispositivos o discos duros. | |
EVENT: Muestra todas las entradas de logs con información sobre acontecimientos especiales (p.ej. rebuilds, LDMs, etc.) | |
También puedes utilizar los siguientes parámetros: | |
tabular: Muestra el log en formato tabla. | |
clear: Elimina el protocolo del controlador asignado. | |
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] > NOMBRE_DEL_ARCHIVO.log | Con este comando se escriben las entradas de logs en un archivo. |
Ejemplo: arcconf getlogs 1 device tabular > device.log |
Podrás encontrar más información al respecto aquí:
Broadcom
El controlador de RAID de Broadcom se gestiona y controla con la herramienta de línea de comandos StorCLI. Con los siguientes comandos puedes hacer que se muestre información detallada acerca del controlador de RAID Broadcom y de la configuración:
COMANDO | EXPLICACIÓN |
---|---|
storcli64 /c0 show all | Con este comando se muestra información acerca del controlador del RAID y de la configuración. |
storcli64 /c0/eall/sall show | Con este comando se muestra información acerca de los discos duros existentes. |
storcli64 /c0/eALL/sALL show all | Con este comando se muestra información acerca de los discos duros disponibles y su estado acutal (número de serie, temperatura, etc.). |
storcli /cx show eventloginfo | Con este comando se muestran las entradas de logs. |
Podrás encontrar más información al respecto aquí:
Dell
El controlador del RAID de Dell se gestiona con la interfaz de línea de comandos PERCCLI. Con los siguientes comandos puedes hacer que se muestre información detallada acerca del controlador de RAID de Dell y de la configuración:
COMANDO | EXPLICACIÓN |
---|---|
perccli64 /c0/e32/s0 show all | Con este comando se muestra información del disco duro 0. |
perccli64 /c0/e32/s1 show all | Con este comando se muestra información del disco duro 1. |
perccli64 /c0 show | Con este comando se muestra información acerca de los discos duros existentes. |
perccli /c0 show eventloginfo | Con este comando se muestran las entradas de logs para el controlador 0. |
Podrás encontrar más información al respecto aquí:
3ware
Para obtener información sobre el controlador de RAID 3ware, escribe el siguiente comando:
# dmesg|grep 3ware
3ware Storage Controller device driver for Linux v1.26.02.002.
scsi0 : 3ware Storage Controller
3w-xxxx: scsi0: Found a 3ware Storage Controller at 0xd800, IRQ: 18.
scsi 0:0:0:0: Direct-Access 3ware Logical Disk 0 1.2 PQ: 0 ANSI: 0
3ware 9000 Storage Controller device driver for Linux v2.26.02.010.
tw_cli
El controlador del RAID 3ware se gestiona con la interfaz de línea de comandos 3ware Storage Controller Management Command Line Interface. Para abrir la interfaz de línea de comandos, introduce el comando tw_cli. Con el comando help se muestran todos los comandos disponibles. Para salir de la consola, introduce el comando exit.
# tw_cli
//XXX> help
Copyright(c) 2004-2006 Applied Micro Circuits Corporation(AMCC). All rights reserved.
AMCC/3ware CLI (version 2.00.06.007)
Commands Description
-------------------------------------------------------------------
focus Changes from one object to another. For Interactive Mode Only!
show Displays information about controller(s), unit(s) and port(s).
flush Flush write cache data to units in the system.
rescan Rescan all empty ports for new unit(s) and disk(s).
update Update controller firmware from an image file.
commit Commit dirty DCB to storage on controller(s). (Windows only)
/cx Controller specific commands.
/cx/ux Unit specific commands.
/cx/px Port specific commands.
/cx/bbu BBU specific commands. (9000 only)
/ex Enclosure specific commands. (9KSX/SE only)
/ex/slotx Enclosure Slot specific commands.
/ex/fanx Enclosure Fan specific commands.
/ex/tempx Enclosure Temperature Sensor specific commands.
Certain commands are qualified with constraints of controller type/model support.
Please consult the twi_cli documentation for explanation of the controller-qualifiers.
The controller-qualifiers of the Enclosure commands (/ex) also apply to Enclosure
Element specific commands (e.g., /ex/elementx).
Type help <command> to get more details about a particular command.
For more detail information see twi_cli's documentation.
//XXX>
Introduce el siguiente comando para hacer que se muestre información sobre el estado del sistema del RAID:
//XXXX> info
Ctl Model Ports Drives Units NotOpt RRate VRate BBU
------------------------------------------------------------------------
c0 8006-2LP 2 2 1 0 2 - -
//XXXX> info c0
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-1 OK - - - 232.885 ON -
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 4ND0XYFE
p1 OK u0 232.88 GB 488397168 4ND0YH77
Para mostrar las alertas del controlador del hardware RAID, introduce el siguiente comando:
//XXXX> show alarms
Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 - INFO (0x0F:0x0007): Initialization complete: Unit #0
c0 - INFO (0x0F:0x000C): Initialization started: Unit #0
Se mostrará un mensaje de alerta en el siguiente formato:
//XXXX> show alarms
Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 - INFO (0x0F:0x000B): Rebuild started: Unit #0
c0 - ERROR (0x0F:0x0002): Unit degraded: Unit #0
Para eliminar un disco duro defectuoso del RAID del segundo puerto, introduce el siguiente comando:
//XXXX> maint remove c0 p1
Removing port /c0/p1 ... Done.
Después de reemplazar el disco duro defectuoso, el nuevo disco duro debe ser reconocido. Para ello, introduce el siguiente comando:
//XXXX> maint rescan
Rescanning controller /c0 for units and drives ...Done.
Found the following unit(s): [none].
Found the following drive(s): [/c0/p1].
Para montar y reconstruir un disco en el segundo puerto, escribe el siguiente comando:
//XXXX> maint rebuild c0 u0 p1
Sending rebuild start request to /c0/u0 on 1 disk(s) [1] ... Done.
Para ver la información sobre la reconstrucción del RAID, escribe el siguiente comando:
//XXXX> info c0
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-1 REBUILDING 0 - - 232.885 ON -
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 4ND0XYFE
p1 DEGRADED u0 232.88 GB 488397168 4ND0YH77
Monitorizar el controlador del RAID con el software 3ware Disk Manager 2
3ware ofrece un software para monitorizar y gestionar tu controlador del RAID. Puedes descargarte este software aquí:
Guía de uso de 3ware
Si necesitas más información acerca de la instalación, configuración o aplicación de 3ware, consulta su guía de uso:
Areca
Para obtener información sobre el controlador del RAID de Areca, escribe el siguiente comando:
# dmesg|grep -i areca
ARECA RAID ADAPTER0: FIRMWARE VERSION V1.43 2007-4-17
scsi0 : Areca SATA Host Adapter RAID Controller
scsi 0:0:0:0: Direct-Access Areca ARC-1110-VOL#00 R001 PQ: 0 ANSI: 5
scsi 0:0:16:0: Processor Areca RAID controller R001 PQ: 0 ANSI: 0
A continuación se muestran algunos ejemplos de comandos. Puedes acceder al controlador mediante el sistema de rescate (Rescue-System):
arcmsr_cli64
Copyright (c) 2004 Areca, Inc. All Rights Reserved.
Areca CLI, Version: 1.71.240( Linux )
Controllers List
----------------------------------------
Controller#01(PCI): ARC-1110
Current Controller: Controller#01
----------------------------------------
CMD Description
==========================================================
main Show Command Categories.
set General Settings.
rsf RaidSet Functions.
vsf VolumeSet Functions.
disk Physical Drive Functions.
sys System Functions.
net Ethernet Functions.
event Event Functions.
hw Hardware Monitor Information.
exit Exit CLI.
==========================================================
Command Format: <CMD> [Sub-Command] [Parameters].
Note: Use <CMD> -h or -help to get details.
CLI>
Con el comando <cmd> info se puede consultar la información del sistema. El comando hw info hace que se muestre la información del monitor (hardware).
CLI> hw info
The Hardware Monitor Information
===========================================
Fan#1 Speed (RPM) : 2673
HDD #1 Temp. : 48
HDD #2 Temp. : 47
HDD #3 Temp. : 51
HDD #4 Temp. : 0
===========================================
GuiErrMsg<0x00>: Success.
CLI>
Para mostrar información sobre los discos duros, escribe el siguiente comando:
CLI> disk info
# ModelName Serial# FirmRev Capacity State
===============================================================================
1 ST3750640AS 5QD5G7Z1 3.AAK 750.2GB RaidSet Member(1)
2 ST3750640AS 5QD5G6JR 3.AAK 750.2GB RaidSet Member(1)
3 ST3750640AS 5QD5G7XQ 3.AAK 750.2GB RaidSet Member(1)
===============================================================================
GuiErrMsg<0x00>: Success.
CLI>
El siguiente comando proporciona información sobre el propio controlador:
CLI> sys info
The System Information
===========================================
Main Processor : 500MHz
CPU ICache Size : 32KB
CPU DCache Size : 32KB
System Memory : 256MB/333MHz
Firmware Version : V1.43 2007-4-17
BOOT ROM Version : V1.43 2007-4-17
Serial Number : Y813CAAAAR101890
Controller Name : ARC-1110
===========================================
GuiErrMsg<0x00>: Success.
CLI>
Para mostrar los eventos actuales, introduce el siguiente comando:
CLI> event info
Date-Time Device Event Type
===============================================================================
2009-07-09 07:23:14 H/W MONITOR Raid Powered On
2008-09-29 08:06:24 H/W MONITOR Raid Powered On
2008-09-29 07:51:37 H/W MONITOR Raid Powered On
...
Para mostrar información sobre el set de RAID actual (en este ejemplo 3 x 750 GB), introduce el siguiente comando:
CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 123 Normal
===============================================================================
GuiErrMsg<0x00>: Success.
CLI>
Para mostrar información sobre los volúmenes lógicos del RAID, escribe el siguiente comando:
CLI> vsf info
# Name Raid# Level Capacity Ch/Id/Lun State
===============================================================================
1 ARC-1110-VOL#00 1 Raid5 1500.3GB 00/00/00 Normal
===============================================================================
GuiErrMsg<0x00>: Success.
CLI>
Si quieres realizar cambios en el hardware RAID con el controlador del RAID de Areca, necesitas introducir una contraseña. La contraseña predeterminada es "0000". Ejemplo:
<CLI> set password=0000.
Guía de uso de Areca
Si necesitas más información acerca de la instalación, configuración o aplicación de Areca, consulta su guía de uso:
Pasos necesarios después de reemplazar un disco duro
Por regla general, cada vez que se sustituye un disco duro defectuoso, la reconstrucción del sistema de RAID empieza automáticamente. Sin embargo, te recomendamos que supervises esta reconstrucción para garantizar la funcionalidad del sistema de RAID.