Table des matières

RAID 1 logiciel : Simuler une panne de disque et rétablir le RAID

Pré-requis

Première étape

  1. Affichez les noms des partitions disponibles :

    ...@...:~$ sudo cat /proc/mdstat 
    Personalities : [raid1] 
    md0 : active raid1 sda1[0] sdb1[1]
          117153216 blocks super 1.2 [2/2] [UU]
          bitmap: 0/1 pages [0KB], 65536KB chunk
    
    unused devices: <none>

    → Nous avons une grappe RAID /dev/md0 (/dev/sda1 et /dev/sdb1)

Autres étapes

  1. Simulez la défaillance du disque sda en mettant en fail la partition sda1 :

    ...@...:~$ sudo mdadm --manage /dev/md0 --fail /dev/sda1
    mdadm: set /dev/sda1 faulty in /dev/md0

    Résultat :

    ...@...:~$ sudo cat /proc/mdstat
    Personalities : [raid1] 
    md0 : active raid1 sda1[0](F) sdb1[1]
          117153216 blocks super 1.2 [2/1] [_U]
          bitmap: 0/1 pages [0KB], 65536KB chunk
    
    unused devices: <none>

    → la partition sda1 est montrée comme « F » (Faulty). Pour plus de détails :

    ...@...:~$ sudo mdadm -D /dev/md0
    /dev/md0:
               Version : 1.2
         Creation Time : Thu Oct 15 09:17:35 2020
            Raid Level : raid1
            Array Size : 117153216 (111.73 GiB 119.96 GB)
         Used Dev Size : 117153216 (111.73 GiB 119.96 GB)
          Raid Devices : 2
         Total Devices : 2
           Persistence : Superblock is persistent
    
         Intent Bitmap : Internal
    
           Update Time : Mon Oct 19 09:38:09 2020
                 State : clean, degraded 
        Active Devices : 1
       Working Devices : 1
        Failed Devices : 1
         Spare Devices : 0
    
    Consistency Policy : bitmap
    
                  Name : framboise4:0  (local to host framboise4)
                  UUID : f88601ca:d0e78820:c242a066:82223b32
                Events : 1261
    
        Number   Major   Minor   RaidDevice State
           -       0        0        0      removed
           1       8       17        1      active sync   /dev/sdb1
    
           0       8        1        -      faulty   /dev/sda1

  2. Vérifiez vos e-mails, vous avez du recevoir un e-mail de ce type :
    Sujet : DegradedArray event on /dev/md0:framboise4
    De : mdadm monitoring <root>
    Date : 19/10/2020 à 09:50
    Pour : votre_adresse@mail.tld
    This is an automatically generated mail message from mdadm
    running on framboise4
    A DegradedArray event had been detected on md device /dev/md0.
    Faithfully yours, etc.
    P.S. The /proc/mdstat file currently contains the following:
    Personalities : [raid1]
    md0 : active raid1 sda1[0](F) sdb1[1]
    117153216 blocks super 1.2 [2/1] [_U]
    bitmap: 0/1 pages [0KB], 65536KB chunk
    unused devices: <none>

    Le RAID étant dégradé, nous allons voir comment le rétablir pour ne plus recevoir de mails.
    Pour cela, il faut retirer complètement /dev/sda1 du RAID et le rajouter.

  3. Retirez du RAID le disque marqué comme faulty :

    ...@...:~$ sudo mdadm --manage /dev/md0 --remove /dev/sda1
    mdadm: hot removed /dev/sda1 from /dev/md0

  4. Résultat :

    ...@...:~$ sudo mdadm -D /dev/md0
    /dev/md0:
               Version : 1.2
         Creation Time : Thu Oct 15 09:17:35 2020
            Raid Level : raid1
            Array Size : 117153216 (111.73 GiB 119.96 GB)
         Used Dev Size : 117153216 (111.73 GiB 119.96 GB)
          Raid Devices : 2
         Total Devices : 1
           Persistence : Superblock is persistent
    
         Intent Bitmap : Internal
    
           Update Time : Mon Oct 19 10:52:10 2020
                 State : clean, degraded 
        Active Devices : 1
       Working Devices : 1
        Failed Devices : 0
         Spare Devices : 0
    
    Consistency Policy : bitmap
    
                  Name : framboise4:0  (local to host framboise4)
                  UUID : f88601ca:d0e78820:c242a066:82223b32
                Events : 1262
    
        Number   Major   Minor   RaidDevice State
           -       0        0        0      removed
           1       8       17        1      active sync   /dev/sdb1

    Le RAID est toujours dégradé mais actif sur un seul disque.

  5. c'est ici qu'on changerait le disque dans la réalité
    • Arrêtez la machine
    • Changez le disque physique
    • Rallumez la machine et partitionnez le nouveau disque à l'identique (attention à ne pas vous tromper de partitions ! on copie le disque sain vers l'autre) :

      ...@...:~$ sudo sfdisk -d /dev/sdb | sudo sfdisk /dev/sda

  6. Rajoutez la (nouvelle) partition de sda1 dans le RAID :

    ...@...:~$ sudo mdadm --manage /dev/md0 --add /dev/sda1
    mdadm: re-added /dev/sda1

  7. Le RAID se resynchronise :

    ...@...:~$ cat /proc/mdstat
    Personalities : [raid1] 
    md0 : active raid1 sda1[0] sdb1[1]
          117153216 blocks super 1.2 [2/2] [UU]
          bitmap: 0/1 pages [0KB], 65536KB chunk
    
    unused devices: <none>

Conclusion

Problèmes connus

Voir aussi


Basé sur « Article » par Auteur.