Je décide faire un article sur une erreur NCC qui revient sans cesse sur tous les cluster où je me connecte. Ce test a été introduit avec la version 3.0.1 du NCC et il se peut que vous ayez l’erreur sur votre cluster (notamment si vous avez ajouté des noeuds avec le temps). La KB4254 traite cette erreur sans donner la résolution en disant d’appeler le support. Cependant, il n’y a aucun impact ou reboot à faire donc je vais vous donner la solution et vous faire gagner du temps 🙂
Le check NCC ne passe pas si le MD5 Checksum du fichier /home/ngt/ca.tar sur chaque CVM du cluster est différent. Dans ce cas, si vous migrez vos VM (NGT activées) vers un autre noeud qui a un Checksum différent, alors celles-ci s’arrêteront à cause du checksum du certificat.
L’erreur NCC est la suivante ( Lopez ncc health_checks system_checks ngt_ca_setup_check) :
1 2 3 4 |
Detailed information for ngt_ca_setup_check: Node 11.22.33.44: FAIL: /home/ngt/ca.tar does not have the same checksum on all CVMs. Recheck with: ncc health_checks system_checks ngt_ca_setup_check |
Pour voir le Checksum sur toutes les CVM, entrez la commande ci-dessous. On voit que sur plusieurs CVM, le Checksum est différent ou le fichier n’existe même pas !
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 |
$ allssh 'sudo md5sum /home/ngt/ca.tar' Executing sudo md5sum /home/ngt/ca.tar on the cluster ================== 172.30.76.35 ================= 09f4e3e3af1a88093d80044f7adf6479 /home/ngt/ca.tar Connection to 172.30.76.35 closed. ================== 172.30.76.39 ================= 09f4e3e3af1a88093d80044f7adf6479 /home/ngt/ca.tar Connection to 172.30.76.39 closed. ================== 172.30.76.43 ================= 09f4e3e3af1a88093d80044f7adf6479 /home/ngt/ca.tar Connection to 172.30.76.43 closed. ================== 172.30.76.46 ================= c61ce39a69a7a19bf9f025535c2ce66f /home/ngt/ca.tar Connection to 172.30.76.46 closed. ================== 172.30.76.47 ================= md5sum: /home/ngt/ca.tar: No such file or directory Connection to 172.30.76.47 closed. ================== 172.30.76.49 ================= 3bb60c24f48e72a5d518df1d312494fa /home/ngt/ca.tar Connection to 172.30.76.49 closed. ================== 172.30.76.50 ================= 09f4e3e3af1a88093d80044f7adf6479 /home/ngt/ca.tar Connection to 172.30.76.50 closed. ================== 172.30.76.53 ================= 73f87014b4772a7680e181e91e39f39a /home/ngt/ca.tar Connection to 172.30.76.53 closed. ================== 172.30.76.56 ================= 09f4e3e3af1a88093d80044f7adf6479 /home/ngt/ca.tar Connection to 172.30.76.56 closed. ================== 172.30.76.60 ================= 6772fe03566e4fea5df2dd1c71c33823 /home/ngt/ca.tar Connection to 172.30.76.60 closed. ================== 172.30.76.62 ================= md5sum: /home/ngt/ca.tar: No such file or directory Connection to 172.30.76.62 closed. |
Attention pour la résolution de ce problème, il faut s’assurer qu’il n’y ait pas de NGT activées sur la CVM que vous allez mettre à jour.
On se connecte tout d’abord sur notre CVM de référence (avec le Checksum le plus répandu), on passe en root car le dossier est inaccessible via le compte nutanix.
Ensuite, nous allons copier le fichier “ca.tar” sur toutes les CVM qui posent problème dans le dossier “/tmp”.
1 2 3 4 |
$ ssh nutanix@IP_CVM_reference $ sudo -i $ cd /home/ngt $ scp ca.tar nutanix@IP_CVM_destination:/tmp |
La tâche suivante doit être réalisée sur toutes les CVM impactées :
- On fait un backup du fichier “ca.tar”
- On déplace notre fichier du tmp vers le dossier cible
- On extrait ce fichier (archive)
- On applique les bons droits sur les fichiers
1 2 3 4 5 6 7 8 9 |
$ ssh nutanix@IP_CVM_destination $ sudo -i $ cp /home/ngt/ca.tar /home/ngt/ca.tar_bak $ scp ca.tar nutanix@IP_CVM_destination:/tmp $ mv /tmp/ca.tar /home/ngt/ $ tar -xvpf /home/ngt/ca.tar $ chown ngt:ngt /home/ngt/ca.tar $ chmod 700 /home/ngt/ca $ chown -R ngt:ngt /home/ngt/ca |
Enfin pour vérifier le bon fonctionnement de vos actions, refaites la commande NCC suivante (les Checksum devraient être identique sur toutes les CVM) : ncc health_checks system_checks ngt_ca_setup_check