Bitte oder Registrieren, um Beiträge und Themen zu erstellen.

ZyXEL NAS542 Dauer-resync Raid5 4-Bay

Mein NAS542 fing an, alle paar Tage an zu resyncen. Die NAS-interne Diagnose sagte: "Platten gesund".

Also aufs CLI und smartctl -x /dev/ Platte 1-4 aufgerufen.
Erwischt: /dev/sdd3: Ganz unten steht dann:

Error 1372 [3] occurred at disk power-on lifetime: 13830 hours (576 days + 6 hours)
Error 1371 [2] occurred at disk power-on lifetime: 13830 hours (576 days + 6 hours)
Error 1370 [1] occurred at disk power-on lifetime: 13830 hours (576 days + 6 hours)
Error 1369 [0] occurred at disk power-on lifetime: 13830 hours (576 days + 6 hours)
Error 1368 [23] occurred at disk power-on lifetime: 13830 hours (576 days + 6 hours)
Error 1367 [22] occurred at disk power-on lifetime: 13830 hours (576 days + 6 hours)
Error 1366 [21] occurred at disk power-on lifetime: 13780 hours (574 days + 4 hours)
Error 1365 [20] occurred at disk power-on lifetime: 13780 hours (574 days + 4 hours)

Ach schau mal an, von wegen HEALTH: PASSED

Platte getauscht und schon ist wieder Ruhe.
Bei der Gelegenheit gleich ein kleines Script geschneidert, das mich sofort warnt, wenn das was im Argen ist.

zebolon hat auf diesen Beitrag reagiert.
zebolon
sudo apt autoremove —purge windows -y

Hallo @linuxopa,
möchtest Du Dein Script hier vllt. veröffentlichen?...
Grüße
zebolon

#läuft auf meinem Dektop per cronjob irgendwann nachts, könnte ich mal auf meinen Server verschieben;
#aber da alle Maschinen 24/7 rennen, ist das auch in der Rubrik "wenn ich mal Lust habe."
#geht sicher noch schöner, aber funzt für mich:

sshpass -p 'root-sein-passwort' ssh root@192.168.178.100 \
'for i in sda sdb sdc sdd
do
printf $i" : \n"
smartctl -H /dev/$i|grep -i passed|sed 's:SMART.overall.health.self.assessment.test.result:HEALTH:g'
smartctl -A -d sat /dev/$i>/tmp/nas_dev_$i
grep "^  5" /tmp/nas_dev_$i
grep "^ 10" /tmp/nas_dev_$i
grep "^197" /tmp/nas_dev_$i
grep "^198" /tmp/nas_dev_$i
smartctl -l error /dev/$i|grep -i "logged\|error count"
printf "\n"

smartctl -s on \
-o on \
-S on \
-s apm,off \
-s rcache,on \
-s wcache,on \
-s lookahead,on \
-s wcreorder,on \
-t short \
/dev/$i 1>/dev/null

done' \
|awk {'print $1" "$2" "$10'} >/var/tmp/nas542.log

sshpass -p root-sein-passwort' ssh root@192.168.178.100 \
'for i in sda sdb sdc sdd
do
printf $i" : \n"
smartctl -x /dev/$i|grep -i "error [0-9]"
done' >> /var/tmp/nas542.log

cat /var/tmp/nas542.log|mail -s "Status NAS542" an-meine-mail-adresse@mein-provider.de

#sshpass, weil ssh-copy-id anfangs nicht über den Neustart des NAS gehalten hat (müßte ich mal wieder testen.)
#die smartctl Schalter sind evtl. übertrieben oft geschaltet (jede Nacht), aber wurscht, schadet nicht
#und nach Plattenwechsel ist alles gleich in gegelten Bahnen

#ähnliche Routinen laufen auch auf Desktops und Server.

sudo apt autoremove —purge windows -y