Überwachung der Laufwerksintegrität

Die Überwachung der Laufwerksintegrität liefert Informationen über den aktuellen Laufwerksintegritätsstatus sowie eine Vorhersage über diesen. Dadurch können Sie Datenverluste vorab verhindern, die durch einen Laufwerksausfall verursacht werden könnten. Es werden sowohl Laufwerke vom Typ HDD (klassische Festplatten) als auch SSD (Flash-Speicher basierte Laufwerke) unterstützt.

Einschränkungen

  • Die Vorhersage zur Laufwerksintegrität wird nur für Maschinen unterstützt, die unter Windows laufen.
  • Es können nur Laufwerke von physischen Maschinen überwacht werden. Die Laufwerke von virtuellen Maschinen können nicht überwacht werden und werden daher auch nicht in den Laufwerksintegrität-Widgets angezeigt.
  • Bei NVMe-Laufwerken wird die Überwachung der Laufwerksintegrität nur für solche Laufwerke unterstützt, die ihre SMART-Daten über die Windows-API kommunizieren. Bei NVMe-Laufwerken, bei denen die SMART-Daten direkt aus dem Laufwerk ausgelesen werden müssen, wird die Überwachung der Laufwerksintegrität nicht unterstützt.

Die Laufwerksintegrität wird durch folgende Statuszustände dargestellt:

  • OK
    Die Laufwerksintegrität liegt zwischen 70% und 100%.
  • Warnung
    Die Laufwerksintegrität liegt zwischen 30% und 70%.
  • Kritisch
    Die Laufwerksintegrität liegt zwischen 0% und 30%.
  • Laufwerksdaten werden berechnet
    Der aktuelle Laufwerksstatus und die Vorhersage werden ermittelt.

Und so funktioniert es

Der Disk Health Prediction Service verwendet ein auf künstlicher Intelligenz (KI) basierendes Vorhersagemodell.

  1. Der Protection Agent sammelt die SMART-Parameter der Laufwerke und übermittelt diese Daten an den Disk Health Prediction Service:

    • SMART 5 – Reallocated Sectors Count (Anzahl neu zugewiesener Sektoren).
    • SMART 9 – Power-On Hours (Einschaltzeit).
    • SMART 187 – Reported Uncorrectable Errors (Gemeldete unkorrigierbare Fehler).
    • SMART 188 – Command Timeout (Befehls-Timeout, wegen Zeitüberschreitung abgebrochene Befehle).
    • SMART 197 – Current Pending Sector Count (Anzahl derzeit ausstehender Sektoren).
    • SMART 198 – Offline Uncorrectable Sector Count (Anzahl nicht korrigierbarer Sektoren).
    • SMART 200 – Write Error Rate (Fehlerrate beim Schreiben).
  2. Der Disk Health Prediction Service verarbeitet die empfangenen SMART-Parameter, trifft Vorhersagen und stellt dann folgende Laufwerksintegritätsmerkmale bereit:

    • Aktueller Laufwerksintegritätsstatus: OK, Warnung, Kritisch.
    • Vorhersage zur Laufwerksintegrität: negativ, stabil, positiv.
    • Vorhersage-Wahrscheinlichkeit der Laufwerksintegrität in Prozent:

    Der Vorhersagezeitraum beträgt ein Monat.

  3. Der Monitoring Service empfängt diese Merkmale und zeigt die entsprechenden Informationen dann in den Laufwerksintegrität-Widgets der Service-Konsole an.

Laufwerksintegrität-Widgets

Die Ergebnisse der Laufwerksintegritätsüberwachung werden in folgenden Widgets dargestellt, die in der Service-Konsole verfügbar sind.

  • Überblick der Laufwerksintegrität ist ein Treemap-Widget (Kacheldiagramm mit Baumstruktur) mit zwei Detailebenen, zwischen denen umgeschaltet werden kann.

    • Maschinenebene
      Zeigt zusammengefasste Informationen über den Laufwerksintegritätsstatus für die ausgewählten Kundenmaschinen an. Es werden nur die kritischsten Laufwerkstatuszustände angezeigt. Die anderen Statuszustände werden in einem Tooltip angezeigt, wenn Sie mit dem Mauszeiger über einen bestimmten Block fahren. Die Blockgröße der Maschine hängt von der Gesamtgröße aller Laufwerke dieser Maschine ab. Die Blockfarbe der Maschine hängt vom kritischsten Laufwerksstatus ab, der gefunden wurde.

    • Laufwerksebene
      Zeigt den aktuellen Laufwerksintegritätsstatus aller Laufwerke für die ausgewählte Maschine an. Jeder Laufwerksblock zeigt eine der nachfolgenden Vorhersagen zur Laufwerksintegrität sowie die dazugehörige Wahrscheinlichkeit (in Prozent) an:

      • Wird heruntergestuft
      • Wird stabil bleiben
      • Wird verbessert

  • Laufwerksintegritätsstatus ist ein Kreisdiagramm-Widget, welches die Anzahl der Laufwerke für jeden Status anzeigt.

Alarmmeldungen zum Laufwerksintegritätsstatus

Die Laufwerksintegritätsprüfung wird alle 30 Minuten durchgeführt, während die entsprechende Alarmmeldung nur einmal täglich generiert wird. Wenn sich der Laufwerksintegritätsstatus von Warnung zu Kritisch ändert, wird immer ein Alarm generiert.

Alarmbezeichnung Schweregrad Laufwerksintegritätsstatus Beschreibung
Laufwerksausfall ist möglich Warnung (30 – 70) Das Laufwerk <Laufwerksname> auf dieser Maschine wird wahrscheinlich demnächst ausfallen. Sichern Sie das Laufwerk möglichst bald mit einem vollständigen Image-Backup. Bauen Sie dann ein Ersatzlaufwerk ein und stellen Sie das Image auf diesem wieder her.
Laufwerksausfall steht unmittelbar bevor Kritisch (0 – 30) Das Laufwerk <Laufwerksname> auf dieser Maschine befindet sich in einem kritischen Zustand und wird höchstwahrscheinlich sehr bald ausfallen. Es ist nicht empfehlenswert, jetzt noch ein Image-Backup des Laufwerks zu erstellen, da die zusätzliche Belastung zum endgültigen Laufwerksausfall führen könnte. Versuchen Sie, die wichtigsten Dateien auf dem Laufwerk umgehend zu sichern und es dann auszutauschen.