Archive for the 'HP StorageWorks' Category

P6000/EVA und Insight Remote Support 7.0.5: Service Events werden nicht angezeigt

Vor kurzem musste ich eine EVA 4400 und 6400 auf XCS 11001100 aktualisieren und in diesem Zusammenhang auch Insight Remote Support auf Version 7.0.5 updaten. Kommt es auf der EVA zu einem Fehler, wird die entsprechende Meldung als sogen. Service Event von Insight Remote Support empfangen und automatisch ein Case bei HP geöffnet. Eine praktische Sache.

Bevor das funktioniert, muss die EVA zunächst in Insight Remote Support hinterlegt werden. Die dafür erforderliche Konfiguration ist in der HP Insight Remote Support 7.0.5 Monitored Devices Configuration Guide beschrieben. Nach dem Hinzufügen sollte die EVA wie folgt angezeigt werden:

evas

Um zu testen, ob die Berichterstattung an Insight Remote Support funktioniert, kann via Command View ein sogen. „Remote Service Test“ durchgeführt werden. Der Test erstellt ein Service Event und leitet es via ELMC an Insight Remote Support weiter.

Genau dieser Test wollte bei mir nicht funktionieren, obwohl augenscheinlich alle Voraussetzungen erfüllt waren: Der ELMC 6.4 war genauso installiert wie die SMI-S EVA and SMI-S CIMOM Komponenten bzw. der Dienst „HP StorageWorks CIM Object Manager“.

Das Problem in diesem Fall war, dass der Command View Server selbst keine Garantie mehr hatte und damit als „ineligible for remote Support“ galt. Versteckt ist der Vermerk auf Seite 119 der Monitored Devices Configuration Guide:

    Note: It is possible to monitor EVA devices that are attached to a P6000 Command View server that is ineligible for remote support by manually editing the C:/ProgramData/HP/RS/CONFIG/WEBES/DESTA.REG file. If this file is not edited, Insight RS will not monitor the ineligible server and will therefore not be able to monitor the supported EVA devices attached to the server.

    Open the DESTA.REG file in a text editor and add EvtMonitor.StartWatcher.hostname=t for each ineligible server where hostname is the name seen in the Devices list of the Insight RS Console.

Nach dem Ändern der Datei und einem Neustart des Command View Servers funktionierte das Weiterleiten der Service Events einwandfrei.

Advertisements

HP EVA 4400 Fehler: 0x041F0032 Eva NVRAM Uptime invalid

Letzten Monat waren wir mit dem Problem konfrontiert, dass ein Controller unserer EVA 4400 (XCS 10.000) sekündlich folgende Fehlermeldung protokollierte:

Der Fehler selbst war zwar unkritisch und hatte I/O-technisch keinerlei Auswirkungen, führte aufgrund der schieren Menge an Meldungen aber dazu, dass relevante Informationen aus dem Log förmlich verdrängt wurden.

Darüberhinaus zog die Problematik eine permanent hohe CPU-Auslastung der SAN Management Appliance durch die Postgres Datenbank von WEBES nach sich. WEBES bzw. der dazugehörige System Event Analyzer analysiert die Meldungen und löst entsprechende Aktionen aus (z.B. automatische Eröffnung eines Case bei HP).

Dem Support von HP war der Fehler bis dato nicht bekannt und man riet zunächst zu folgender Vorgehensweise:

    From the description, have You tried a Full Power restart of the affected Controller ?
    Graceful Shutdown Reseat and start ?
    If not try that first

Ein Restart des Controllers ließ sich nicht mehr durchführen – nach dem Ausführen der Aktion in Command View verblieb der Controller im Operational State „Unknown“:

Ein Reseat des Controllers erweckte ihn schließlich wieder zum Leben, brachte aber einen „Soft Diagnostic Failure“ ans Licht. Erst nach einem nochmaligen Reboot (der dann funktionierte) fuhr der Controller fehlerfrei hoch. Exakt dasselbe Phänomen hatten wir mit demselben Controller auch schon beim Upgrade auf XCS 10.000.

Der ursprüngliche Fehler war zwar zunächst verschwunden, trat jedoch einen Tag später wieder auf. HP gab daraufhin grünes Licht zum Austausch des Controllers. Zumindest wollte man dies versuchen, bevor man einen Tausch der eigentlich unter Verdacht stehenden RiserCard des Controller Enclosures durchführt – für den das gesamte System hätte heruntergefahren werden müssen.

Der Tausch des Controllers ist im Dokument HP StorageWorks Controller Enclosure 4Gb Array Controller Replacement Instructions verständlich beschrieben und beschränkt sich im Prinzip auf folgende Schritte:

  1. I/O für den zu tauschenden Controller in Command View anhalten
  2. Kabel beschriften und entfernen
  3. Controller entfernen
  4. Controller öffnen, Speichermodule entnehmen und in neuen Controller einbauen
  5. neuen Controller halb einsetzen, verkabeln und danach einrasten

Sollte der Austauschcontroller mit einer älteren Software kommen, wird die neuere Version vom vorhandenen Controller übernommen. In unserem Fall hat der Vorgang ca. 30 Minuten gedauert und am Ende war zur Beseitigung aller Fehlermeldungen in Command View ein Neustart des Command View Dienstes erforderlich.

Seit dem Tausch des Controllers ist der Fehler mit der falschen NVRAM Uptime nicht mehr aufgetreten.