HP NC375i Netzwerkadapter: Resetting the device because the device is not responding

Seit mehreren Monaten haben wir Probleme mit sporadischen Netzwerkaussetzern auf zwei HP ProLiant DL580 G7 Servern, in denen jeweils HP NC375i Integrated Quad Port Multifunction Gigabit Server Adapter (NetXen/Qlogic NX3031) verbaut sind.

Das Problem führt jedes Mal zu einem Reset der Netzwerkadapter, infolgedessen der Server für wenige Sekunden vom Netz getrennt wird. Auf einem Cisco Switch sieht das dann wie folgt aus:

20:20:47.368: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/17, changed state to down
20:20:48.374: %LINK-3-UPDOWN: Interface GigabitEthernet0/17, changed state to down
20:20:50.776: %LINK-3-UPDOWN: Interface GigabitEthernet0/17, changed state to up
20:20:51.782: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/17, changed state to up

Auf dem Server wird dabei für jedes betroffene Interface folgende Meldung im Eventlog generiert:

Log Name:      System
Source:        QLNDNIC
Date:          12.04.2012 20:20:37
Event ID:      272
Task Category: None
Level:         Error
Keywords:      Classic
User:          N/A
Description:
DEVICE: HP NC375i Integrated Quad Port Multifunction Gigabit Server Adapter
PROBLEM: Resetting the device because the device is not responding.
ACTION: Adapter recovers from this error automatically.

HP beschreibt das Problem mittlerweile in einem Advisory und hat überarbeitete Firmware- und Treiberversionen bereitgestellt, die das Problem beheben sollen:

    Firmware Version 4.0.556 for the NC375i, NC375T, NC522m, and NC522SFP, Firmware Version 4.8.20 for the NC523SFP, and Firmware Version 4.8.22 for the CN1000Q network adapters are required to prevent the loss and recovery of Ethernet connectivity, or adapter unresponsiveness requiring a reboot to recover, from occurring.

Leider hat das Upgrade der Firmware und Treiber auf 4.0.579 bzw. 4.4.8.812 in unserem Fall nicht geholfen, der Fehler tritt nach wie vor sporadisch auf.

Anscheinend löst die neue Firmware das Problem aber auch gar nicht, sondern reduziert lediglich dessen Häufigkeit. In den Release Notes zu Version 4.0.556 steht nämlich folgendes:

    Modified the NX3031 operating voltage and frequency to reduce the potential for a loss of link or a system hang.

Indirekt bestätigt wird das im Artikel ESX/ESXi 4.1 hosts with NetXen HP NC375T/NC375i lose network connectivity aus der VMware Knowledgebase, in dem auch 4.0.579 als vom Problem betroffene Version beschrieben ist.

Solange der Fehler nicht behoben ist, werden wir die NC375i deaktivieren und stattdessen NC382T Adapter (Broadcom 5709) verwenden. Die haben wir auch in anderen Systemen im Einsatz und funktionieren ohne Probleme.

Auch interessant in diesem Zusammenhang ist der Artikel Identifying and Resolving NetXen nx_nic (Qlogic) NIC Failures von Chris Wahl.

0 Responses to “HP NC375i Netzwerkadapter: Resetting the device because the device is not responding”



  1. Schreibe einen Kommentar

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s





%d Bloggern gefällt das: