HArdware Watchdog, Bei Systemabsturz automatischer reset

Florianfranke

Neuer User
Mitglied seit
6 Dez 2005
Beiträge
179
Punkte für Reaktionen
0
Punkte
16
@Florianfranke

Nur wer drückt dann Reset, wenn die anlage in einem anderen Stockwerk steht!!!

Der, der fragt? ;)

Wenn der Rechner abstützt, dann währe es intelligenter
nach den Ursachen zu suchen und nicht die Symptome
zu behandeln.

Ein Hardware Watchdog macht dies automatisch, die frage ist nur welche ist am besten???

Alle haben die gleiche Funktionalität, der biligste
reicht aus. Es gibt da auch eine möglichkeit mit
dem NMI-Watchdog:
Kernel-Parameter auf: nmi_watchdog=1
dann noch die /proc/sys/kernel/panic* Werte setzen.
Dann gibt es noch die HW-Watchdogs in den Boards,
wenn sie geschaltet sind, dann braucht man ein
Modul zu laden wie etwa den iTCO_wdt oder w8387f_wdt usw.
Und den entsprechenden Daemon zu starten.

Kost nix und tuts auch.

Gruß
britzelfix
 
Ok du hast recht man sollt immer nanach schauen warum es abstürzt,
ich hab das problemm das bei mir ab und zu einfach die netzwerkverbindung abstürzt und wenn ich ein Monitor anschlies läuft noch alles!!!

An was kann das nur liegen!!!
Verwende eine 3com netzwerkkarte
 
Also ich gehe mal zu dem ursprünglichen Thread zurück udn versuche Dir meine Lösung (hatte diese Frage auch schonmal in exakt dieser Unterrubrik gestellt) aufzuzeigen :

Ich habe nur auf Nummer sich gehen wollen - so sicher das ich auch mal in den Urlaub fahren kann und mir nie sorgen machen muss wenn was den Bach runter geht...daher habe ich folgendes Szenario erstellt :

Software Watchdog (per debian mit "watchdog" zu installieren)
- watchdog.conf editieren, ich habe dort asterisk als prozess sowie misdn hinterlegt.
- watchdog wird beim booten als letztes gestartet, und bei jedem restart von asterisk wird er vorher gestoppt und danach wieder gestartet.

Somit habe ich hier einen recht zuverlässigen Schutz gegen Asterisk oder mISDN Ausfall, was allerdings nicht ausschliesst das der Fehler auch nach einem Reboot wieder auftritt und die Anlage somit dauernd runter und wieder hochfährt ... :noidea:


Hardware Watchdog von Quancom verbaut, dieser muss von einem Treiber angeschubst werden, das eigentliche "Programm" zur Überwachung wird in Quancom´s eigener Library geschrieben, der QLIB.

Ich habe ihn zum Glück bis dato noch nie wirklich gebraucht und mich hat es hocherfreut zu lesen das er eigentlich nur für Windows Systeme gebraucht wird (ich denke Windows sollte sowas serienmässig mitliefern, so oft wie da was in die Hose geht ;) ) - was aber das besorgen des passenden Treibers für Debian zu einer Geduldsprobe gemacht hat, der erste funktionierende Treiber hat mich im April diesen Jahres erreicht, den Wdog hatte ich im August letzten Jahres gekauft.....

Wenn Du mal was hast so ist der Support gut und nett, nur ist alles was Linux betrifft für die Herren ein böhmisches Dorf und muss extern abgewickelt werden.

Soweit, wenn Du Fragen hast, schiess los.

Grüsse, Stefan
 
somit dauernd runter und wieder hochfährt ...

Des Pudels Kern.

Also ich würde erstmal versuchen herauszufinden
warum die Kiste abstürzt. Eher eine andere 3com
für 1 ¤ bei eBay kaufen, als eine Quancom für 101,55 ¤.
Vielleicht ist der Rechner einfach nicht richtig geerdet.

Gruß
britzelfix
 
@britzelfix

Natürlich hast Du Recht, der Sinn eines Hw-Wdog ist ja auch nicht instabile Systeme noch etwas instabiler zu machen, sondern stabile noch etwas stabiler und ausfallsicherer.

Ich denke da sind wir einer Meinung.

@florian

HAst Du mal step-by-step alles gechecked - Netzwerkkabel geprüft, Stecker usw.

Ist das ganze reproduzierbar ? Was sagt syslog, dmesg oder messages ?

Grüsse, Stefan
 
@HobbyStern

instabile Systeme noch etwas instabiler zu machen, sondern stabile noch etwas stabiler und ausfallsicherer.

wobei die instabilen mit "W" anfangen und die
stabilen mit "L", meintest Du das? :)

Gruß
britzelfix
 
Es war einer meiner Gedanken, ja. ;)

Aber : :-Ö

Grüsse, Stefan
 
Ok gut vielen Dank für eure ersten antwortn, es gibt viele lösungen jetzt aber ich denk das der HW Watchdog dann doch eine gute lösungs ist für fehler die es noch nicht gibt weil wir wissen ja nicht ob die kiste morgen abstürzt oder nicht und dafür kommt dann der Watchdog, für mein Problem das die Lan verbindung immer abstürzt das ist bekannt und muss dann demensprechend beahndelt werden.

Eine Frage was bedeutet das
Vielleicht ist der Rechner einfach nicht richtig geerdet.

Muss ich da was beachtet, hab ich noch nie gemacht.
Und ich habe eine komplett neue 3com karte verwendet und es ist trotzdem abgestürzt.
Ich teste momentan die onboard karte aus wobei ich nicht so ein freund von onboard sachen bin.

Aber wie gesagt der HW Watchdog ist gut wenn man mal nicht am server ist und des ding einfach abstürzt, dann kommen auch keine nerfigen Anrufe vorallem wenn man im Urlaub ist.

PS: ich habe schon mal eine PCI karte gesehen (ist schon lange her) ist vieleicht kein Watchdog aber eine art VGA, LAN karte die so ähnlich wie ein VNC server funktioniert, sie überträgt das bild ins LAN man kann z.B. auch dann damit das Bios remoten oder bei Blusscrenn wird dann noch alles übertragen. Ich denk damit läst sich dann auch viel mit anfangen.
 
Zuletzt bearbeitet:
@Florianfranke

für mein Problem das die Lan verbindung immer abstürzt das ist bekannt

Wenn nur das LAN nicht geht, dann wird ein watchdog auch
nicht funktionieren. Der funktioniert IIRC nur, wenn das System
komplett stillsteht.

Eine Frage was bedeutet das
Vielleicht ist der Rechner einfach nicht richtig geerdet.

Das bedeutet, das man den Rechner an eine VDE-Steckdose
mit Erdung anschließt. Ich hoffe Du lernst mal wie man quotet.

Und ich habe eine komplett neue 3com karte verwendet und es ist trotzdem abgestürzt.

Komplett abgestürtzt, oder nur die Netzwerk-Verbindung?
Wenn nur die Netzwerkverbindung, dann kann man mit
dmesg nachschauen wo der Crash passiert ist. ggf. einen
anderen Kernel verwenden.

ich habe schon mal eine PCI karte gesehen

Ja, ich auch. :)

Spaß beiseite. Wenn der Rechner noch läuft, nur
das Netz weg ist, dann tut es auch ein einfaches
Script:

Code:
#!/bin/sh
# simple net-watchdog (nwdog.sh)
# by britzelfix
# vim: ts=4

GW=192.168.1.1
IVL=10
TO=30

PATH=/bin:/sbin:/usr/bin:/usr/sbin

while :; do

        if ! ping -c1 -w3 ${GW} >/dev/null 2>&1; then
                let c=$c+1
        else
                let c=0
        fi

        if [ $c -gt ${TO} ]; then
                        reboot
        fi

        sleep 10;

done

Gruß
britzelfix
 
@Britzelfix

Wenn nur das LAN nicht geht, dann wird ein watchdog auch
nicht funktionieren. Der funktioniert IIRC nur, wenn das System
komplett stillsteht.

Jein, wenn man nun von dem HWDog von Quancom ausgeht ist die Sache so nicht richtig.

Du kannst Dir selber zusammenschreiben was Du benötigst, eben durch die o.g. QLib, Du kannst auch prüfen ob die Devices so laufen wie sie sollen oder auch nur einen Reparaturlauf starten anstatt ganz zu resetten, das ist schon sehr gut gelöst und auch nichts für "mal eben", nur hilft es wie Du schon richtig schreibst, auch nichts wenn die Hardware einfach nur billiger Mist ist und am Rechner rumgeprutscht wird. (ich schreib` jetzt besser nichts mehr ;) )

@florianfranke

dann kann man mit dmesg nachschauen

Das sollte generell mal passieren - ein wenig mehr Info tut mehr als Not wenn man Hilfe benötigt.

Meine Meinung ist das Du eher weniger den HWDog brauchst, sondern eher ein verstandenes und stabiles System, in welchem Du erst mit kleineren Sicherungen anfängst (siehe Skript von Britzelfix) oder einem SW-Watchdog, aber auch diese beheben das Problem in den meisten Fällen (je nachdem wie man es angeht) nur durch einen Reboot...wie dem auch sei, sollte sich dann wirklich herausstellen das die Kiste sauber läuft und alles in trockenen Tüchern ist, kann man auch über den Hwdog nachdenken.

eine art VGA, LAN karte die so ähnlich wie ein VNC server funktioniert, sie überträgt das bild ins LAN man kann z.B. auch dann damit das Bios remoten oder bei Blusscrenn wird dann noch alles übertragen

Da muss ich nun passen, aber was Du hierfür nutzen kannst ist ein serielles Terminal, ggf. existiert bei euch noch ein Server, so kann man diese mit zusammenstecken und hat somit - auch bei einem GAU - noch Zugriff.

EDIT : Ich habe mal aus Interesse nach Deiner Karte gesucht, ein Beispiel ist "Eric", das Ding kann anscheinend alles das was o.g. Lösung auch kann, nur kann es das ganze noch in "Web" und hat einen eigenes OS an Board - achja - und Eric kostet rund 850¤ mehr als das Kabel das Du für o.g. Lösung benötigst ;) Aber ansonsten eine schöne Lösung für Computer mit dem W-Betriebssystem.
EDIT2 : Was noch Sinn machen würde , wäre bei Ebay nachzusehen, hier ist eben solches Kartenungetüm von Compaq für 18,- (ISA!!)

Grüsse, Stefan
 
Zuletzt bearbeitet:
allnet ALL3090
das ist ein reset switch ein seperates Gerät mit seperatem Netzwerk anschluss mann kann 10 PC anschliesen also 2 Kabel für reset und über ein Webinterface kann man denn PC Reseten, man muss also nicht mehr vor ort sein!!!

Hab mir ein gekauft, ist ne gute lösung für Admins die auch mal unterwegs sind.
 
Holen Sie sich 3CX - völlig kostenlos!
Verbinden Sie Ihr Team und Ihre Kunden Telefonie Livechat Videokonferenzen

Gehostet oder selbst-verwaltet. Für bis zu 10 Nutzer dauerhaft kostenlos. Keine Kreditkartendetails erforderlich. Ohne Risiko testen.

3CX
Für diese E-Mail-Adresse besteht bereits ein 3CX-Konto. Sie werden zum Kundenportal weitergeleitet, wo Sie sich anmelden oder Ihr Passwort zurücksetzen können, falls Sie dieses vergessen haben.