Asterisk Ausfall "chan_sip.so" geladen aber nicht ansprechbar

HobbyStern

Aktives Mitglied
Mitglied seit
5 Dez 2005
Beiträge
1,844
Punkte für Reaktionen
0
Punkte
36
EDIT : Titeländerung !

ALT : Asterisk Ausfall durch HD-Fehler -> Vorsorge machbar ?
NEU : Asterisk Ausfall "chan_sip.so" geladen aber nicht ansprechbar

*** Das Problem konnte ich nun zum ersten Male reproduzieren -- KEIN HD FEHLER ! ***

Hallo Alle, wer mag - ich packe mal die ganze Story mit rein,

ich habe am letzten Freitag etwas seltsames mit meinem TKSystem (s.Signatur) erlebt.

Vorgefunden habe ich das ganze recht früh morgens (also noch ausserhalb der Geschäftszeiten) - mir fiel nur auf das ein SNOM an der Zentrale keinen "namen" hatte, wenn unser Putz-Trupp da war kam es schon öfter vor das die Damen einen Stecker "abwischten" oder irgend etwas anderes zauberten, ein ReRegister des Apparates und Stecker prüfen half allerdings auch nicht weiter, ein Amt war ebenfalls nicht zu bekommen.

Ein Blick auf die Konsole des Asterisks selber wies sich als ebenso merkwürdig auf, alles funktionierte, ein "sip show peers" gab mir allerdings nur nicht vorhandene Klienten zurück, ein "sip reload" wurde schlichtweg nicht ausgeführt, meine ZAP&ISDN-Channels waren einwandfrei anzusprechen und bekamen ein Freizeichen.

Nach einigem schauen, habe ich das System einfach mal durchgestartet um der Sache näher auf den Grund zu gehen, Asterisk startete, ein Zugriff auf die Konsole war machbar, jedoch fehlten "einige" Befehle, so ziemlich ab dem Buchstaben "f" (ca.) war alles an Befehlen weg, so auch sip, shutdown, stop usw usf

Den Asterisk zu beenden war nur noch mit einem KILL machbar (vor dem Neustart waren alle diese Befehle noch vorhanden), die Module waren ebenfalls vorhanden, Syslog spuckte recht spärlich einen "HD-Error on.." aus
die Asterisk-Logs gaben rein gar nichts aus (bis auf einen fehlerhaften DNS-Lookup), nach einem Festplattencheck wurden mir einige verlorenene Dateien gelogged und der Zustand blieb derselbe, mISDN,Zap&Asterisk neu kompiliert und dann war alles wieder in Ordnung.

Was war passiert ?

Es sieht so aus als wäre im laufenden Betrieb chan_sip.so korrumpiert worden, weshalb ich den * wenigstens optisch funktional vorgefunden habe, durch die nicht funktionierende (aber vorhandende) chan_sip.so wurden auch die restlichen Module nicht mehr geladen, ein neu erstellen der Datei(en) hat der Sache ein Ende gemacht.

Vorsorge ?

Ich habe e2tunefs genutzt um die Prüfung der Festplatten etwas öfter zu fahren, bisher wurde diese alle 2 Monate automatisch gefahren (per cron runter und beim starten einen zwangscheck).

Aber wie kann man sich gegen solch ein seltsames Szenario schützen?
Asterisk fiel ja nun nicht aus...?!

Grüsse, Stefan
 
Zuletzt bearbeitet:
ein Software-Raid1 sollte helfen, denn wenn das Logfile schon HD-Error ausgibt würde auch - so sollte es jedenfalls ein - die entsprechende HDD aus dem Raid-Verbund entlassen und nur noch eine läuft weiter.
 
etunefs prüft nur das Filesystem, um Festplattenprobleme frühzeitig zu erkennen empfehlen sich die smartmontools.
 
Das ganze System basiert auf einem mdadm Software-Raid1 :) SMART zu kontrollieren wäre eine Richtung...
 
HobbyStern schrieb:
Das ganze System basiert auf einem mdadm Software-Raid1 :) SMART zu kontrollieren wäre eine Richtung...

Da hat das Software-RAID dann aber scheiße gebaut.
 
Mein Problem ist der Mangel an LOGfiles und somit die Erklärung des Ursprungs...
 
Ich antworte mir mal selber, die SMART Montools sind jetzt installiert und schicken eine Mail wenn sich an der healthy was ändert, danke für den denkanschupser, daß das raid diesen fehler nicht abgefangen hat ... mhmm ... wieso kann dem so sein ?

Grüsse, Stefan
 
HobbyStern schrieb:
Ich antworte mir mal selber, die SMART Montools sind jetzt installiert und schicken eine Mail wenn sich an der healthy was ändert, danke für den denkanschupser, daß das raid diesen fehler nicht abgefangen hat ... mhmm ... wieso kann dem so sein ?
Die smartmontools können übrigens auch regelmäßig die Plattenselbsttests anstossen. Je nach Umgebung ist auch die Temperaturüberwachung interessant.

RAID stellt nur sicher, daß die Daten, die zur Platte geschickt werden redundant gespeichert werden. Falls die Daten schon vor dem Schreiben verhunzt werden hilft das Raid garnicht. Ist vielleicht das RAM kaputt? Wenn einer der I/O-Buffer unglücklich auf einer defekten Speicherstelle liegt könnte das zu fehlerhaften Daten auf der Platte führen. Szenarien mit eingeschalteten Platten-Schreibcache und Spannungsschwankungen kann man bei dir wohl ausschliessen.
 
Ich kann das ganze leider nur mit einem "?" versehen - die smartmontools habe ich mit einem, ausgiebigen, automatischen Test am WE versehen, ein kurzer Test gestern Nacht brachte den Status CLEAN für alle Festplatten .. seltsam seltsam.

Ich werd das ganze mal beobachten...und bedanke mich soweit bei euch! Es sind die kleinen Dinge die man als unwichtig erachtet - aus denen man später lernt..

p.s. die Temperaturüberwachung ist für mich imho nicht relevant, Keller- bzw. Elektrik- und Elektronikraum, kühl&trocken.

Grüsse, Stefan
 
Nochmals ein Nachtrag - mittlerweile sind alle Tests mit smartd sauber durchgelaufen und auch sauber per cron verankert, alles fehlerfrei ...

I.d.S. nochmals Danke !

Stefan
 
NEU ! "Asterisk Ausfall "chan_sip.so" geladen aber nicht ansprechbar"

Ein zweiter Start im gleichen Thread, das Problem besteht noch, gestern zum ersten Mal seit diesem Threadstart (also sehr selten), jedoch war ich damals auf dem Holzweg, die HDD ist einwandfrei ok, das bestätigen mir alle Tools, es scheint folgendes zu passieren und passiert zu sein :

Mein DD_WRT schiesst sich ab --> die Router- und GUI Funktion fällt nach einer "Lebenserhaltung, "per Cron um 01.30 jd. Nacht neu starten" aus, Switching-Funktionalität besteht weiter.

Asterisk versucht nun weiter dyndns usw. zu updaten und scheint sich dabei die chan_sip.so abzuschiessen, das ganze dauert ca. 7-9 Minuten, lt. Log wurde um 01:39 der erste Logtext rausgehauen der auf das fehlen von SIP Funktionalität schliessen lässt.

Code:
Apr 22 01:39:08 WARNING[3199]: chan_sip.c:12849 reload_config: Invalid address for externhost keyword: <name>.dyndns.org
Abhilfe schafft - und jetzt kommt´s : Das neustarten des Routers und ein asterisk restart, fertig - ob der restart nötig ist weiss ich nicht, ich habe das als komplettpaket angewandt, damals hatte ich den Router neustart nur "zufällig" gemacht und eher unbewusst.

Ich habe nun den dd-wrt auf meinen syslog server gelinked um die logs vor dem ausfall auch zu bekommen, wir sehen mal.

Kennt jemand so etwas - "Absturz von chan_sip.so durch Zeitüberschreitung" ?? Das dürfte doch eigentlich ausgeschlossen sein !!?

Hier noch die Funktionseinschränkung" des * nach dem Ausfall, es scheint als wartet er auf chan_sip und alles danach muss auch warten (!) , s.h. alles (ausser unload) nach chan_sip fehlt auch, Dinge wie "restart" "stop" usw usf

Code:
     show manager command  Show a manager interface command
    show manager commands  List manager interface commands
   show manager connected  Show connected manager interface users
             show modules  List modules and info
        show modules like  List modules and info
         show parkedcalls  Lists parked calls            
            show switches  Show alternative switches    
              show uptime  Show uptime information                
             show version  Display version info
        show video codecs  Shows video codecs              
              soft hangup  Request a hangup on a given channel    
                   unload  Unload a dynamic module by name

Hier just4fun die funktionierende Ausgabe der selben Stelle :

Code:
     show manager command  Show a manager interface command
    show manager commands  List manager interface commands
   show manager connected  Show connected manager interface users
             show modules  List modules and info
        show modules like  List modules and info
         show parkedcalls  Lists parked calls
               show queue  Show status of a specified queue
              show queues  Show status of queues
            show switches  Show alternative switches
         show translation  Display translation matrix
              show uptime  Show uptime information
             show version  Display version info
       show version files  Show versions of files used to build Asterisk
        show video codecs  Shows video codecs
     show voicemail users  List defined voicemail boxes
     show voicemail zones  List zone message formats
            show warranty  Show the warranty (if any) for this copy of Asterisk
                sip debug  Enable SIP debugging
             sip debug ip  Enable SIP debugging on IP
           sip debug peer  Enable SIP debugging on Peername
              sip history  Enable SIP history
             sip no debug  Disable SIP debugging
           sip no history  Disable SIP history
               sip notify  Send a notify packet to a SIP peer
       sip prune realtime  Prune cached Realtime object(s)
  sip prune realtime peer  Prune cached Realtime peer(s)
  sip prune realtime user  Prune cached Realtime user(s)
               sip reload  Reload SIP configuration
        sip show channels  Show active SIP channels
         sip show channel  Show detailed SIP channel info
         sip show domains  List our local SIP domains.
         sip show history  Show SIP dialog history
           sip show inuse  List all inuse/limits
         sip show objects  Show all SIP object allocations
            sip show peer  Show details on specific SIP peer
           sip show peers  Show defined SIP peers
        sip show registry  Show SIP registration status
        sip show settings  Show SIP global settings
   sip show subscriptions  Show active SIP subscriptions
           sip show users  Show defined SIP users
            sip show user  Show details on specific SIP user
             skinny debug  Enable Skinny debugging
          skinny no debug  Disable Skinny debugging
      skinny show devices  Show defined Skinny devices
        skinny show lines  Show defined Skinny lines per device
              soft hangup  Request a hangup on a given channel
          stop gracefully  Gracefully shut down Asterisk
                 stop now  Shut down Asterisk immediately
     stop when convenient  Shut down Asterisk at empty call volume
                 transfer  Transfer a call to a different extension
                   unload  Unload a dynamic module by name
                   unmute  Enable mic input
      zap destroy channel  Destroy a channel
        zap show cadences  List cadences
        zap show channels  Show active zapata channels
         zap show channel  Show information on a channel
          zap show status  Show all Zaptel cards status
Grüsse, Stefan
 
Zuletzt bearbeitet:
Kostenlos!

Statistik des Forums

Themen
247,208
Beiträge
2,263,814
Mitglieder
375,700
Neuestes Mitglied
BMatzy