wget und die Umlaute -- HILFE gesucht

merkc

Neuer User
Mitglied seit
6 Jan 2006
Beiträge
135
Punkte für Reaktionen
0
Punkte
16
Hi All,
ich bin total frustriert mit dem wget Befehl. Ich brauche diesen in mehreren meiner Skripte, u.a. für die reverse-Suche. Gleich was ich in die Headers hineinsetze, ich bekomme doch blos ein "?" für alles was nach einem Umlaut (äöü) oder einem scharfen S (ß) aussieht. Wer hat die richtige Antwort? Was muss ich tun. Es kann doch nicht sein, dass wenn ich von meinem Mac aus eine Seite aufrufe, dann alles Paletti (ok-hier ist es der Firefox Browser) ist, und wenn ich auf den vServer (und hier wget. gleiches bei curl und lynx) gehe, dann bekomme ich einen anderen Zeichensatz.

thnx
Chris
 
Soweit ich das verstehe, ziehst Du mit wget html Daten rein und stellst sie mit einem Webserver zur Verfügung. Jetzt kommts natürlich darauf an, welchen Zeichensatz die Webseite hat, die Du reinziehst und welchen Zeichensatz dein Apache verwendet. Folgendes ist zu tun:

- Stelle fest, wie Dein Apache eingestellt ist (Wahrscheinlich ISO-8859-1)
- Stell Dir den Apache mit der Anweisung AddDefaultCharset auf den Zeichensatz ein, den Du möchtest - gefühlsmässig sollte das UTF-8 sein
- Wenns dann noch immer nicht klappt, kannst Du mit recode die html Datei konvertieren

Codebeispiel:
cat datei_alt.html | recode ISO_889-1..UTF8 > datei_neu.html

wget ist übrigens vollkommen unschuldig ;-)

Deine Tante
 
D A N K E

also, hier ist die Auflösung des Rätsels:

im /etc/sysconfig/language steht bei so manchen V-Server folgendes:
#RC_LANG="de_DE@euro"
RC_LANG=""

und weiter unten dann noch:
#INSTALLED_LANGUAGES="en_US,de_DE"
INSTALLED_LANGUAGES=""

also, die korrekte Version ist die von mir nun gesetzte, die falsche Version ist die von mir auskommentierte Version.

... glaub mir, wenn Du mal rum-googest, dann sind die Foren gefüllt mit den Fragen, ohne die Antworten zu haben !!! Danke nochmals für Deinen Hinweis mit der Spracheinstellung.


Übrigens: Das mit dem unschuldig sein ist so ne Sache.... gerade bei Frauen ;-) *lach*
 
Holen Sie sich 3CX - völlig kostenlos!
Verbinden Sie Ihr Team und Ihre Kunden Telefonie Livechat Videokonferenzen

Gehostet oder selbst-verwaltet. Für bis zu 10 Nutzer dauerhaft kostenlos. Keine Kreditkartendetails erforderlich. Ohne Risiko testen.

3CX
Für diese E-Mail-Adresse besteht bereits ein 3CX-Konto. Sie werden zum Kundenportal weitergeleitet, wo Sie sich anmelden oder Ihr Passwort zurücksetzen können, falls Sie dieses vergessen haben.