HTML Entities von der Shell aus in Text umwandeln

Bislang hatte ich noch kein Pogramm gesehen, bei dem man auf der Kommandozeile einfach HTML Entitäten, wie > oder & in den normalen Zeichensatz zurückkonvertieren kann. Sicher, es gibt dafür eine PHP-Funktion und bestimmt auch eine entsprechende Perl-Funktion, aber warum nicht etwas einfacheres nutzen..

sudo apt-get install recode
recode HTML.. < file.html > file.txt

Recode kann übrigens noch mehr, z.B. die Zeilenumbrüche vom Linux-Format zu Windows konvertieren. Eine kleine Beispielsammlung gibt es bei linux.co.uk.

Hinterlasse einen Kommentar

 

 

 

Du kannst diese HTML tags benutzen

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="">