Ehemalige Homepage von html2text

Verwandte Seiten:

html2text ist ein C++-Programm für die Kommandozeile, das HTML-Dateien in reinen Text umwandelt.

Die HTML-Dateien können von Standard-Input gelesen werden, als lokale Dateien vorliegen oder über Hypertext Transfer Protocol (HTTP) von anderen Rechnern geladen werden; die Ausgabe erfolgt auf Standard-Output oder in eine Datei.

html2text setzt Tabellen möglichst getreu um, besitzt eine Möglichkeit zum Einstellen der Länge der Ausgabe-Zeilen und toleriert auch syntaktisch unkorrektes HTML. Unterstrichener und/oder fetter Text wird standardmäßig durch so genannte Backspace-Sequenzen wiedergegeben, die von Pager-Programmen wie "less" entsprechend umgesetzt werden. Dabei ist die Art der Umsetzung ursprünglicher Formatierungen (Rendering) weitgehend durch eine Konfigurationsdatei beeinflussbar.

html2text wurde bis Version 1.2.2 von Arno Unkrig für GMRS geschrieben. Im Jahr 2016 hat er das Tool in Java neu entwickelt. Die Java-Implementierung finden Sie unter Html2txt.

html2text wird nun von Fabian Groffen betreut. Bitte besuchen Sie GitHub um die jüngsten Quellen des Programms zu erhalten (ab Version 2.0) oder wenn Sie Beiträge oder Anfragen zu dem Programm haben.