Tre modi per convertire pagine html in text in Gnu-Linux

 

Per convertire pagine html in testo, ci sono almeno tre modi. Utilizzando browsers come elinks e lynx, oppure un network downloader come wget, comunque tutti appoggiandosi ad html2text.

 

# apt-get install html2text elinks lynx

$ elinks -source https://www.edmondweblog.com/ | html2text > edmondweblog.txt

$ lynx -source https://www.edmondweblog.com/ | html2text > edmondweblog.txt

$ wget -qO- https://www.edmondweblog.com | html2text > edmondweblog.txt

 

 

enjoy 😉

Post simili (quasi):

5 pensieri riguardo “Tre modi per convertire pagine html in text in Gnu-Linux”

  1. Unknown Unknown Unknown Unknown

    Si potrebbe usare anche:
    curl indirizzo -O file.html | html2txt > file.txt

  2. Unknown Unknown Unknown Unknown

    ho trovato il problema… io cercavo qualcosa che funzionase a livello html…

    Comunque ora tutto funziona perfettamente.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *