Per convertire pagine html in testo, ci sono almeno tre modi. Utilizzando browsers come elinks e lynx, oppure un network downloader come wget, comunque tutti appoggiandosi ad html2text.
# apt-get install html2text elinks lynx
$ elinks -source https://www.edmondweblog.com/ | html2text > edmondweblog.txt
$ lynx -source https://www.edmondweblog.com/ | html2text > edmondweblog.txt
$ wget -qO- https://www.edmondweblog.com | html2text > edmondweblog.txt
enjoy 😉
Si potrebbe usare anche:
curl indirizzo -O file.html | html2txt > file.txt
certo che sì 😉
sto provando html2test ma non mi funziona. non riesco a capire dove sbaglio.
se usi una distro Gnu-Linux mi sembra strano che non funzioni!!
ho trovato il problema… io cercavo qualcosa che funzionase a livello html…
Comunque ora tutto funziona perfettamente.