sslug-teknik team mailing list archive
-
sslug-teknik team
-
Mailing list archive
-
Message #100377
Re: supergrep findes det?
David Bo Jensen <dbj@xxxxxxxxxxxxx> skrev:
> lynx er smart, men hvad gør man, hvis html siden er Windows-1251 og man
> gerne vil have et dump i UTF-8
> lynx -dump http://www.inspiro.ru/ > dump.txt
I ~/.lynxrc sætter du variablen
character_set=UNICODE (UTF-8)
eller du kan bruge
lynx -dump -display_charset=utf8 <url>
Når man skal trække noget tekst ud som du vil, kan det også være
hensigtsmæssigt at undgå ombrydning og oplistning og nummerering af
henvisninger, så en kommando som
lynx -dump -nolist -nonumbers -width 500 -display_charset=utf8 <url>
virker normalt fint.
Sommetider kan elinks og lynx give lidt forskelligt formateret uddata,
hvor det ene måske er en anelse bedre til opgaven end det andet, så du
kan evt. også forsøge med
elinks -dump -dump-width 500 -dump-charset utf8 -no-references \
-no-numbering <url>
Morten
Follow ups
References