← Back to team overview

sslug-teknik team mailing list archive

Re: supergrep findes det?

 

David Bo Jensen <dbj@xxxxxxxxxxxxx> skrev:

> lynx er smart, men hvad gør man, hvis html siden er Windows-1251 og man 
> gerne vil have et dump i UTF-8
> lynx -dump  http://www.inspiro.ru/ > dump.txt

I ~/.lynxrc sætter du variablen

   character_set=UNICODE (UTF-8)
 
eller du kan bruge 

  lynx -dump -display_charset=utf8 <url>

Når man skal trække noget tekst ud som du vil, kan det også være
hensigtsmæssigt at undgå ombrydning og oplistning og nummerering af
henvisninger, så en kommando som 

   lynx -dump -nolist -nonumbers -width 500 -display_charset=utf8 <url>

virker normalt fint.

Sommetider kan elinks og lynx give lidt forskelligt formateret uddata,
hvor det ene måske er en anelse bedre til opgaven end det andet, så du
kan evt. også forsøge med

   elinks -dump -dump-width 500 -dump-charset utf8 -no-references \
   -no-numbering <url>


Morten


Follow ups

References