sslug-teknik team mailing list archive
-
sslug-teknik team
-
Mailing list archive
-
Message #100373
Re: supergrep findes det?
lynx er smart, men hvad gør man, hvis html siden er Windows-1251 og man
gerne vil have et dump i UTF-8
lynx -dump http://www.inspiro.ru/ > dump.txt
"Kristian Kallenberg" <kale@xxxxxxxxxxxxx> skrev i en meddelelse
news:f502f381508d58225200064a34c25fb8.squirrel@xxxxxxxxxxxxxxxxxx...
>> Jeg tænker på at lave en bedre grep, der kan håndtere en mere kompleks
>> syntax. F.eks
>>
>> cat min_fil.html | supergrep ./html_syntax table
>>
>> vil udprinte alle tables i øverste niveau fra min_fil.html, hvor "table"
>> er
>> defineret i html_syntax.
>>
>> Men findes der noget lignende i forvejen?
>> Hvis jeg skal lave den selv. Hvilket format skal syntax filen være i?
>> XML?
>> og hvilke biblioteker vil være værd at se på til brug for mit program?
>
> kør filen gennem less eller lynx først. Så skulle resten give sig selv
>
> /kallenberg
>
>
>
Follow ups
References