sslug-teknik team mailing list archive
-
sslug-teknik team
-
Mailing list archive
-
Message #102007
Re: HTML formatter
On Thu, 24 Nov 2011 08:39:17 -0300
"Frank Larsen" <fl@xxxxxxxxxxx> wrote:
> > > >
> > > >>Hvad med tidy? Det er skrevet i C, og findes, svjv, i både
> > > >>dynamisk og statisk linkede versioner.
> > > >>
> > > >
> > > > Eller du kan lave en statisk linket version selv, da det
> > > > selvfølgelig er open source.
> > >
> > > Ahh, den havde jeg glemt/overset. Checker i morgen..
> >
> > Jeg er spændt på at høre, hvad du kommer frem til. Den nyeste
> > Tidy jeg kan finde er fra 2010, men ligner de gamle: Den kan
> > ikke acceptere fejl i HTML dokumenter:
> > [...]
> > line 305 column 1 - Error: discarding unexpected </font>
> > 193 warnings, 6 errors were found!
> >
> > This document has errors that must be fixed before
> > using HTML Tidy to generate a tidied up version.
> >
> > You may need to move one or both of the <form> and </form>
> > tags. HTML elements should be properly nested and form elements
> > are no exception. [---]
> >
> > Der er godt nok forklaringer af hvad det er "den ikke kan lide"
> > men det er måske ikke lige det tool, man har brug for, hvis man
> > skal rescue/redde en webservice med 300+ filer.
> >
> > Jeg har engang prøvet at skrive en "loose" parser som accepterer
> > visse fejl, men det griber hurtig om sig og det lykkedes kun
> > lidt + at det kræver tid at vedligeholde/forbedre. Jeg kan
> > huske at nogen, vistnok Peter Toft, foreslog at jeg prøvede at
> > bygge en med en xml-parser eller yacc. Det bliver næste
> > projekt, jeg tror det vil være nyttigt :)
> >
>
>
>
> Prøv at bruge xmllint i stedet for at lave din egen xml-parser
>
> Dagligt anvender jeg xmllint til at validere og formatere
> xml-filer.
>
>
> xmllint har også mulighed for at parse html, men jeg har ikke
> brugt programmet til det.
>
> En hurtig test, hvor jeg lavede nogle stavefejl i tags samt
> udelod andre, blev disse fejl rettet.
>
> Fejl rettet i hmtl: "Glemt" <body> + stavefejl i </pre> + </body>
> + </html>
>
> Syntaks til at rette html: xmllint --html --htmlout --recover
> xyz.html > zyx.html
Super! Jeg var lige ved at gå i gang med xsltproc, men tænkte at
det var for stor en omvej. Tak Frank - måske det også kan hjælpe
Mogens Valentin? Lad os høre!
--
Donald Axel <donax@xxxxxx>
References