← Back to team overview

sslug-teknik team mailing list archive

Re: gawk problem

 

Jeg må lige prøve at spørge om lidt mere hjælp.

Jeg prøver at fjerne alt der står inden for < > i en html, for så at putte det ud i 
en txt fil.
På nuværende tidspunkt er der prøvet et par forskellige "angrebs" vinkler, men de
ser desværre ud til at have det samme resultat.

Første forsøg: gawk  '{ gsub(/<.*>/,""); print }'
Andet forsøg: sed s/"<.*>"//g

Resultatet af de 2 linjer ligner jo hinanden til forveksling, og fjerner tilsyneladende alt som
står inden for < >.
Dette efterlader så nogle tilsyneladende tomme linjer i de filer der er blevet kørt, så dem ville
jeg gerne fjerne, da resultatet så blev en del pænere. Og så skulle det jo også være en smal sag
af fjerne et par tomme linjer;
Så jeg skrev glad: sed  /^$/d
Dette burde jo ganske simpelt have fjernet de "tomme" linjer........Men næhhh nej,
det ladet til at de "tomme" linjer ikke er tomme, men indeholder en eller anden kode
som set i mc (øverst - yderst til højre) er: ^M 13 dH

Så når nu sed /^$/d ikke kan fjerne de linjer (som jeg nu har set mig godt sur på) hvordan
slipper jeg så lige af med dem???

M.v.h.

Kim


----- Original Message ----- 
From: "Kim Hermansen" <k.hermansen@xxxxxxxxxxxxxxxx>
To: <sslug-teknik@xxxxxxxx>
Sent: Wednesday, January 23, 2002 1:27 PM
Subject: Re: [TEKNIK] gawk problem


> Takker.....
> Det var lige det . der manglede
> 
> (lammende hurtige svar her på listen igen)
> 
> M.v.h.
> 
> Kim
> 
> ----- Original Message ----- 
> From: <Kristian.Hogh@xxxxxx>
> To: <sslug-teknik@xxxxxxxx>
> Sent: Wednesday, January 23, 2002 1:07 PM
> Subject: RE: [TEKNIK] gawk problem
> 
> 
> > > -----Original Message-----
> > > From: Kim Hermansen [mailto:k.hermansen@xxxxxxxxxxxxxxxx]
> > >
> > > cat inf.html | gawk 'IGNORECASE=1 { gsub(/<*>/,""); print }' > inf.txt
> > > Men det gav ikke lige det ønskede resultat.
> > > Så nu er det lige at jeg gerne vil vide hvordan jeg får den 
> > > til at forstå at
> > > * står for "alt eller ingen ting" ligesom * plejer at gøre???
> > 
> > prøv .* i stedet for *
> > 
> > /Kristian Høgh.
> > 
> > 
> > 
> 
> 
> 
> 



Follow ups

References