← Back to team overview

sslug-teknik team mailing list archive

RegExp igen..

 

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Hej

Så har jeg brug for RegExp guruerne igen :-)

Jeg har en del filer med underlige whitespaces der kommer ivejen når 
jeg sender dem igennem bl.a. HTML Tidy.

Jeg forsøgte mig med følgende minimalistiske regexp i perl:

"s/\s+/\ /g"

eller den simplere variant :

"s/\s/\ /g"

(Alle whitespace bortset fra linieskift skal laves om til space)

Den sidste giver mange mellemrum, men det er HTML jo lidt ligeglad 
med.

På papiret ser det jo godt nok ud, men det er det ikke. De er lidt for 
efektive da de returnerer en fil med een meget lang linie.
Jeg var af den opfattelse at man skulle bruge "/gm" for at den ville 
kigge på linieskift...

Ideelt set vil jeg have ovenstående regexp udtrypp til at ignorere 
'\n' or '\r'.

Det skal lige siges at på det tidspunkt jeg skulle bruge den 
ovenstående regexp var før der var indsat html tags, så hverken jeg 
eller Tidy havde ikke en chance for at reformatere teksten bagefter.

- -- 
Best Regards
A.Grandt

Light travels faster than sound. This is why some
people appear bright until you hear them speak.
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.3 (GNU/Linux)

iD8DBQFCRBY1QKgAVMn7PyMRApXfAJ9hlOtcg2w7zo6kHbFHqmpJE3Ej9wCgnZzW
rM94PaJIcRMus77N1JOhbb0=
=4GFW
-----END PGP SIGNATURE-----



Follow ups