sslug-teknik team mailing list archive
-
sslug-teknik team
-
Mailing list archive
-
Message #87174
Re: pdftotext og danske tegn
On Tue, Feb 14, 2006 at 11:04:41AM +0000, Jon Theil Nielsen wrote:
> I forbindelse med opsætning af en søgefunktion på mit website vil jeg
> bruge pdftotext til at konvertere pdf-filer til tekst. Det fungerer
> egentlig udmærket. Bortset fra at det går galt med danske specialtegn,
> hvor der bliver indsat koder som fx <C3><98> i stedet for "Ø". Findes der
> en løsning på dette problem?
Hos mig virker det men jeg har muligvis også anvendt PDF filer
med Latin1 som er standard i pdftotext.
Se option "-enc" i "man pdftotext"
Muligvis du anvender dokumenter med unicode, utf8 eller andet
tegnsæt?
--
mvh Frank Damgaard |
Follow ups
References