← Back to team overview

sslug-teknik team mailing list archive

Re: pdftotext og danske tegn

 

On Tue, Feb 14, 2006 at 11:04:41AM +0000, Jon Theil Nielsen wrote:
> I forbindelse med opsætning af en søgefunktion på mit website vil jeg 
> bruge pdftotext til at konvertere pdf-filer til tekst. Det fungerer 
> egentlig udmærket. Bortset fra at det går galt med danske specialtegn, 
> hvor der bliver indsat koder som fx <C3><98> i stedet for "Ø". Findes der 
> en løsning på dette problem?

Hos mig virker det men jeg har muligvis også anvendt PDF filer
med Latin1 som er standard i pdftotext.
Se option "-enc" i "man pdftotext"
Muligvis du anvender dokumenter med unicode, utf8 eller andet
tegnsæt?


-- 
mvh Frank Damgaard  | 



Follow ups

References