← Back to team overview

sslug-teknik team mailing list archive

Re: pdftotext og danske tegn

 

Michael Rasmussen skrev:

On Tue, 14 Feb 2006 11:04:41 +0000, Jon Theil Nielsen wrote:

I forbindelse med opsætning af en søgefunktion på mit website vil jeg
bruge pdftotext til at konvertere pdf-filer til tekst. Det fungerer
egentlig udmærket. Bortset fra at det går galt med danske specialtegn,
hvor der bliver indsat koder som fx <C3><98> i stedet for "Ø". Findes der
en løsning på dette problem?
Se: man pdftotext. Find option -enc
Så vidt jeg kan se er det noget jeg skal konfigurere i xpdfrc. Men jeg må indrømme at det virker en smule langhåret. Kunne du give et eksempel på hvordan det gøres? På forhånd tak.

--
Jon Theil Nielsen



References