← Back to team overview

sslug-teknik team mailing list archive

Re: pdftotext og danske tegn

 

On Wed, 15 Feb 2006 23:05:43 +0000, Jon Theil Nielsen wrote:

> 
> win-1257 er vistnok baltisk, mens win-1252 er amerikansk/vesteuropæisk.
> Men hvis jeg sætter -enc til win1252 (eller win-1252) får jeg en
> fejlmeddelelse om at den ikke kender noget til det... Jeg kan ikke
> gennemskue hvilke encodings programmet har at gøre godt med. Men det er i
> hvert fald korrekt at det er dokumenter lavet i Windows vha. Acrobat.
Prøv følgende:
1) pdftotext fil.pdf fil.txt
2) iconv -f WINDOWS-1252 -t UTF-8 -o fil.utf8 fil.txt 
-- 
Hilsen/Regards
Michael Rasmussen
http://keyserver.veridis.com:11371/pks/lookup?op=get&search=0xE3E80917



Follow ups

References