← Back to team overview

sslug-teknik team mailing list archive

Re: pdftotext og danske tegn

 

Martin Møller Pedersen skrev:
win-1257 ?
/Martin

On 2/15/06, Michael Rasmussen <mir@xxxxxxxxx> wrote:
On Tue, 14 Feb 2006 19:47:22 +0000, Jon Theil Nielsen wrote:

> Det giver desværre samme resultat. Jeg kan ikke se på pdf-filerne,
> hvilken kodning de har. Jeg er ikke i tvivl om at outputformattet bliver
> UTF-8, men problemet er åbenbart at læse inputformatet. Hvilke andre
> encodings kunne man forestille sig ville virke?
Det er ikke et windows tegnsæt? hedder vist win-1252 eller sådan noget.
--
Hilsen/Regards
Michael Rasmussen
http://keyserver.veridis.com:11371/pks/lookup?op=get&search=0xE3E80917

win-1257 er vistnok baltisk, mens win-1252 er amerikansk/vesteuropæisk. Men hvis jeg sætter -enc til win1252 (eller win-1252) får jeg en fejlmeddelelse om at den ikke kender noget til det... Jeg kan ikke gennemskue hvilke encodings programmet har at gøre godt med. Men det er i hvert fald korrekt at det er dokumenter lavet i Windows vha. Acrobat.

--
Jon



Follow ups

References