← Back to team overview

sslug-teknik team mailing list archive

Re: pdftotext og danske tegn

 

On Thu, 16 Feb 2006 11:41:16 +0000, Jon Theil Nielsen wrote:

> Jeg kan godt se ideen. Men pdftotext uden -enc giver en stort set tom fil.
> Jeg bruger FreeBSD 6.0 og her er syntaksen for iconv en smule anderledes,
> men det problem fik jeg da løst. På en eller anden måde bliver jeg
> nødt til at angive nogle parametre til pdftotext, der får den til at
> fatte den encoding der er i pdf-filen.
Du er ikke stødt på dette problem? 
"
BUGS
       Some  PDF  files contain fonts whose encodings have been mangled beyond
       recognition.  There is no way (short of OCR) to extract text from these
       files.
" (man pdftotext)
-- 
Hilsen/Regards
Michael Rasmussen
http://keyserver.veridis.com:11371/pks/lookup?op=get&search=0xE3E80917



Follow ups

References