sslug-teknik team mailing list archive
-
sslug-teknik team
-
Mailing list archive
-
Message #87195
Re: pdftotext og danske tegn
On Thu, 16 Feb 2006 11:41:16 +0000, Jon Theil Nielsen wrote:
> Jeg kan godt se ideen. Men pdftotext uden -enc giver en stort set tom fil.
> Jeg bruger FreeBSD 6.0 og her er syntaksen for iconv en smule anderledes,
> men det problem fik jeg da løst. På en eller anden måde bliver jeg
> nødt til at angive nogle parametre til pdftotext, der får den til at
> fatte den encoding der er i pdf-filen.
Du er ikke stødt på dette problem?
"
BUGS
Some PDF files contain fonts whose encodings have been mangled beyond
recognition. There is no way (short of OCR) to extract text from these
files.
" (man pdftotext)
--
Hilsen/Regards
Michael Rasmussen
http://keyserver.veridis.com:11371/pks/lookup?op=get&search=0xE3E80917
Follow ups
References