[Javalist] Karakter kódolás

istvan.ketler at lhsystems.com istvan.ketler at lhsystems.com
2013. Május. 13., H, 10:04:13 CEST


Nem teljesen értem a problémát, a pdf fájl amennyire tudom nem karaktereket tartalmaz, hanem glypheket, és van támogatás az acrobat pdf sdk-ban arra, hogy miként kell kinyerni a karaktereket belőle (rögtön unicode-ban). Ezt használják pl. a látássérültek számára felolvasó programok is. A fájlban egyébként van hivatkozás a fontra, ezért (ha nem embedded) akkor annak a fontnak elérhetőnek kell lennie a fogadó oldalon, asszem ennyi a constraint. Előkerestem egy rövid blogot (2008-as), amit már régebben olvastam, az ennél részletesebb infót is ad. De ezen gondolom már túl vagy, szóval mit értek félre?

A blog: http://blogs.adobe.com/insidepdf/2008/07/text_content_in_pdf_files.html

" Egyebkent a leghatekonyabban oktatassal lehet megoldani a dolgot, oktatni kell, hogy hogy kell UTF-8 -as PDF-et eloallitani. "

Gábor, részben igazad lehet, de ha mondjuk egy banki IT projektvezető azzal állna elő hogy egy nagy presztízsű részleg (pl. nagyértékű követeléskezelés) munkatársai (akik gyakran több diplomás, sokéves banki tapasztalatú emberek) vegyenek részt egy IT oktatáson azért, hogy jó formátumot állítsanak elő, akkor attól tartok a mindenféle vezetők összevonnák a szemöldöküket. Ennél esetleg járhatóbb, ha az IT felajánlja hogy az első néhány alkalommal segít a jelentés összeállításában, és készít egy kottát amelyben benne vannak a szükséges beállítások. De akkor sem biztos, hogy mindig a jó formátum fog megérkezni (human error, új munkatárs, satöbbi). Szóval ha van rá IT oldali megoldás (és szerintem van), akkor azt kell választani szvsz.

Üdv, Iván
______________________________
István Ketler
Senior Consultant

Lufthansa Systems Hungária Kft.
GUI Service Center
Mobile Solutions Team, Development Center Danube
Neumann János u. 1/e
1117 Budapest
Hungary
Phone: +36 1 887-2815
Fax: +36 1 887-0577
Mobile: +36 30 600-4936
E-mail: istvan.ketler at LHsystems.com<mailto:istvan.ketler at LHsystems.com>
www.LHsystems.com<http://www.lhsystems.com/>

From: javalist-bounces at lists.javaforum.hu [mailto:javalist-bounces at lists.javaforum.hu] On Behalf Of Gábor Garami
Sent: Sunday, May 12, 2013 7:47 PM
To: Java lista
Subject: Re: [Javalist] Karakter kódolás

A CharsetDetector-ral pontosan mi a baj? Oke, azt mondja, meg, hogy milyen character settel lehet kiiratni, de ez akar meg jo is lehet neked, nem?

Egyebkent meg karakter konvertalasnal a legrosszabb esetben trial and error modszerrel lehet megtalani a helyeset, ugyanis ha a konvertalas ertelmezhetetlen karakterbe szalad, akkor elvben dob egy exceptiont.

Egyebkent a leghatekonyabban oktatassal lehet megoldani a dolgot, oktatni kell, hogy hogy kell UTF-8 -as PDF-et eloallitani.

Garami Gábor
E-mail: gabor.garami at hron.me<mailto:gabor.garami at hron.me>
Tel: +36 20 235 9621
MSN: hrgy at vipmail.hu<mailto:hrgy at vipmail.hu>
Skype: hron84

2013/5/10 Mester József <mester at kite.hu<mailto:mester at kite.hu>>
Üdv

PDF-et kell kitölteni. Itext pdfstamper-e meg is csinálja ezt nem is ez a gond.
A PDF-ek egy része más forrásból származik mint a másik. A házon belül készülő része windowsos programmal készül aminek excel file a bemenete.
A nem házon belüli az kormányzati forrás és mit ad isten ezt kivételesen jól meg tudják csinálni fixen UTF-8 kódolással ...
A házon belülit nem programozók csinálják, amilyen napja éppen van a kedves usernek (meg az excelnek) olyan karakterkódolással készül a kitöltendő pdf.
A kitöltéshez használt bemenet régi programokból érkezik vegyesen Cp852 illetve ISO-8859-2 kódolású csv filék formájában.
Nekem szükségem lenne egy programra amely iconv-hoz hasonlóan átkódolja a pdf-et és a csv filét is .
A nehezítés az, hogy változó a bemeneti file kódolása. A pdf lehet w-1250,ISO-8859-2 , illetve UTF-8-ast is kaptam már.
Az icu projekt CharsetDetector az annyit tud (tapasztalataim szerint), hogy milyen kódolással lehet kiíratni . Az rajtam nem segít.

Szerintetek merre induljak. Már szétgugliztam az agyam de mindenütt csak kiíratni akarnak. Nekem meg eszem ágában sincs kiíratni,
én beíratni akarok pdf-be.

Mester József




_______________________________________________
Javalist mailing list
Javalist at lists.javaforum.hu<mailto:Javalist at lists.javaforum.hu>
http://lists.javaforum.hu/mailman/listinfo/javalist


 
Sitz der Gesellschaft / Corporate Headquarters: Lufthansa Systems Hungaria Kft, Budapest, Fovarosi Birosag 01-09-463417
Geschaeftsfuehrung / Management Board: Peter Sipos


--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: <http://lists.javaforum.hu/pipermail/javalist/attachments/20130513/156f5f40/attachment.html>


További információk a(z) Javalist levelezőlistáról