Whatsup - לינוקס, תוכנה חופשית וקוד פתוח בעברית

שימוש מתקדם בלינוקס - איך הופכים קובץ PDF מקודד בתוך XML לקובץ PDF עם פייתון

queency - 11/11/2014 - 12:55
נושא ההודעה: איך הופכים קובץ PDF מקודד בתוך XML לקובץ PDF עם פייתון
קיבלתי קובץ PDF מקודד בתוך XML
אז עשיתי CUT PASTE למידע הטקסטואלי ושמרתי בקובץ IN

קראתי את הקובץ למשתנה s
קידדתי את את s עם

>>> import base64

>>> # Encode as Base64
>>> a = base64.b64encode(s)

ורשמתי את המשתנה החדש a
לקובץ חדש

אם אני מתבונן בתוך הקובץ עם hex editor אני רואה את ההתחלה
%PDF.1.6%
אבל לא יכול לפתוח את הקובץ עם PDFREADER או אפילו עם GNU PICTURE MANIPULATION

מישהו יכול לעזור ?
Anonymous - 11/11/2014 - 14:37
נושא ההודעה:
תוכל לצרף את הקובץ?
Anonymous - 11/11/2014 - 18:06
נושא ההודעה:
אתה צריך לעשות decode לא encode.
Anonymous - 11/11/2014 - 19:46
נושא ההודעה:
Anonymous :
אתה צריך לעשות decode לא encode.

אים אני לא טעה אתה מתכוון ל data decompression
queency - 15/11/2014 - 18:25
נושא ההודעה:
נאמר לי שהקובץ ריק (כלומר לבן)
טוב לתוצאה הזאת כן הגעתי .
queency - 18/11/2014 - 09:22
נושא ההודעה:
קוד:

b64decode(text)


הפונקציה הזאת הופכת לי טקסט ל HEX ואני
מיד רושם אותו לקובץ

הקובץ נרשם כקובץ PDF ואף נפתח אבל רואים בו רק
דף לבן ריק.

מישהו יכול לסייע ?
Anonymous - 18/11/2014 - 09:59
נושא ההודעה:
אמרת שהקובץ אמור להיות ריק, אז מה הבעיה?

בכל מקרה - אתה יכול לנסות pdftotext ודומיו על מנת לוודא כי אכן אין תוכן לקובץ.
אבל אם קיבלת קובץ PDF תקין סביר להניח שביצעת הכל כהלכה.
queency - 18/11/2014 - 11:48
נושא ההודעה:
Anonymous :
אמרת שהקובץ אמור להיות ריק, אז מה הבעיה?

בכל מקרה - אתה יכול לנסות pdftotext ודומיו על מנת לוודא כי אכן אין תוכן לקובץ.
אבל אם קיבלת קובץ PDF תקין סביר להניח שביצעת הכל כהלכה.


הקובץ הוא מסוג תמונה והוא לא אמור להיות ריק
Anonymous - 18/11/2014 - 12:23
נושא ההודעה:
כאמור - לא נשמע סביר שתקבל קובץ PDF תקין אך שונה מזה שקודד מראש.
האם אתה בטוח שמה שקודד הוא מה שאתה מצפה לו? אולי יש טעות בצד השולח?
אחרת - אני לא רואה איך נוכל לעזור לך בלי לקבל את ה-XML המדובר...
Anonymous - 18/11/2014 - 20:04
נושא ההודעה:
כשאני פותח את ה PDF בDocument Viewer
הוא אומר לי
the document contains no pages
Anonymous - 19/11/2014 - 06:36
נושא ההודעה:
האם ניסית להשוות לקובץ המקורי?
או לפחות להשוות איזה Hash?

יכול להיות שהתמונה שאתה מצפה לה נמצאת כקובץ מצורף ל-PDF? (ולא כתמונה במסמך עצמו...?)
כל הזמנים הם GMT + 2 שעות