Whatsup - לינוקס, תוכנה חופשית וקוד פתוח בעברית

מה חסר לי בלינוקס ? - מערכת לסריקת וניהול מסמכים

Anonymous - 22/08/2020 - 21:34
נושא ההודעה: מערכת לסריקת וניהול מסמכים
לאור זה שהגיעו שנות האלפיים (לפני 20 שנה) החלטתי להפטר ממסמכי נייר ולעבור לשמירה ממוחשבת.

אני מחפש כלי שיאפשר לי לנהל בקלות סריקה מסורק שמחובר למחשב ו/או import של קבצי תמונה או PDF (לדוגמא, משרות fax-to-mail). רצוי גם שיבצע OCR ברמה סבירה, באנגלית וגם בעברית, ויאפשר חיפוס על פי תוכן ו/או תאריך סריקה ו/או פרטים שהוספתי בזמן הסריקה.

מחיפושי עד עכשיו, המועמדים הם:

https://github.com/ciur/papermerge הוא המועמד המוביל, בעמוד שלו יש הפניה ל- paperless ו- MayanDMS שמלקרוא את התיאורים שלהם, מיועדים יותר לעבודה משרדית מאשר ביתית ולכן יהיהו כנראה מסורבלים ובירוקרטיים לשימוש הביתי שלי.

https://github.com/sismics/docs/ - נראה שכולל את הדרישות שלי, וגם לא כבד מדי. החסרון העקרי שלו מבחינתי הוא שהוא כתוב ב- Java (שלושת הקודמים ב- Python) מה שאומר שאם אצטרך לתקן פיצ'ר שקשור לעברית, מה שדי סביר, אני אאלץ לכתוב Java שזה דבר שהצלחתי להמנע ממנו כבר 15 שנים מאז הפעם האחרונה.

שאלתי היא:

א) האם מישהו מכם משתמש במשהו, יכול להמליץ עליו (או להמליץ נגדו)

ב) האם יש לכם נסיון עם Tesseract שכולם מתבססים עליו, בקריאת מסמכים בעברית? באנגלית יש לי ניסיון טוב יחסית איתו. האם יש לכם OCR אחר להמליץ עליו?

תודה
Anonymous - 23/08/2020 - 07:57
נושא ההודעה: Re: מערכת לסריקת וניהול מסמכים
לינוקסאי אלמונימי :
ב) האם יש לכם נסיון עם Tesseract שכולם מתבססים עליו, בקריאת מסמכים בעברית? באנגלית יש לי ניסיון טוב יחסית איתו. האם יש לכם OCR אחר להמליץ עליו? ב) האם יש לכם נסיון עם Tesseract שכולם מתבססים עליו, בקריאת מסמכים בעברית? באנגלית יש לי ניסיון טוב יחסית איתו. האם יש לכם OCR אחר להמליץ עליו?

השתמשתי בעבר ב-tesseract לקריאה של דוחות - משהו כמו טבלה עם עמודות של מספר ת.ז. ושם. ככל שאני זוכר הוא עבד טוב מאד עם רמת זיהוי נכון של קרוב ל-100%.
oz_nahum - 23/08/2020 - 09:02
נושא ההודעה:
Paperless מאוד פשוטה לשימוש ביתי. ממליץ לך בחום. MayanEdms ,גם פשוט להתקנה.
כל הזמנים הם GMT + 2 שעות