ווטסאפ - לינוקס, BSD, קוד פתוח ותוכנה חופשית בעברית. Whatsup - Linux, BSD, open source and free software in Hebrew

 
 
  כניסת חברים · רישום · שכחתי סיסמה  
tux the penguin
תגובה לנושא
צפיה בנושא הבא Printable version התחבר כדי לבדוק הודעות פרטיות צפיה בנושא הקודם
החיד"האורח · ·
 

הודעה פורסם: 26/12/2014 - 13:24
נושא ההודעה: OCR בעברית

יש לי סריקה של ספר הלכה מלפני 20 שנה שהדפוס שלו ברור וקריא. (גם בפורמט PDF וגם בפורמט jpg)
האם יש תוכנת OCR בלינוקס שאני יכול להפעיל על 150 עמודים בעברית והיא תוציא לי קובץ TXT או Doc שמכיל את הספר?
 
   
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
לולילא בפורום כעת ת.הצטרפות: 25/11/2005 · הודעות: 2257 ·
 

הודעה פורסם: 26/12/2014 - 13:55
נושא ההודעה:

כן - hocr. אני משתמש בה כל הזמן. ראה כאן:
https://github.com/tmbdev/hocr-tools
וגם כאן:
http://linmagazine.co.il/desktop/2009/06/07/sml/hebrew-ocr#.VJ1KcTCSgA
וההמשך:
http://linmagazine.co.il/desktop/2009/06/13/sml/hebrew-ocr#.VJ1MJjCSgA
 
 צפיה בפרופיל המשתמש שלח הודעה פרטית ביקור באתר המפרסם  
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
kzamirלא בפורום כעת ת.הצטרפות: 25/12/2004 · הודעות: 76 ·
 

הודעה פורסם: 26/12/2014 - 16:18
נושא ההודעה:

הי,
כדי להתקין את hocr בדביאן:
קוד:
apt-get install hocr-gtk


נ.ב.
כאשר דיאגו לקח על עצמו את המשך הפיתוח הוא שינה את השם ל hebocr כדי למנוע בילבול עם hocr-tools של גוגל.
הקוד:
https://code.google.com/p/hebocr/
https://code.google.com/p/qhocr/
 
 צפיה בפרופיל המשתמש שלח הודעה פרטית ביקור באתר המפרסם  
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
עמיתאורח · ·
 

הודעה פורסם: 27/12/2014 - 11:57
נושא ההודעה:

נסה גם את tesseract. לי היא נתנה תוצאות טובות.

קוד:
tesseract mytext.png heb5 -l heb
 
   
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
הצגת הודעות מלפני:     
מעבר אל:  
כל הזמנים הם GMT + 2 שעות
תגובה לנושא
צפיה בנושא הבא Printable version התחבר כדי לבדוק הודעות פרטיות צפיה בנושא הקודם
PNphpBB2 © 2003-2004 

תוכן הדיון

  1. אורח [החיד"ה]
  2. לולי
  3. kzamir
  4. אורח [עמית]