קוד: |
<div class="class1"> טקסט מוקרי </div> <div class="class2"> פירוש ראשון </div> <div class="class3"> פירוש שני </div> |
קוד: |
<DATA name=gmara> <block> <start=0,0> <width=10> <lenth=5> </block> <block> <start=5,0> .... </block> </DATA> <DATA name=rashi> ... </DATA> |
Inola : |
זה פרוייקט קטן? |
משה : | ||
זה בציניות? כן, אני מקווה שזה יהיה קטן כמה שאפשר. אבל, אם ידרש לזה משהו גדול, לי יש זמן, מצדי יכולה לצאת גרסת בטא בעוד שנתיים. אני לא לחוץ שזה יתממש מהר. משה |
Anonymous : |
although there is no copyright on the gmara if you want to scan a page
you need to scan it off existing gmara and there you'll get into a lot of copyright problems. I was trying to pull off something similar a while ago but everywhere I went and whoever I asked I mostly got no or we might sue you if you use it. it seems the haredim does have copyright over judisim:( |
משה : |
לגבי ההצעות לעשות את זה "דומה" לגמרא אבל לא זהה: זה בדיוק מה שאני לא רוצה לעשות. יש עניין גדול שזה יהיה זהה לחלוטין , ואם זה לא היה כל כך חשוב, לא היה שום סיבה לפרוייקט הזה. משה |
משה : |
אני רוצה לממש כבר משהו בסיסי עם תיבות טקסט, אבל עד עכשיו לא הצלחתי למצוא תיבת טקסט שהיא לא מלבנית.
מישהו מכיר דבר כזה שכבר קיים? משה |
Anonymous : |
- הקלדה זה דבר רצחני. לבר-אילן אולי יש מימון, לי אין. הרעיון שלי אמור לאפשר שימוש בocr , גם לא דבר שבן-אדם עושה בקלות, אבל הרבה פחות מהקלדה. |
landmn : | ||
למיטב ידיעתי, אתה טועה לחלוטין. נניח שה-OCR בעל יכולת זיהוי של 99% (למיטב ידיעתי, OCR באנגלית בקושי מגיע לזה. קל-וחומר OCR לעברית) - המשמעות היא שיש לך טעות אחת בכל מאה אותיות! כיון שבדף גמרא יש אלפי אותיות. יהיו לך עשרות טעויות לגלות בכל דף. כדי לגלות אותן, אתה צריך המון שעות עבודה של כוח אדם איכותי. אם יהיה לך מילון מוצלח מאד לארמית (!) כולל הטיות וקיצורים וכו', תוכל אולי לצמצם את הטעויות בחצי. זה עדיין משאיר אותך עם עשרות טעויות שדורשות הגהה קפדנית. אגב, לבר-אילן יש מנוע מצויין של הטיות מילים בעברית וארמית שהוא בסיס החיפוש בתקליטור, אבל משמש מן הסתם גם להגהת החומר המוזן. (נדמה לי שמפתח של התוכנה שדיברתי איתו לפני שנים דיבר על הקלדה של החומר, אולי אפילו בחו"ל, אבל אני לא זוכר בבירור). |