פורסם: 29/02/2004 - 15:37
נושא ההודעה:
|
אני פתחתי את הפרוייקט. לא העלתי את המילון הסרוק היות שאני לא בטוח עדיין מה הם הזכיויות לגביו, בעוד מספר ימים אני אמור לקבל אותו שוב ואז לוודא שהוא ברשות הכלל.
אין בעיה להגיע לעמוד הפרוייקט, אך אין עדיין מה לראות בו.
_________________ איזי גולדנברג
|
|
חזרה לתוכן הדיון |
פורסם: 29/02/2004 - 15:43
נושא ההודעה:
|
רק רגע, אז סתם פתחתם 2 פרויקטים? באיזה אחד נשתמש? כדאי להחליט לפני שמעלים משהו אליהם...
אני בכל מקרה נרשמתי כבר לberliOS ,איך מצטרפים לפרוייקט?
ורונן: למה שGFDL לא יתאים?
בהצלחה,
משה
|
|
חזרה לתוכן הדיון |
פורסם: 29/02/2004 - 15:45
נושא ההודעה:
|
אני לא משפטן, ו-GFDL מטיל כל מני מגבלות על השימוש שעלולות להוות יריה ברגל...
|
|
חזרה לתוכן הדיון |
פורסם: 29/02/2004 - 22:09
נושא ההודעה:
|
ה GFDL לא מתאים ולו בגלל שהוא רשיון שנוגע לתיעוד, ולא למאגר מידע כפי שמילון אמור להיות.
לפי המלצת פרוייקט ה GNU, רשיון מתאים למידע יכול להיות:
http://www.gnu.org/philosophy/license-list.html#OtherLicenses
מעיון בתיאורים של הארבעה, עושה רושם שה GPL יכול לשמש למטרה זו, כל עוד מוגדר במפורש מהו "קוד מקור" (למשל בסיס הנתונים בפורמט פתוח).
בכל מקרה, המלצתי היא שלא תציעו רשיון בשלב זה, כי מה שיקרה זה שהם ישר יעבירו את זה ליועץ המשפטי שלהם ולא תשמעו מהם מילה בשנתיים הקרובות. קודם שיסכימו על העיקרון, ואת התנאים אפשר לסגור לאחר מכן.
|
|
חזרה לתוכן הדיון |
פורסם: 06/03/2004 - 20:07
נושא ההודעה:
|
אם כך אנו חוזרים ל:
ציטוט: |
לכבוד:
האקדמיה ללשון העברית
ת"ד 3449
ירושלים 91034
הנידון: שימוש במאגר המונחים שבאתר האקדמיה ללשון עברית.
א.ג.נ.
בימים אלו מתארגנת יוזמה לכינונו של אגרון (מילון?/מאגר מונחים?) עברי-אנגלי-עברי חופשי המיועד לשימושם של דוברי העברית באשר הם, בתוכנות כגון "אופן אופיס" (open office.org, שתורגם לאחרונה ביוזמת משרד האוצר) ותוכנות חופשיות אחרות.
לשם כך, אנו מבקשים מכם את הרשות להשתמש במאגר המונחים המצוי באתר האקדמיה. כמו כן, נשמח אם תסכימו לספק לנו את מסד הנתונים המאכסן את מאגר המונחים הנ"ל. במידה ונקבל את אישורכם, אך אין לכם האפשרות הטכנית להעמיד לרשותינו את מאגר המידע, אנו נדלה מידע זה בעצמנו.
לשם הבהרה: לשימוש במידע, הכוונה היא להעתקתו לבסיס נתונים ממוחשב, שאנו ניצור, כתיבת תוכנות לחיפוש וגישה למאגר זה והעתקתו לכל דורש, ללא תנאים מגבילים.
בכבוד רב,
ובתודה מראש,
רונן אברבנאל
כתובת וכאלו
ronen@tx.technion.ac.il
|
[/quote]
|
|
חזרה לתוכן הדיון |
פורסם: 19/03/2004 - 01:16
נושא ההודעה: גם אני מוכן לעזור!
|
אני לומד בגבעת רם, אז אם אתם צריכים מהאקדמיה משהו פיזי, תשלחו דואל ל:
sattath cs huji ac il. (תשלימו את החסר).
ועוד הערה קטנה...
לא שאני מבין גדול בשפה העברית, אך נראה לי שהיה נחמד מאוד לו היה ניתן להקליד, נניח, "הלכתי" ולקבל את הפירוש למילה באנגלית... איך שאני רואה את זה, כרגע, אם עובדים עם המנגנון של מילון רגיל, אז צריך להקליד הלכ ,שזה (למיטב ידיעתי) השורש של הפועל, מה שהופך את כל השימוש למסורבל, ולא פשוט למי שלא בקיא בחוקי הדיקדוק הרבים.
נראה לי שבאלגוריתם שהשתמשו ב- HSPELL יש טיפול נרחב מאוד בנושא זה.
בכל מקרה, לדעתי, הפרויקט חיוני! אני מאוד מתבאס שאני צריך להשתמש ב wordtrans המסריח כל פעם...
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2004 - 22:41
נושא ההודעה:
|
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2004 - 22:55
נושא ההודעה:
|
אפשר להזכיר גם את הפרוייקט wikitionary שדי מת בשפה העברית:
http://tinyurl.com/5aenk
המילון ב wikitionary אגב, הוא עברי-עברי.
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2004 - 22:58
נושא ההודעה:
|
אז אתה זה שהקפיץ את הדיון העתיק הזה... אחחח, הנוסטלגיה...
בכל מקרה, הייתי שמח לעזור, אבל שבועיים עד תחילת הלימודים לא משאירים לי המון זמן. זה באמת יכול להיות מאוד מוצלח, אבל , כדי שלא יקרה לפרוייקט מה שקורה לכל מיני פרוייקט אחר שנמוג עם הזמן (ע"ע לינברו, ועוד רבים אחרים), צריך להיות מסודרים... צריך גרעין קשה גדול שתמיד יהיו בו כמה פעילים שיש להם זמן, וצריך כמובן להחליט כבר מה עושים ואיך, ואז יש סיכוי שזה יעבוד.
משה
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2004 - 23:00
נושא ההודעה:
|
עידו : | http://tinyurl.com/5aenk |
אפשר גם: http://he.wiktionary.org/wiki
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2004 - 23:00
נושא ההודעה:
|
כפי שכתבתי בעבר המילון המדובר סרוק אצלי(וגם המקור לעוד מספר ימים), יש לבדוק שהמילון המדובר אכן ברשות הכלל (Public domain) ואז להעלות את התמונות לאתר. המילון שברשותי הוא מהדורה הכוללת תוספות, האם יש ל"ספור" שבעים שנים מיום הוספת התוספות?
בהמשך יש למצוא דרך בה ניתן בצורה נוחה כל שהיא להקליד את הערכים, וכפי שהציע מקסים רצוי מנוקד.
_________________ איזי גולדנברג
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2004 - 23:04
נושא ההודעה:
|
COM64 : | בהמשך יש למצוא דרך בה ניתן בצורה נוחה כל שהיא להקליד את הערכים, וכפי שהציע מקסים רצוי מנוקד. |
מה לגבי זה:
http://www.tapuz.co.il/tapuzforum/main/Viewmsg.asp?forum=236&msgid=37126340
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2004 - 23:35
נושא ההודעה:
|
COM64 : | כפי שכתבתי בעבר המילון המדובר סרוק אצלי(וגם המקור לעוד מספר ימים), יש לבדוק שהמילון המדובר אכן ברשות הכלל (Public domain) ואז להעלות את התמונות לאתר. המילון שברשותי הוא מהדורה הכוללת תוספות, האם יש ל"ספור" שבעים שנים מיום הוספת התוספות?
|
http://www.law-world.liveiis.com/Courses/99307/307-notebook-tau-2001-oren%20dvir.doc
ציטוט: |
כל זכויות קניין רוחני מוגבלות בזמן למעט סימן מסחר. זכות יוצרים היתה לתקופה של ימי חיי היוצר +50 שנה. הדבר תוקן ע"י הכנסת בשנות ה- 70, ונקבע שהזכות היא לתקופה של ימי חיי היוצר +70 שנה. Pma 70 – post mortom anea.
...
לא תמיד היוצר הוא הבעלים של זכות יוצרים, לעתים הוא מלכתחילה לא הבעלים, למשל ביחסי עובד מעביד, ולעתים הוא מעביר את זכותו למו"ל. הכלל עדיין נשאר ותמיד מונים את תקופת הזכות לפי חיי היוצר ולא לפי חיי בעל הזכות.
...
|
לפי הגדרה זו, נראה שאין משמעות להוצאת מהדורות חדשות, ובכל מקרה ספירת 70 השנים מתחילה מיום מותו של היוצר.
כפי שצויין קודם, ולדשטיין (המחבר) נפטר ב1932 ולכן נראה שהמילון ברשות הציבור החל מ 2002.
אם על התוספות חתום מישהו אחר, יתכן שיש בעיה מאחר ואז עלול להיות קשה להבדיל בין המקור (שכנראה ברשות הציבור) והשינויים.
* הכתוב אינו חוות דעת משפטית
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2004 - 23:53
נושא ההודעה:
|
שלחתי שאלה בנוגע לזכויות היוצרים לפורום חוק ומשפט בתפוז, נקווה שתתקבל תשובה שתפתור את התעלומה:
http://www.tapuz.co.il/tapuzforum/main/Viewmsg.asp?forum=145&msgid=37131587
|
|
חזרה לתוכן הדיון |
פורסם: 16/08/2004 - 01:49
נושא ההודעה: אשמח להצטרף !
|
קודם כל סחתיין על היוזמה...
אשמח מאוד להצטרף לכל תפקיד (כותב, מגיה או טסטר) שידרש, ולשם כך אפנה לCOM64 כפניה אישית.
לא ברור לי למה אנו זקוקים לתוכנת OCR חופשית בלבד (אם בכלל נשתמש באופציה של OCR). לדעתי אין בעיה של זכויות יוצרים לגבי פלט של OCR גם בם התוכנה אינה חופשית, ואם יש למישהו עותק חוקי זה יכול לעבוד.
ישר כח,
אדם
|
|
חזרה לתוכן הדיון |
פורסם: 16/08/2004 - 07:56
נושא ההודעה: Re: גם אני מוכן לעזור!
|
אס : |
ועוד הערה קטנה...
לא שאני מבין גדול בשפה העברית, אך נראה לי שהיה נחמד מאוד לו היה ניתן להקליד, נניח, "הלכתי" ולקבל את הפירוש למילה באנגלית... איך שאני רואה את זה, כרגע, אם עובדים עם המנגנון של מילון רגיל, אז צריך להקליד הלכ ,שזה (למיטב ידיעתי) השורש של הפועל, מה שהופך את כל השימוש למסורבל, ולא פשוט למי שלא בקיא בחוקי הדיקדוק הרבים.
|
יש לי רעיון קטן.
עד כמה שאני זוכר, בעברית יש שבעה בניינים (פעל, פיעל, פועל, הפעיל, הופעל, נפעל והתפעל) שמוטים בעשרה גופים (אני, אנחנו, אתה, את, אתם, אתן, הוא, היא, הם, והן). בשלושה זמנים עיקריים.
7*10*3=210
לדעתי אפשר לכתוב טופס web שמקבל שורש בן שלוש או ארבע אותיות ובונה את מאתיים ועשר האפשרויות. ליד כל אפשריות תהיה תיבת סימון ע"מ לאשר את נכונות הצורה.
אפשר לבנות רוטינות לשינוי אוטומטי לחריגים נפוצים (כמו שיכול אותיות בהתפעל, כאשר לדוגמא בשורש ס.ר.ק. ההטיה הופכת מהתסרק להסתרק) וכמובן חריגים מתקדמים יותר יוקלדו ידנית ליד ההצעה הממוחשבת.
הזנת פועל במילון הסופי תניב את השורש, הבנייין, הגוף והזמן (גם בתרגום האנגלי).
נראה הגיוני ?
|
|
חזרה לתוכן הדיון |
פורסם: 16/08/2004 - 09:36
נושא ההודעה: Re: גם אני מוכן לעזור!
|
FitzRoy : | אס : |
ועוד הערה קטנה...
לא שאני מבין גדול בשפה העברית, אך נראה לי שהיה נחמד מאוד לו היה ניתן להקליד, נניח, "הלכתי" ולקבל את הפירוש למילה באנגלית... איך שאני רואה את זה, כרגע, אם עובדים עם המנגנון של מילון רגיל, אז צריך להקליד הלכ ,שזה (למיטב ידיעתי) השורש של הפועל, מה שהופך את כל השימוש למסורבל, ולא פשוט למי שלא בקיא בחוקי הדיקדוק הרבים.
|
יש לי רעיון קטן.
עד כמה שאני זוכר, בעברית יש שבעה בניינים (פעל, פיעל, פועל, הפעיל, הופעל, נפעל והתפעל) שמוטים בעשרה גופים (אני, אנחנו, אתה, את, אתם, אתן, הוא, היא, הם, והן). בשלושה זמנים עיקריים.
7*10*3=210
לדעתי אפשר לכתוב טופס web שמקבל שורש בן שלוש או ארבע אותיות ובונה את מאתיים ועשר האפשרויות. ליד כל אפשריות תהיה תיבת סימון ע"מ לאשר את נכונות הצורה.
אפשר לבנות רוטינות לשינוי אוטומטי לחריגים נפוצים (כמו שיכול אותיות בהתפעל, כאשר לדוגמא בשורש ס.ר.ק. ההטיה הופכת מהתסרק להסתרק) וכמובן חריגים מתקדמים יותר יוקלדו ידנית ליד ההצעה הממוחשבת.
הזנת פועל במילון הסופי תניב את השורש, הבנייין, הגוף והזמן (גם בתרגום האנגלי).
נראה הגיוני ? |
הפיתרון הכי פשוט (מתכנתים הם עם עצלן...) הוא להשתמש בPRASE שיצר נדב רותם ב-OTS (תוכנת הסיכום שלו) שם יש שימוש ב"מילונים" שיש בהם כללים לחיתוך מילים ככה ש"אכל" "אכלתי" ו"אכלה" יוצאים לאחר חיתוך באותה צורה ("אכל") יתרון נוסף הוא שגם ה"מילון" העברי וגם האנגלי כבר קיימים... (המילונים הם בצורת XML)
_________________
|
|
חזרה לתוכן הדיון |
פורסם: 16/08/2004 - 11:03
נושא ההודעה: מציאת שורש
|
נחמד מאוד... אשמח לראות מתישהו את הפרוייקט ולנסות להבין באיזו שיטה הוא השתמש.
בכל אופן אני מוכן לעזור בכל דרך אחרת.
|
|
חזרה לתוכן הדיון |
פורסם: 16/08/2004 - 11:31
נושא ההודעה:
|
או לחילופין לשאול את מפתחי hspell - אולי הם לא שומרים את כל ההטיות אלא יש להם שיטה חכמה לנושא.
|
|
חזרה לתוכן הדיון |
פורסם: 16/08/2004 - 11:46
נושא ההודעה:
|
Anonymous : | או לחילופין לשאול את מפתחי hspell - אולי הם לא שומרים את כל ההטיות אלא יש להם שיטה חכמה לנושא. |
בוודאי! Hspell בונה את האוסף המלא של הנטיות ממילות בסיס (שורש+בניין, שם-עצם בסיסי, וכו') ורמזים שונים הדרושים לנטייה (צורת הרבים של "עוף" הוא "עופות" אבל של "קוף" הוא "קופים"). ניתן להשתמש במידע והנתונים של hspell להרחבת המילון שאתם מתכננים לכל הנטיות של מילה מסוימת.
אם אתם עדיין לא מכירים את יכולות hspell המלאות (הכולל ניתוח צורני מלא, לא רק בודק איות), ולא בא לכם להתקין את החבילה, אני ממליץ על ההדגמה המקוונת, באתר http://wassist.cs.technion.ac.il/~danken/cgi-bin/hspell.cgi (סמנו "עם מידע לשוני").
רק בבקשה, זכרו: Hspell איננה public domain, היא GPL. יכולות להיות לכך השלחות על רשיון המילון אם הוא מבוסס על hspell (אך אין לכך שום השלכות אם רק ממשק-המשתמש של החיפוש במילון ישתמש ב hspell).
|
|
חזרה לתוכן הדיון |
פורסם: 17/08/2004 - 01:08
נושא ההודעה:
|
COM64 : | כפי שכתבתי בעבר המילון המדובר סרוק אצלי(וגם המקור לעוד מספר ימים), יש לבדוק שהמילון המדובר אכן ברשות הכלל (Public domain) ואז להעלות את התמונות לאתר. המילון שברשותי הוא מהדורה הכוללת תוספות, האם יש ל"ספור" שבעים שנים מיום הוספת התוספות?
בהמשך יש למצוא דרך בה ניתן בצורה נוחה כל שהיא להקליד את הערכים, וכפי שהציע מקסים רצוי מנוקד. |
ראה את התשובה שקיבלתי:
http://www.tapuz.co.il/tapuzforum/main/Viewmsg.asp?forum=145&msgid=37169587
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2005 - 13:48
נושא ההודעה:
|
איך הפרויקט מתקדם ?
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2005 - 17:05
נושא ההודעה: בהחלט.
|
רוצים כבר את הסריקות
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2005 - 17:30
נושא ההודעה:
|
הסריקות נמצאות אצל מקסים, אבל כנראה שאסור להשתמש בהן היות שהן מהמהודרה שיצאה ב־1950.
אם מישהו יודע על ספריה שמחזיקה את המילון המקורי משנת 1932 אני מוכן לסרוק אותו שוב.
_________________ איזי גולדנברג
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2005 - 18:29
נושא ההודעה:
|
אולי אפשר לדבר עם היורשים, עם ההוצאה או עם אקו"ם? אני בספק אם בעלי זכויות היוצרים, אם יש כאלה, לא יסכימו לקיום פרוייקט התנדבותי כזה.
_________________ קוד: | $ uname --operating-system
GNU/Linux |
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2005 - 19:13
נושא ההודעה:
|
COM64 : | הסריקות נמצאות אצל מקסים, אבל כנראה שאסור להשתמש בהן היות שהן מהמהודרה שיצאה ב־1950.
אם מישהו יודע על ספריה שמחזיקה את המילון המקורי משנת 1932 אני מוכן לסרוק אותו שוב. |
לא בטוח. האם הסריקות כוללות דפי מבוא שצורפו ב-1950? האם בדפי המבוא רשום מה השינויים שבוצעו במהדורה המחודשת, ואם כן האם מדובר בעריכה מאסיבית או בשינויים קוסמטיים? האם מצויינים שמות של עורכים שהיו מעורבים במהדורה החדשה, או שהקרדיט ניתן כולו ליוצר המקורי?
אם דפי המבוא האלו קיימים, אפשר לפנות לייעוץ משפטי ולבדוק את הסטטוס של המהדורה החדשה.
|
|
חזרה לתוכן הדיון |
פורסם: 15/08/2005 - 23:05
נושא ההודעה:
|
אני לא זוכר שראיתי במילון מה הוסף או שונה מהמילון המקורי, יתכן שאני טועה היות שעברו די הרבה חודשים מאז שהמילון היה אצלי.
בכל מקרה, במקום להתעסק עם משפטנים פשוט יותר, אני לפחות מקווה, למצוא את המילון המקורי ולסרוק אותו.
|
|
חזרה לתוכן הדיון |
פורסם: 16/08/2005 - 00:29
נושא ההודעה: סריקות של מילון
|
COM64 העביר לי תקליטור עם סריקות, אבל חסרים שם כמאה עמודים. כמו כן, מההערות לעיל אני מבין שמדובר במהדורת 1950. אני חושב שלא ניתן להשתמש במהדורה זו, כי סביר להניח שהיא כוללת תוספות שהוכנסות לאחר מותו של המחבר הראשי ע"י עורכים אחרים, ויהיה זה קשה להפריד ביניהם לבין המילון המקורי שהוא ברשות הציבור.
אני מאמין שיש לסרוק את המילון במהדורה של שנת 1932. באוניברסיטת בר-אילן קיימת מהדורה משנת 1930 (שזה כנראה אותו דבר).
מקסים.
|
|
חזרה לתוכן הדיון |
פורסם: 16/08/2005 - 00:31
נושא ההודעה:
|
אגב, מספר מערכת של המילון בבר אילן - 0328506
|
|
חזרה לתוכן הדיון |
פורסם: 16/08/2005 - 11:53
נושא ההודעה:
|
אני אחפש את המילון, אנקה את האבק מהסורק ולעבודה.
_________________ איזי גולדנברג
|
|
חזרה לתוכן הדיון |
|