מצטער, התכוונתי לאגוריתם אחר (זה מה שקורה כשעונים לאנשים בזמן שמתרגמים דברים
)
האלוריתם היותר מדוייק הוא דווקא הMetaphone או Double Metaphone.
רק צריך להתאים אותו לחוקי השפה העברית.
אחת הבעיות כיום בארץ, היא שאנשים בעלי שפת אם רוסית (זו לא ביקורת רעה אלא ציון עובדה, אז בבבקשה בלי תגובות לא במקום) אינם יודעים להבחין מתי "ח" ומתי "כ" מגיעות, ואותו הדבר כלפי "ה,ע,א" או "ו" ו"ב" וכו'... וצריך ביצוע מספיק טוב שידע לטפל בבעיות כאלו.
ואני חושב שהאלגוריתם Double Metaphone אמור לתת את התשובה. כאשר כתבתי את Soundex העברי, רציתי גם לעשות גרסה של Metaphone, אבל בזמנו לא הבנתי את האלגוריתם (למרות שכיום אני דווקא כן מבין).
אתה גם מוזמן לשבת ולחקור את השפה העברית והבעיות שיש איתה, דבר שאולי יעוזר לך להגיע לפתרון אחר לגמרי מהאלגוריתם שאנחנו מדברים עליהם. אבל תזכור שאתה צריך לדעת איך לייצג צליל של מילה בניגוד לאיך שמילה נכתבת.