ווטסאפ - לינוקס, BSD, קוד פתוח ותוכנה חופשית בעברית. Whatsup - Linux, BSD, open source and free software in Hebrew

 
 
  כניסת חברים · רישום · שכחתי סיסמה  
tux the penguin
תגובה לנושא
צפיה בנושא הבא Printable version התחבר כדי לבדוק הודעות פרטיות צפיה בנושא הקודם
queencyלא בפורום כעת ת.הצטרפות: 13/11/2008 · הודעות: 2139 ·
 

הודעה פורסם: 18/06/2015 - 22:07
נושא ההודעה: האם יש TEXT TO SPEECH בעברית (רצוי אופן סורס) ל"ת


_________________
מערכת: GNU/Linux debian
 
 צפיה בפרופיל המשתמש שלח הודעה פרטית ביקור באתר המפרסם  
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
אורח · ·
 

הודעה פורסם: 19/06/2015 - 00:08
נושא ההודעה:

http://text-to-speech.imtranslator.net/translation.asp?loc=iw
 
   
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
queencyלא בפורום כעת ת.הצטרפות: 13/11/2008 · הודעות: 2139 ·
 

הודעה פורסם: 19/06/2015 - 00:21
נושא ההודעה: זהו השנקל שלי לכל המעוניין

הנכם מוזמנים לתרום להוספת מילים לקובץ המילון שהתחלתי
אני אשתדל לעדכן את הקוד שייקרא קטעים יותר גדולים ועם יותר שורות
לבינתיים לילה טוב כתבתי מספיק להיום .

למי שרוצה להנות מהקראת טקסט בעברית
יש לשמור את קטעי הקוד בשמות קבצים כמו בכותרות
ולהריץ python hebrew_read.py

הקוד פתוח תחת GPL לכל המעוניין.


קוד:

##############################################
#this is hebrew_read.py file
##############################################
import os
debug="true"

def load_dictionary():
   f=open("hebrew_fonetic.lang","r")
   data=f.readlines()
   data = [x for x in data if "#" not in x]
   print data
   dic={}
   for x in data:
      y = x.split("=")
      y[0] = y[0].replace('"','')
      y[0] = y[0].replace(" ","")
      y[1] =y[1].replace("\n","")
      y[1] = y[1].lstrip().rstrip()
      y[1] = y[1].replace('"','')
      dic[y[0]]=y[1]
   
   if debug:
      print "dictionary:\n"
      for x in dic.keys():
         print x,"   :",repr(x),"   :",dic[x]
      print "\n"
   return dic


def load_stream():
   t=open("my_stream.txt","r")
   s=t.readlines()
   s=[x for x in s if "#" not in x]
   print s
   n=[]
   for x in s:
      x=x.replace(",","")
      for y in x.split(" "):
         n.append(y)

   if debug:
      print "\n","the stream is:"
      for x in n:
         print x,"  ",repr(x)
   return n


def render_stream_out(dic,n):
   p=r"spd-say '"
   for x in n:
      if x in dic.keys():
         p = p + dic[x]+"       "
      else:
         pass
   p = p +"'"
   return p


my_dic = load_dictionary()
txt_stream = load_stream()
strout = render_stream_out(my_dic,txt_stream)
os.system(strout)
##############################################
#end of hebrew_read.py file
##############################################



קוד:

##############################################
#this is my_stream.txt file#
##############################################
יניב הראל מנהל את קבוצת פתרונות, הסייבר בתחום
 
##############################################
#end of my_stream file#
##############################################




קוד:

##############################################
#this is hebrew_fonetic.lang file#
##############################################
"יניב" = "ya niv"
"הראל" = "har el"
"מנהל" = "me na hel"
"קבוצת" = "kvu zat"
"פתרונות" = "pit ro not"
"בתחום" = "hat hum"
"הסייבר" = "ha sai ber"
"את" = "et"
##############################################
#end of hebrew_fonetic.lang file#
##############################################

_________________
מערכת: GNU/Linux debian
 
 צפיה בפרופיל המשתמש שלח הודעה פרטית ביקור באתר המפרסם  
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
elcucoלא בפורום כעת ת.הצטרפות: 14/10/2003 · הודעות: 6255 ·
 

הודעה פורסם: 19/06/2015 - 10:09
נושא ההודעה:

עדיף שלתמד את הסקריפט שלך לנחש עיצורים בהברות מאשר מילים. ככה הוא יוכל להתמודד עם מילים שהוא לא מכיר.

הקיצר - הפיתרון שלך לא סקאלבילי.
 
 צפיה בפרופיל המשתמש שלח הודעה פרטית  
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
kzamirלא בפורום כעת ת.הצטרפות: 25/12/2004 · הודעות: 76 ·
 

הודעה פורסם: 19/06/2015 - 11:03
נושא ההודעה:

גם אם הפתרון לא אידאלי (צריך להוסיף תמיכה בעברית במנועי הדיבור עצמם ... ) הוא נחמד ושימושי.

שני השנקל שלי:

שנקל ראשון:
מקסים יורש אסף מילונים מכמה מקורות
http://culmus.sourceforge.net/dictionary/index.html
http://sourceforge.net/projects/culmus/files/language_tools/dictionary/20140925/

בקבצים שהוא אסף מפרוייקט מילה תחת תג xml בשם pronunciation יש תאור של הגיה
בקבצים שהוא אסף מהויקי מילון יש תבנית [ הגייה= ] שלפעמים מכילה תאור של הגיה
בכל המילון יש ניקוד שאפשר להפוך לתאורי הגיה בצורה אוטומאטית

שנקל שני:
שים ב github או במקום אחר שיהיה קל לאנשים לעזור ולהוסיף מילים ושיפורים אחרים.
 
 צפיה בפרופיל המשתמש שלח הודעה פרטית ביקור באתר המפרסם  
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
ik_5לא בפורום כעת ת.הצטרפות: 16/04/2002 · הודעות: 3027 · מיקום: ישראל
 

הודעה פורסם: 19/06/2015 - 12:29
נושא ההודעה:

מאוד לא קל ליצור TTS בעברית, היות ויכולה להיות לך אותה מילה עם 2 צורות הגייה, למשל "את", יכולה להפנות למשהי, וגם להיות המילה with, ואז זה אומר שעכשיו צריך "לנחש" קונוטציה וכיוב'...


אין פתרונות טובים לעברית בקוד פתוח.

מבחינה מסחרית, יש לך את neuance שהם הכי "חזקים" בשוק ה ASR ו TTS, אבל יקרים רצח.

יש לך עוד חברה ישראלית שאני עובד איתם בשם עלמגו, שהם לא מושלמים, המנוע רץ על ווינדוז, אבל ממש סבבה איתם.
 
 צפיה בפרופיל המשתמש שלח הודעה פרטית ביקור באתר המפרסם  
תגובה  עם ציטוט חזרה למעלה
חזרה לתוכן הדיון
הצגת הודעות מלפני:     
מעבר אל:  
כל הזמנים הם GMT + 2 שעות
תגובה לנושא
צפיה בנושא הבא Printable version התחבר כדי לבדוק הודעות פרטיות צפיה בנושא הקודם
PNphpBB2 © 2003-2004 

תוכן הדיון

  1. queency
  2. אורח
  3. queency
  4. elcuco
  5. kzamir
  6. ik_5