798 lines
9.6 KiB
Python
798 lines
9.6 KiB
Python
|
|
# punctuation = ['!', '?', '…', ",", ".","@"]#@是SP停顿
|
|||
|
|
punctuation = ["!", "?", "…", ",", "."] # @是SP停顿
|
|||
|
|
punctuation.append("-")
|
|||
|
|
pu_symbols = punctuation + ["SP", "SP2", "SP3", "UNK"]
|
|||
|
|
# pu_symbols = punctuation + ["SP", 'SP2', 'SP3','SP4', "UNK"]
|
|||
|
|
pad = "_"
|
|||
|
|
|
|||
|
|
c = [
|
|||
|
|
"AA",
|
|||
|
|
"EE",
|
|||
|
|
"OO",
|
|||
|
|
"b",
|
|||
|
|
"c",
|
|||
|
|
"ch",
|
|||
|
|
"d",
|
|||
|
|
"f",
|
|||
|
|
"g",
|
|||
|
|
"h",
|
|||
|
|
"j",
|
|||
|
|
"k",
|
|||
|
|
"l",
|
|||
|
|
"m",
|
|||
|
|
"n",
|
|||
|
|
"p",
|
|||
|
|
"q",
|
|||
|
|
"r",
|
|||
|
|
"s",
|
|||
|
|
"sh",
|
|||
|
|
"t",
|
|||
|
|
"w",
|
|||
|
|
"x",
|
|||
|
|
"y",
|
|||
|
|
"z",
|
|||
|
|
"zh",
|
|||
|
|
]
|
|||
|
|
v = [
|
|||
|
|
"E1",
|
|||
|
|
"En1",
|
|||
|
|
"a1",
|
|||
|
|
"ai1",
|
|||
|
|
"an1",
|
|||
|
|
"ang1",
|
|||
|
|
"ao1",
|
|||
|
|
"e1",
|
|||
|
|
"ei1",
|
|||
|
|
"en1",
|
|||
|
|
"eng1",
|
|||
|
|
"er1",
|
|||
|
|
"i1",
|
|||
|
|
"i01",
|
|||
|
|
"ia1",
|
|||
|
|
"ian1",
|
|||
|
|
"iang1",
|
|||
|
|
"iao1",
|
|||
|
|
"ie1",
|
|||
|
|
"in1",
|
|||
|
|
"ing1",
|
|||
|
|
"iong1",
|
|||
|
|
"ir1",
|
|||
|
|
"iu1",
|
|||
|
|
"o1",
|
|||
|
|
"ong1",
|
|||
|
|
"ou1",
|
|||
|
|
"u1",
|
|||
|
|
"ua1",
|
|||
|
|
"uai1",
|
|||
|
|
"uan1",
|
|||
|
|
"uang1",
|
|||
|
|
"ui1",
|
|||
|
|
"un1",
|
|||
|
|
"uo1",
|
|||
|
|
"v1",
|
|||
|
|
"van1",
|
|||
|
|
"ve1",
|
|||
|
|
"vn1",
|
|||
|
|
"E2",
|
|||
|
|
"En2",
|
|||
|
|
"a2",
|
|||
|
|
"ai2",
|
|||
|
|
"an2",
|
|||
|
|
"ang2",
|
|||
|
|
"ao2",
|
|||
|
|
"e2",
|
|||
|
|
"ei2",
|
|||
|
|
"en2",
|
|||
|
|
"eng2",
|
|||
|
|
"er2",
|
|||
|
|
"i2",
|
|||
|
|
"i02",
|
|||
|
|
"ia2",
|
|||
|
|
"ian2",
|
|||
|
|
"iang2",
|
|||
|
|
"iao2",
|
|||
|
|
"ie2",
|
|||
|
|
"in2",
|
|||
|
|
"ing2",
|
|||
|
|
"iong2",
|
|||
|
|
"ir2",
|
|||
|
|
"iu2",
|
|||
|
|
"o2",
|
|||
|
|
"ong2",
|
|||
|
|
"ou2",
|
|||
|
|
"u2",
|
|||
|
|
"ua2",
|
|||
|
|
"uai2",
|
|||
|
|
"uan2",
|
|||
|
|
"uang2",
|
|||
|
|
"ui2",
|
|||
|
|
"un2",
|
|||
|
|
"uo2",
|
|||
|
|
"v2",
|
|||
|
|
"van2",
|
|||
|
|
"ve2",
|
|||
|
|
"vn2",
|
|||
|
|
"E3",
|
|||
|
|
"En3",
|
|||
|
|
"a3",
|
|||
|
|
"ai3",
|
|||
|
|
"an3",
|
|||
|
|
"ang3",
|
|||
|
|
"ao3",
|
|||
|
|
"e3",
|
|||
|
|
"ei3",
|
|||
|
|
"en3",
|
|||
|
|
"eng3",
|
|||
|
|
"er3",
|
|||
|
|
"i3",
|
|||
|
|
"i03",
|
|||
|
|
"ia3",
|
|||
|
|
"ian3",
|
|||
|
|
"iang3",
|
|||
|
|
"iao3",
|
|||
|
|
"ie3",
|
|||
|
|
"in3",
|
|||
|
|
"ing3",
|
|||
|
|
"iong3",
|
|||
|
|
"ir3",
|
|||
|
|
"iu3",
|
|||
|
|
"o3",
|
|||
|
|
"ong3",
|
|||
|
|
"ou3",
|
|||
|
|
"u3",
|
|||
|
|
"ua3",
|
|||
|
|
"uai3",
|
|||
|
|
"uan3",
|
|||
|
|
"uang3",
|
|||
|
|
"ui3",
|
|||
|
|
"un3",
|
|||
|
|
"uo3",
|
|||
|
|
"v3",
|
|||
|
|
"van3",
|
|||
|
|
"ve3",
|
|||
|
|
"vn3",
|
|||
|
|
"E4",
|
|||
|
|
"En4",
|
|||
|
|
"a4",
|
|||
|
|
"ai4",
|
|||
|
|
"an4",
|
|||
|
|
"ang4",
|
|||
|
|
"ao4",
|
|||
|
|
"e4",
|
|||
|
|
"ei4",
|
|||
|
|
"en4",
|
|||
|
|
"eng4",
|
|||
|
|
"er4",
|
|||
|
|
"i4",
|
|||
|
|
"i04",
|
|||
|
|
"ia4",
|
|||
|
|
"ian4",
|
|||
|
|
"iang4",
|
|||
|
|
"iao4",
|
|||
|
|
"ie4",
|
|||
|
|
"in4",
|
|||
|
|
"ing4",
|
|||
|
|
"iong4",
|
|||
|
|
"ir4",
|
|||
|
|
"iu4",
|
|||
|
|
"o4",
|
|||
|
|
"ong4",
|
|||
|
|
"ou4",
|
|||
|
|
"u4",
|
|||
|
|
"ua4",
|
|||
|
|
"uai4",
|
|||
|
|
"uan4",
|
|||
|
|
"uang4",
|
|||
|
|
"ui4",
|
|||
|
|
"un4",
|
|||
|
|
"uo4",
|
|||
|
|
"v4",
|
|||
|
|
"van4",
|
|||
|
|
"ve4",
|
|||
|
|
"vn4",
|
|||
|
|
"E5",
|
|||
|
|
"En5",
|
|||
|
|
"a5",
|
|||
|
|
"ai5",
|
|||
|
|
"an5",
|
|||
|
|
"ang5",
|
|||
|
|
"ao5",
|
|||
|
|
"e5",
|
|||
|
|
"ei5",
|
|||
|
|
"en5",
|
|||
|
|
"eng5",
|
|||
|
|
"er5",
|
|||
|
|
"i5",
|
|||
|
|
"i05",
|
|||
|
|
"ia5",
|
|||
|
|
"ian5",
|
|||
|
|
"iang5",
|
|||
|
|
"iao5",
|
|||
|
|
"ie5",
|
|||
|
|
"in5",
|
|||
|
|
"ing5",
|
|||
|
|
"iong5",
|
|||
|
|
"ir5",
|
|||
|
|
"iu5",
|
|||
|
|
"o5",
|
|||
|
|
"ong5",
|
|||
|
|
"ou5",
|
|||
|
|
"u5",
|
|||
|
|
"ua5",
|
|||
|
|
"uai5",
|
|||
|
|
"uan5",
|
|||
|
|
"uang5",
|
|||
|
|
"ui5",
|
|||
|
|
"un5",
|
|||
|
|
"uo5",
|
|||
|
|
"v5",
|
|||
|
|
"van5",
|
|||
|
|
"ve5",
|
|||
|
|
"vn5",
|
|||
|
|
]
|
|||
|
|
|
|||
|
|
v_without_tone = [
|
|||
|
|
"E",
|
|||
|
|
"En",
|
|||
|
|
"a",
|
|||
|
|
"ai",
|
|||
|
|
"an",
|
|||
|
|
"ang",
|
|||
|
|
"ao",
|
|||
|
|
"e",
|
|||
|
|
"ei",
|
|||
|
|
"en",
|
|||
|
|
"eng",
|
|||
|
|
"er",
|
|||
|
|
"i",
|
|||
|
|
"i0",
|
|||
|
|
"ia",
|
|||
|
|
"ian",
|
|||
|
|
"iang",
|
|||
|
|
"iao",
|
|||
|
|
"ie",
|
|||
|
|
"in",
|
|||
|
|
"ing",
|
|||
|
|
"iong",
|
|||
|
|
"ir",
|
|||
|
|
"iu",
|
|||
|
|
"o",
|
|||
|
|
"ong",
|
|||
|
|
"ou",
|
|||
|
|
"u",
|
|||
|
|
"ua",
|
|||
|
|
"uai",
|
|||
|
|
"uan",
|
|||
|
|
"uang",
|
|||
|
|
"ui",
|
|||
|
|
"un",
|
|||
|
|
"uo",
|
|||
|
|
"v",
|
|||
|
|
"van",
|
|||
|
|
"ve",
|
|||
|
|
"vn",
|
|||
|
|
]
|
|||
|
|
|
|||
|
|
# japanese
|
|||
|
|
ja_symbols = [
|
|||
|
|
"I",
|
|||
|
|
"N",
|
|||
|
|
"U",
|
|||
|
|
"a",
|
|||
|
|
"b",
|
|||
|
|
"by",
|
|||
|
|
"ch",
|
|||
|
|
"cl",
|
|||
|
|
"d",
|
|||
|
|
"dy",
|
|||
|
|
"e",
|
|||
|
|
"f",
|
|||
|
|
"g",
|
|||
|
|
"gy",
|
|||
|
|
"h",
|
|||
|
|
"hy",
|
|||
|
|
"i",
|
|||
|
|
"j",
|
|||
|
|
"k",
|
|||
|
|
"ky",
|
|||
|
|
"m",
|
|||
|
|
"my",
|
|||
|
|
"n",
|
|||
|
|
"ny",
|
|||
|
|
"o",
|
|||
|
|
"p",
|
|||
|
|
"py",
|
|||
|
|
"r",
|
|||
|
|
"ry",
|
|||
|
|
"s",
|
|||
|
|
"sh",
|
|||
|
|
"t",
|
|||
|
|
"ts",
|
|||
|
|
"u",
|
|||
|
|
"v",
|
|||
|
|
"w",
|
|||
|
|
"y",
|
|||
|
|
"z",
|
|||
|
|
###楼下2个留到后面加
|
|||
|
|
# "[", #上升调型
|
|||
|
|
# "]", #下降调型
|
|||
|
|
# "$", #结束符
|
|||
|
|
# "^", #开始符
|
|||
|
|
]
|
|||
|
|
|
|||
|
|
arpa = {
|
|||
|
|
"AH0",
|
|||
|
|
"S",
|
|||
|
|
"AH1",
|
|||
|
|
"EY2",
|
|||
|
|
"AE2",
|
|||
|
|
"EH0",
|
|||
|
|
"OW2",
|
|||
|
|
"UH0",
|
|||
|
|
"NG",
|
|||
|
|
"B",
|
|||
|
|
"G",
|
|||
|
|
"AY0",
|
|||
|
|
"M",
|
|||
|
|
"AA0",
|
|||
|
|
"F",
|
|||
|
|
"AO0",
|
|||
|
|
"ER2",
|
|||
|
|
"UH1",
|
|||
|
|
"IY1",
|
|||
|
|
"AH2",
|
|||
|
|
"DH",
|
|||
|
|
"IY0",
|
|||
|
|
"EY1",
|
|||
|
|
"IH0",
|
|||
|
|
"K",
|
|||
|
|
"N",
|
|||
|
|
"W",
|
|||
|
|
"IY2",
|
|||
|
|
"T",
|
|||
|
|
"AA1",
|
|||
|
|
"ER1",
|
|||
|
|
"EH2",
|
|||
|
|
"OY0",
|
|||
|
|
"UH2",
|
|||
|
|
"UW1",
|
|||
|
|
"Z",
|
|||
|
|
"AW2",
|
|||
|
|
"AW1",
|
|||
|
|
"V",
|
|||
|
|
"UW2",
|
|||
|
|
"AA2",
|
|||
|
|
"ER",
|
|||
|
|
"AW0",
|
|||
|
|
"UW0",
|
|||
|
|
"R",
|
|||
|
|
"OW1",
|
|||
|
|
"EH1",
|
|||
|
|
"ZH",
|
|||
|
|
"AE0",
|
|||
|
|
"IH2",
|
|||
|
|
"IH",
|
|||
|
|
"Y",
|
|||
|
|
"JH",
|
|||
|
|
"P",
|
|||
|
|
"AY1",
|
|||
|
|
"EY0",
|
|||
|
|
"OY2",
|
|||
|
|
"TH",
|
|||
|
|
"HH",
|
|||
|
|
"D",
|
|||
|
|
"ER0",
|
|||
|
|
"CH",
|
|||
|
|
"AO1",
|
|||
|
|
"AE1",
|
|||
|
|
"AO2",
|
|||
|
|
"OY1",
|
|||
|
|
"AY2",
|
|||
|
|
"IH1",
|
|||
|
|
"OW0",
|
|||
|
|
"L",
|
|||
|
|
"SH",
|
|||
|
|
}
|
|||
|
|
|
|||
|
|
ko_symbols = "ㄱㄴㄷㄹㅁㅂㅅㅇㅈㅊㅋㅌㅍㅎㄲㄸㅃㅆㅉㅏㅓㅗㅜㅡㅣㅐㅔ空停"
|
|||
|
|
# ko_symbols='ㄱㄴㄷㄹㅁㅂㅅㅇㅈㅊㅋㅌㅍㅎㄲㄸㅃㅆㅉㅏㅓㅗㅜㅡㅣㅐㅔ '
|
|||
|
|
|
|||
|
|
yue_symbols = {
|
|||
|
|
"Yeot3",
|
|||
|
|
"Yip1",
|
|||
|
|
"Yyu3",
|
|||
|
|
"Yeng4",
|
|||
|
|
"Yut5",
|
|||
|
|
"Yaan5",
|
|||
|
|
"Ym5",
|
|||
|
|
"Yaan6",
|
|||
|
|
"Yang1",
|
|||
|
|
"Yun4",
|
|||
|
|
"Yon2",
|
|||
|
|
"Yui5",
|
|||
|
|
"Yun2",
|
|||
|
|
"Yat3",
|
|||
|
|
"Ye",
|
|||
|
|
"Yeot1",
|
|||
|
|
"Yoeng5",
|
|||
|
|
"Yoek2",
|
|||
|
|
"Yam2",
|
|||
|
|
"Yeon6",
|
|||
|
|
"Yu6",
|
|||
|
|
"Yiu3",
|
|||
|
|
"Yaang6",
|
|||
|
|
"Yp5",
|
|||
|
|
"Yai4",
|
|||
|
|
"Yoek4",
|
|||
|
|
"Yit6",
|
|||
|
|
"Yam5",
|
|||
|
|
"Yoeng6",
|
|||
|
|
"Yg1",
|
|||
|
|
"Yk3",
|
|||
|
|
"Yoe4",
|
|||
|
|
"Yam3",
|
|||
|
|
"Yc",
|
|||
|
|
"Yyu4",
|
|||
|
|
"Yyut1",
|
|||
|
|
"Yiu4",
|
|||
|
|
"Ying3",
|
|||
|
|
"Yip3",
|
|||
|
|
"Yaap3",
|
|||
|
|
"Yau3",
|
|||
|
|
"Yan4",
|
|||
|
|
"Yau1",
|
|||
|
|
"Yap4",
|
|||
|
|
"Yk6",
|
|||
|
|
"Yok3",
|
|||
|
|
"Yai1",
|
|||
|
|
"Yeot6",
|
|||
|
|
"Yan2",
|
|||
|
|
"Yoek6",
|
|||
|
|
"Yt1",
|
|||
|
|
"Yoi1",
|
|||
|
|
"Yit5",
|
|||
|
|
"Yn4",
|
|||
|
|
"Yaau3",
|
|||
|
|
"Yau4",
|
|||
|
|
"Yuk6",
|
|||
|
|
"Ys",
|
|||
|
|
"Yuk",
|
|||
|
|
"Yin6",
|
|||
|
|
"Yung6",
|
|||
|
|
"Ya",
|
|||
|
|
"You",
|
|||
|
|
"Yaai5",
|
|||
|
|
"Yau5",
|
|||
|
|
"Yoi3",
|
|||
|
|
"Yaak3",
|
|||
|
|
"Yaat3",
|
|||
|
|
"Ying2",
|
|||
|
|
"Yok5",
|
|||
|
|
"Yeng2",
|
|||
|
|
"Yyut3",
|
|||
|
|
"Yam1",
|
|||
|
|
"Yip5",
|
|||
|
|
"You1",
|
|||
|
|
"Yam6",
|
|||
|
|
"Yaa5",
|
|||
|
|
"Yi6",
|
|||
|
|
"Yek4",
|
|||
|
|
"Yyu2",
|
|||
|
|
"Yuk5",
|
|||
|
|
"Yaam1",
|
|||
|
|
"Yang2",
|
|||
|
|
"Yai",
|
|||
|
|
"Yiu6",
|
|||
|
|
"Yin4",
|
|||
|
|
"Yok4",
|
|||
|
|
"Yot3",
|
|||
|
|
"Yui2",
|
|||
|
|
"Yeoi5",
|
|||
|
|
"Yyun6",
|
|||
|
|
"Yyu5",
|
|||
|
|
"Yoi5",
|
|||
|
|
"Yeot2",
|
|||
|
|
"Yim4",
|
|||
|
|
"Yeoi2",
|
|||
|
|
"Yaan1",
|
|||
|
|
"Yang6",
|
|||
|
|
"Yong1",
|
|||
|
|
"Yaang4",
|
|||
|
|
"Yung5",
|
|||
|
|
"Yeon1",
|
|||
|
|
"Yin2",
|
|||
|
|
"Ya3",
|
|||
|
|
"Yaang3",
|
|||
|
|
"Yg",
|
|||
|
|
"Yk2",
|
|||
|
|
"Yaau5",
|
|||
|
|
"Yut1",
|
|||
|
|
"Yt5",
|
|||
|
|
"Yip4",
|
|||
|
|
"Yung4",
|
|||
|
|
"Yj",
|
|||
|
|
"Yong3",
|
|||
|
|
"Ya1",
|
|||
|
|
"Yg6",
|
|||
|
|
"Yaau6",
|
|||
|
|
"Yit3",
|
|||
|
|
"Yun3",
|
|||
|
|
"Ying1",
|
|||
|
|
"Yn2",
|
|||
|
|
"Yg4",
|
|||
|
|
"Yl",
|
|||
|
|
"Yp3",
|
|||
|
|
"Yn3",
|
|||
|
|
"Yak1",
|
|||
|
|
"Yang5",
|
|||
|
|
"Yoe6",
|
|||
|
|
"You2",
|
|||
|
|
"Yap2",
|
|||
|
|
"Yak2",
|
|||
|
|
"Yt3",
|
|||
|
|
"Yot5",
|
|||
|
|
"Yim2",
|
|||
|
|
"Yi1",
|
|||
|
|
"Yn6",
|
|||
|
|
"Yaat5",
|
|||
|
|
"Yaam3",
|
|||
|
|
"Yoek5",
|
|||
|
|
"Ye3",
|
|||
|
|
"Yeon4",
|
|||
|
|
"Yaa2",
|
|||
|
|
"Yu3",
|
|||
|
|
"Yim6",
|
|||
|
|
"Ym",
|
|||
|
|
"Yoe3",
|
|||
|
|
"Yaai2",
|
|||
|
|
"Ym2",
|
|||
|
|
"Ya6",
|
|||
|
|
"Yeng6",
|
|||
|
|
"Yik4",
|
|||
|
|
"Yot4",
|
|||
|
|
"Yaai4",
|
|||
|
|
"Yyun3",
|
|||
|
|
"Yu1",
|
|||
|
|
"Yoeng1",
|
|||
|
|
"Yaap2",
|
|||
|
|
"Yuk3",
|
|||
|
|
"Yoek3",
|
|||
|
|
"Yeng5",
|
|||
|
|
"Yeoi1",
|
|||
|
|
"Yiu2",
|
|||
|
|
"Yok1",
|
|||
|
|
"Yo1",
|
|||
|
|
"Yoek1",
|
|||
|
|
"Yoeng2",
|
|||
|
|
"Yeon5",
|
|||
|
|
"Yiu1",
|
|||
|
|
"Yoeng4",
|
|||
|
|
"Yuk2",
|
|||
|
|
"Yat4",
|
|||
|
|
"Yg5",
|
|||
|
|
"Yut4",
|
|||
|
|
"Yan6",
|
|||
|
|
"Yin3",
|
|||
|
|
"Yaa6",
|
|||
|
|
"Yap1",
|
|||
|
|
"Yg2",
|
|||
|
|
"Yoe5",
|
|||
|
|
"Yt4",
|
|||
|
|
"Ya5",
|
|||
|
|
"Yo4",
|
|||
|
|
"Yyu1",
|
|||
|
|
"Yak3",
|
|||
|
|
"Yeon2",
|
|||
|
|
"Yong4",
|
|||
|
|
"Ym1",
|
|||
|
|
"Ye2",
|
|||
|
|
"Yaang5",
|
|||
|
|
"Yoi2",
|
|||
|
|
"Yeng3",
|
|||
|
|
"Yn",
|
|||
|
|
"Yyut4",
|
|||
|
|
"Yau",
|
|||
|
|
"Yaak2",
|
|||
|
|
"Yaan4",
|
|||
|
|
"Yek2",
|
|||
|
|
"Yin1",
|
|||
|
|
"Yi5",
|
|||
|
|
"Yoe2",
|
|||
|
|
"Yei5",
|
|||
|
|
"Yaat6",
|
|||
|
|
"Yak5",
|
|||
|
|
"Yp6",
|
|||
|
|
"Yok6",
|
|||
|
|
"Yei2",
|
|||
|
|
"Yaap1",
|
|||
|
|
"Yyut5",
|
|||
|
|
"Yi4",
|
|||
|
|
"Yim1",
|
|||
|
|
"Yk5",
|
|||
|
|
"Ye4",
|
|||
|
|
"Yok2",
|
|||
|
|
"Yaam6",
|
|||
|
|
"Yat2",
|
|||
|
|
"Yon6",
|
|||
|
|
"Yei3",
|
|||
|
|
"Yyu6",
|
|||
|
|
"Yeot5",
|
|||
|
|
"Yk4",
|
|||
|
|
"Yai6",
|
|||
|
|
"Yd",
|
|||
|
|
"Yg3",
|
|||
|
|
"Yei6",
|
|||
|
|
"Yau2",
|
|||
|
|
"Yok",
|
|||
|
|
"Yau6",
|
|||
|
|
"Yung3",
|
|||
|
|
"Yim5",
|
|||
|
|
"Yut6",
|
|||
|
|
"Yit1",
|
|||
|
|
"Yon3",
|
|||
|
|
"Yat1",
|
|||
|
|
"Yaam2",
|
|||
|
|
"Yyut2",
|
|||
|
|
"Yui6",
|
|||
|
|
"Yt2",
|
|||
|
|
"Yek6",
|
|||
|
|
"Yt",
|
|||
|
|
"Ye6",
|
|||
|
|
"Yang3",
|
|||
|
|
"Ying6",
|
|||
|
|
"Yaau1",
|
|||
|
|
"Yeon3",
|
|||
|
|
"Yng",
|
|||
|
|
"Yh",
|
|||
|
|
"Yang4",
|
|||
|
|
"Ying5",
|
|||
|
|
"Yaap6",
|
|||
|
|
"Yoeng3",
|
|||
|
|
"Yyun4",
|
|||
|
|
"You3",
|
|||
|
|
"Yan5",
|
|||
|
|
"Yat5",
|
|||
|
|
"Yot1",
|
|||
|
|
"Yun1",
|
|||
|
|
"Yi3",
|
|||
|
|
"Yaa1",
|
|||
|
|
"Yaap4",
|
|||
|
|
"You6",
|
|||
|
|
"Yaang2",
|
|||
|
|
"Yaap5",
|
|||
|
|
"Yaa3",
|
|||
|
|
"Yaak6",
|
|||
|
|
"Yeng1",
|
|||
|
|
"Yaak1",
|
|||
|
|
"Yo5",
|
|||
|
|
"Yoi4",
|
|||
|
|
"Yam4",
|
|||
|
|
"Yik1",
|
|||
|
|
"Ye1",
|
|||
|
|
"Yai5",
|
|||
|
|
"Yung1",
|
|||
|
|
"Yp2",
|
|||
|
|
"Yui4",
|
|||
|
|
"Yaak4",
|
|||
|
|
"Yung2",
|
|||
|
|
"Yak4",
|
|||
|
|
"Yaat4",
|
|||
|
|
"Yeoi4",
|
|||
|
|
"Yut2",
|
|||
|
|
"Yin5",
|
|||
|
|
"Yaau4",
|
|||
|
|
"Yap6",
|
|||
|
|
"Yb",
|
|||
|
|
"Yaam4",
|
|||
|
|
"Yw",
|
|||
|
|
"Yut3",
|
|||
|
|
"Yong2",
|
|||
|
|
"Yt6",
|
|||
|
|
"Yaai6",
|
|||
|
|
"Yap5",
|
|||
|
|
"Yik5",
|
|||
|
|
"Yun6",
|
|||
|
|
"Yaam5",
|
|||
|
|
"Yun5",
|
|||
|
|
"Yik3",
|
|||
|
|
"Ya2",
|
|||
|
|
"Yyut6",
|
|||
|
|
"Yon4",
|
|||
|
|
"Yk1",
|
|||
|
|
"Yit4",
|
|||
|
|
"Yak6",
|
|||
|
|
"Yaan2",
|
|||
|
|
"Yuk1",
|
|||
|
|
"Yai2",
|
|||
|
|
"Yik2",
|
|||
|
|
"Yaat2",
|
|||
|
|
"Yo3",
|
|||
|
|
"Ykw",
|
|||
|
|
"Yn5",
|
|||
|
|
"Yaa",
|
|||
|
|
"Ye5",
|
|||
|
|
"Yu4",
|
|||
|
|
"Yei1",
|
|||
|
|
"Yai3",
|
|||
|
|
"Yyun5",
|
|||
|
|
"Yip2",
|
|||
|
|
"Yaau2",
|
|||
|
|
"Yiu5",
|
|||
|
|
"Ym4",
|
|||
|
|
"Yeoi6",
|
|||
|
|
"Yk",
|
|||
|
|
"Ym6",
|
|||
|
|
"Yoe1",
|
|||
|
|
"Yeoi3",
|
|||
|
|
"Yon",
|
|||
|
|
"Yuk4",
|
|||
|
|
"Yaai3",
|
|||
|
|
"Yaa4",
|
|||
|
|
"Yot6",
|
|||
|
|
"Yaang1",
|
|||
|
|
"Yei4",
|
|||
|
|
"Yek1",
|
|||
|
|
"Yo",
|
|||
|
|
"Yp",
|
|||
|
|
"Yo6",
|
|||
|
|
"Yp4",
|
|||
|
|
"Yan3",
|
|||
|
|
"Yoi",
|
|||
|
|
"Yap3",
|
|||
|
|
"Yek3",
|
|||
|
|
"Yim3",
|
|||
|
|
"Yz",
|
|||
|
|
"Yot2",
|
|||
|
|
"Yoi6",
|
|||
|
|
"Yit2",
|
|||
|
|
"Yu5",
|
|||
|
|
"Yaan3",
|
|||
|
|
"Yan1",
|
|||
|
|
"Yon5",
|
|||
|
|
"Yp1",
|
|||
|
|
"Yong5",
|
|||
|
|
"Ygw",
|
|||
|
|
"Yak",
|
|||
|
|
"Yat6",
|
|||
|
|
"Ying4",
|
|||
|
|
"Yu2",
|
|||
|
|
"Yf",
|
|||
|
|
"Ya4",
|
|||
|
|
"Yon1",
|
|||
|
|
"You4",
|
|||
|
|
"Yik6",
|
|||
|
|
"Yui1",
|
|||
|
|
"Yaat1",
|
|||
|
|
"Yeot4",
|
|||
|
|
"Yi2",
|
|||
|
|
"Yaai1",
|
|||
|
|
"Yek5",
|
|||
|
|
"Ym3",
|
|||
|
|
"Yong6",
|
|||
|
|
"You5",
|
|||
|
|
"Yyun1",
|
|||
|
|
"Yn1",
|
|||
|
|
"Yo2",
|
|||
|
|
"Yip6",
|
|||
|
|
"Yui3",
|
|||
|
|
"Yaak5",
|
|||
|
|
"Yyun2",
|
|||
|
|
}
|
|||
|
|
|
|||
|
|
# symbols = [pad] + c + v + ja_symbols + pu_symbols + list(arpa)+list(ko_symbols)#+list(yue_symbols)###直接这么加yue顺序乱了
|
|||
|
|
symbols = [pad] + c + v + ja_symbols + pu_symbols + list(arpa)
|
|||
|
|
symbols = sorted(set(symbols))
|
|||
|
|
# print(len(symbols))
|
|||
|
|
symbols += ["[", "]"] ##日文新增上升下降调型
|
|||
|
|
symbols += sorted(list(ko_symbols))
|
|||
|
|
symbols += sorted(list(yue_symbols)) ##新加的yue统一摆在后头#已查过开头加Y后没有重复,韩文显然不会重复
|
|||
|
|
# print(len(symbols))
|
|||
|
|
if __name__ == "__main__":
|
|||
|
|
print(len(symbols))
|
|||
|
|
"""
|
|||
|
|
粤语:
|
|||
|
|
732-353=379
|
|||
|
|
韩文+粤语:
|
|||
|
|
732-322=410
|
|||
|
|
"""
|