ml_rules 5.0 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300
  1. // This file is UTF8 encoded
  2. // Spelling to phoneme rules for Malayalam
  3. // A means vowel letters (not vowel signs)
  4. // B means a combining vowel sign or a virama
  5. // change (k t. t p) to (g d. d b) if followed by a vowel, unless at start of a word or preceeded by an unvoiced stop consonant ??
  6. .L01 _ ക് ച് ട് ത് പ്
  7. .replace
  8. ൦ 0 // Convert Malayalam numbers
  9. ൧ 1
  10. ൨ 2
  11. ൩ 3
  12. ൪ 4
  13. ൫ 5
  14. ൬ 6
  15. ൭ 7
  16. ൮ 8
  17. ൯ 9
  18. ോ ോ
  19. ൊ ൊ
  20. ൌ ൌ
  21. .group ക
  22. ക് k
  23. L01) ക ka
  24. L01) ക (B k
  25. ക ga
  26. ക (B g
  27. ക്ക k:a
  28. ക്ക (B k:
  29. .group ഖ
  30. ഖ k#a
  31. ഖ (B k#
  32. .group ഗ
  33. ഗ ga
  34. ഗ (B g
  35. .group ഘ
  36. ഘ g#a
  37. ഘ (B g#
  38. .group ങ
  39. ങ Na
  40. ങ (B N
  41. .group ച
  42. ച ca
  43. ച (B c
  44. .group ഛ
  45. ഛ c#a
  46. ഛ (B c#
  47. .group ജ
  48. ജ Ja
  49. ജ (B J
  50. .group ഝ
  51. ഝ J#a
  52. ഝ (B J#
  53. .group ഞ
  54. ഞ n^a
  55. ഞ (B n^
  56. .group ട
  57. ട് t.
  58. L01) ട t.a
  59. L01) ട (B t.
  60. ട d.a
  61. ട (B d.
  62. ട്ട t.:a
  63. ട്ട (B t.:
  64. .group ഠ
  65. ഠ t.#a
  66. ഠ (B t.#
  67. .group ഡ
  68. ഡ d.a
  69. ഡ (B d.
  70. .group ഢ
  71. ഢ d.#a
  72. ഢ (B d.#
  73. .group ണ
  74. ണ n.a
  75. ണ (B n.
  76. .group ത
  77. ത് t
  78. L01) ത ta
  79. L01) ത (B t
  80. ത da
  81. ത (B d
  82. ത്ത t:a
  83. ത്ത (B t:
  84. .group ഥ
  85. ഥ t#a
  86. ഥ (B t#
  87. .group ദ
  88. ദ da
  89. ദ (B d
  90. .group ധ
  91. ധ d#a
  92. ധ (B d#
  93. .group ന
  94. ന na
  95. ന (B n
  96. .group പ
  97. പ് p
  98. L01) പ pa
  99. L01) പ (B p
  100. പ ba
  101. പ (B b
  102. പ്പ p:a
  103. പ്പ (B p:
  104. .group ഫ
  105. ഫ p#a
  106. ഫ (B p#
  107. _പ്രൊ) ഫ (സര് fa
  108. .group ബ
  109. ബ ba
  110. ബ (B b
  111. .group ഭ
  112. ഭ b#a
  113. ഭ (B b#
  114. .group മ
  115. മ ma
  116. മ (B m
  117. .group യ
  118. യ ja
  119. യ (B j
  120. .group ര
  121. ര ra
  122. ര (B r
  123. .group റ
  124. റ R2a
  125. റ (B R2
  126. ന്) റ d2
  127. റ്റ t.t. // ?? R2R2 = t.t.
  128. .group ല
  129. ല la
  130. ല (B l
  131. .group ള
  132. ള l.a
  133. ള (B l.
  134. .group ഴ // retroflex [r.] ?
  135. ഴ r.a
  136. ഴ (B r.
  137. .group വ
  138. വ va
  139. വ (B v
  140. .group ശ
  141. ശ S;a
  142. ശ (B S;
  143. .group ഷ
  144. ഷ s.a
  145. ഷ (B s.
  146. .group സ
  147. സ sa
  148. സ (B s
  149. .group ഹ
  150. ഹ ha
  151. ഹ (B h
  152. // chillu consonants
  153. .group ൺ
  154. ൺ n.
  155. .group ൻ
  156. ൻ n
  157. .group ർ
  158. ർ r
  159. .group ൽ
  160. ൽ l
  161. .group ൾ
  162. ൾ l.
  163. .group ൿ
  164. ൿ k
  165. .group 0xe0b4 // characters which start with UTF-8 bytes: [e0 b4]
  166. ഽ // avagraha
  167. ം m // anusvara (this should nasalize the vowel)
  168. ഃ h // visarga
  169. അ a
  170. ആ a:
  171. ഇ i
  172. ഈ i:
  173. ഉ u
  174. ഊ u:
  175. ഋ Ry
  176. എ e
  177. _) എ ;e
  178. ഏ e:
  179. _) ഏ ;e:
  180. ഐ aI
  181. ഒ o
  182. ഓ o:
  183. ഔ aU
  184. // combining vowel signs
  185. ാ a:
  186. ി i
  187. ി (ല്K I
  188. .group 0xe0b5 // characters which start with UTF-8 bytes: [e0 b5]
  189. ീ i:
  190. ു u
  191. ൂ u:
  192. ൃ r-
  193. ൄ r-:
  194. െ e
  195. േ e:
  196. ൈ aI
  197. ൊ o
  198. ോ o:
  199. ൌ aU
  200. ൗ aU // au length mark, treat at [aU] ?
  201. ് // virama
  202. ൎ // chillu-virama (unofficial)
  203. ്് // espeak uses double-virama for "virama + U+200d" (zero-width joiner), to indicate a chillu character
  204. ് (_ y // epenthetic vowel at end of word
  205. ൠ Ry:
  206. ൡ ly:
  207. .group
  208. $ do:l.ar