El idioma japonés es principalmente una combinación de 3 alfabetos, y se puede transcribir a romaji (escritura latina) . Hay varias estrategias, Revised Hepburn sería ideal aquí.
Ejemplo: ローマ字
→rōmaji
Requisitos:
Lo más probable es que una biblioteca de este tipo necesite incrustar una gran cantidad de datos para adivinar las pronunciaciones correctamente con la mayor frecuencia posible.
Kakasi Java hace exactamente esto.
También incluye una herramienta de línea de comandos para que puedas probarla fácilmente.
Descargo de responsabilidad: Mantenido por mí.
Nota: Mecab es más preciso para adivinar pronunciaciones, pero desafortunadamente no es 100% Java.
0x6C38