Biblioteca Java para transformar kanji/katakana/hiragana a romaji

El idioma japonés es principalmente una combinación de 3 alfabetos, y se puede transcribir a romaji (escritura latina) . Hay varias estrategias, Revised Hepburn sería ideal aquí.

Ejemplo: ローマ字rōmaji

Requisitos:

  • Biblioteca Java 100% pura
  • Compatible con GNU-GPLv3

Lo más probable es que una biblioteca de este tipo necesite incrustar una gran cantidad de datos para adivinar las pronunciaciones correctamente con la mayor frecuencia posible.

Respuestas (2)

Jakaroma hace esto, y se basa en Kuromoji , que es mucho mejor en la transliteración de kanji que Kakasi e incluso Mecab.

  • 100% Java
  • Código abierto: licencia Apache 2
  • Tamaño: 11 MB
  • Calidad de transliteración: Alta

Descargo de responsabilidad: Mantenido por mí.

Deberías subirlo a maven central. Además, por lo que puedo ver, ¿Jakaroma solo expone la transliteración de kana a romaji? ¿Qué haría para transliterar kanji a kana o romaji?

Kakasi Java hace exactamente esto.
También incluye una herramienta de línea de comandos para que puedas probarla fácilmente.

  • 100% Java
  • Código abierto: licencia GNU-GPLv2
  • Tamaño: 3,2 MB
  • Calidad de la transliteración: Mala

Descargo de responsabilidad: Mantenido por mí.

Nota: Mecab es más preciso para adivinar pronunciaciones, pero desafortunadamente no es 100% Java.