¿Hay algún lugar para descargar el Tanaj, o al menos la Torá, en formato de texto sin formato, incluidos nekudos y trop? Desde Mechon Mamre puedo descargar el HTML, pero aparte de las etiquetas html, el texto tiene un formato extraño (que no puedo leer directamente en un editor de texto).
Me gustaría poder buscar trop o secuencias de trop, que es más fácil en formato de texto (con grep).
Algunas opciones dependiendo de lo que estés buscando:
El códice de Leningrado está en línea, incluido teamim. Puede descargar un archivo zip de todo en formato de texto sin formato . Tenga en cuenta que los equipos corresponden al WLC y difieren en algunos lugares de los que se usan comúnmente.
Wikisource tiene todo el Tanach y también tiene una API que se puede usar para descargar en una variedad de formatos, incluido el texto sin formato. Los teamim de Wiki se basan en los teamim tradicionales.
Aunque no es exactamente lo que pediste, también te puede interesar usar Sefaria . Tiene una API y una página de descarga para cada libro que se puede usar para descargar JSON o csv. El salto de JSON o csv a texto sin formato no es muy grande y la organización puede ser útil según lo que esté buscando. El equipo de Sefaria también se basa en el WLC.
scimonster
msh210
Daniel
kazi bacsi