En una pregunta anterior , descubrí que lo más temprano que puedo tener un sistema de escritura característico es el Neolítico tardío, o entre 1600 y 800 a. Al trabajar en este sistema de escritura de idiomas, me di cuenta de que probablemente hay mucha más información que puedo almacenar en los glifos que en hangul.
¿Cuál es el alcance de la información que puede almacenar en un sistema de escritura funcional?
Es bastante común que el diseño de los glifos característicos de los reclutas esté informado, al menos en parte, por la forma de articulación y/o el lugar de articulación , pero también podría considerar:
Lugar en la jerarquía de sonoridad , o, más o menos, la amplitud
(Para todos los ejemplos, asumiré una escritura horizontal comparable al inglés).
La posición en la escala de sonoridad podría representarse aumentando la longitud de los ascendentes o descendentes, dando potencialmente a cada palabra escrita una silueta que sigue un bajo-alto-bajo, bajo-alto. , patrón alto-bajo o alto-bajo-alto.
Longitud o geminación
Una ligadura doble o triple , un trazo horizontal alargado o signos diacríticos podrían indicar cuándo debe geminarse una consonante; el número o la longitud podría indicar cuánto tiempo se debe sostener, si es posible varias longitudes
En las escrituras de marcado de tono (tailandés, chino Zhuyin y pinyin, otros), un diacrítico indica si es un tono descendente, alto, medio, ascendente o bajo. En algunos scripts, ningún signo diacrítico indica que no hay tono, y en otros significa un tono predeterminado. El tono cambia la pronunciación y el significado de una sílaba/palabra, como se ve en este ejemplo:
Énfasis o acento léxico
De acuerdo con los patrones de acentuación de su conlang, una sílaba acentuada podría indicarse mediante una forma alternativa del núcleo (generalmente una vocal) o un diacrítico aplicado a la vocal oa la sílaba completa. Cambiar el acento puede, como en los ejemplos en inglés de con duct y con duct , diferenciar un sustantivo de un verbo, o resaltar la parte importante de una oración (como en " ¿ vamos?" versus "¿ vamos ?" versus " vamos ? ").
Hiato o diéresis de vocales
El hiato es una pequeña pausa que ocurre cuando una sílaba sin coda se apoya en el núcleo de la siguiente (como en cooperar ) ; esto solo necesitaría indicarse si su idioma usa diptongos (dos o más glifos de vocales escritos en secuencia), lo cual no es exactamente característico (aunque Hangul sí lo hace). También podría ser útil si su escritura no usa espacios (como en muchas escrituras de Asia oriental) o enlaces (como en Devanagari) para definir un espacio de palabra: la pausa indicaría el comienzo de una nueva palabra cuando la palabra anterior termina con el mismo vocal y produciría una tercera palabra no intencionada si se omite la pausa.
Transformación intervocálica de consonantes
Indicar si una consonante intervocálica debe o no sufrir lenición podría indicar el patrón de pronunciación que debe seguir una palabra. Por ejemplo, la t → d intervocálica (botella → "boddle") puede no cambiar el significado de la palabra, pero podría transmitir el contexto social o el significado del hablante o sujeto (p. ej., "boddle" podría ser jerga y tener connotaciones adicionales).
Si su idioma usa armonía o metafonía de vocales, los signos diacríticos podrían indicar el esquema que se aplicará a las vocales dadas.
Si su idioma clasifica las vocales en clases (como lo hace Hangul ), puede haber reglas que determinen qué vocales pueden ir juntas en una palabra o en qué orden deben ir. Si tiene patrones bien establecidos que siguen las vocales, un diacrítico puede indicar que las siguientes vocales deben pronunciarse de una manera particular (el equivalente de otros glifos de vocales, pero su uso transmite un significado particular), o que una vocal está exenta de estas reglas (como es un préstamo, por ejemplo).
La prosodia puede ser similar al acento mencionado anteriormente, pero opera en un nivel de múltiples palabras para indicar cosas como sarcasmo, enfoque, tipo, etc. o se deben enfatizar las cláusulas, cuánto tiempo hacer una pausa entre ellas, si se debe aplicar la cadencia o si una frase en particular debe entenderse como un modismo. En inglés, la prosodia te dice si una oración hablada es una pregunta, y el signo de interrogación representa el cambio de sonido en la sílaba final.
Hay muchas opciones para los símbolos informativos.
Otro factor para agregar a su propia respuesta es el concepto de bits de información por carácter, también conocido como la entropía de la información .
Para ilustrar lo que eso significa, imaginemos ralentizar la reproducción de una persona hablando a un nivel extremo. Supongamos que lo primero que escuchamos es a la persona haciendo un sonido /k/. ¿Qué palabra está empezando a decir la persona? Hay miles de posibilidades, demasiadas para siquiera adivinarlas.
A medida que continúa la reproducción, escuchamos un breve sonido /a/. Tal vez ahora podamos hacer una conjetura. ¿Kayac? ¿Taxi? Kalamazoo? ¿Casuario? ¿Castinete? No es certero.
A continuación, escuchamos /t/. Está bien. Gato. Esa cosa que es peluda, piensa que es linda, dice mucho maullido. Ah, pero podría ser el comienzo de la catacumba. O catalizador. Así que todavía no está al 100%.
La reproducción continúa. No se escuchan más sonidos. Finalmente, tenemos total certeza de que la persona ha dicho la palabra gato. Sabemos qué idea la persona está tratando de comunicar.
Este proceso ocurre dentro de su cerebro a un ritmo mucho más rápido cada vez que lee o escucha. Para cada letra que lee y cada sonido que escucha, su cerebro tiene que elegir entre múltiples posibilidades de lo que podría venir, y solo puede tomar su decisión final cuando tiene suficiente información. El hecho de que existan diferencias entre palabras como Cab, Kalamazoo, cat, etc., que solo se pueden discriminar cuando se ha leído u oído un número suficiente de letras, se denomina entropía del lenguaje. La capacidad de decidir entre una palabra y otra, como el 0 y el 1 en una computadora, te da un poco de información.
Se estima (como en el artículo vinculado) que el texto en inglés tiene entre 0,6 y 1,3 bits de entropía por cada carácter del mensaje.
En un lenguaje gráfico, habrá muchos más fragmentos de información por "carácter". Como un ejemplo un poco irónico, si veo una señal de tráfico con una figura de palo con un balde en la cabeza, hay muchas cosas sobre las que podría estar advirtiéndome, por lo que todavía hay una buena cantidad de entropía en esta. símbolo. Sin embargo, claramente no me advierte que tenga cuidado con los tigres, el hielo en el camino o una salida más adelante. Así que hay muchos bits de información en ese símbolo, posiblemente varios cientos.
(No estoy seguro de que nadie haya estudiado la entropía de la información de las señales de tráfico típicas. ¿Alguien quiere ayudarme a escribir la propuesta de subvención?)
Finalmente, en un lenguaje característico, habrá menos bits de entropía por carácter en promedio. En un lenguaje alfabético como el inglés, cada letra equivale aproximadamente a un fonema. En los lenguajes característicos donde cada carácter puede ser menos que un fonema completo, necesariamente hay menos información.
En este punto, solo puedo adivinar, ya que no tengo conocimiento de ningún ejemplo. Ya sea Tengwar ficticio o Hangul real, ni siquiera estoy seguro de cuáles son las diferencias entre los fonemas y las características de la palabra "gato". Supongo que el orden de magnitud está en las décimas de bits por carácter.
rek
TrEs-2b
rek