¿Fonemas mínimos para un conlang?

Estoy diseñando una raza alienígena con puntos de articulación limitados, y me hizo pensar cuál es la cantidad mínima de fonemas necesarios para que funcione un idioma. ¿Eso me ayudaría a determinar su fisiología?

He visto ¿Es factible un lenguaje con dos fonemas? pero eso parece demasiado limitado, y la idea de hablar en binario no encaja con mi idea de esta raza alienígena.

No es por complicarlo aún más, pero ¿son aceptables los idiomas que carecen de sonido? La luz, los signos, los campos magnéticos o eléctricos, incluso las formas de una radiofrecuencia biológica o similares, podrían emplearse sin ningún fonema. La palabra escrita es solo una forma diferente de transmitir un lenguaje hablado, por lo que cualquier forma sin sonidos puede ser válida.
También es posible que desee ver el canal de YouTube de Film Theorists , ya que el episodio sobre "I am Groot" es un idioma completo.
@JDługosz the Librarian from Discworld usa un lenguaje similar con una sola palabra: "ook". También es un lenguaje de programación . (OK, el bibliotecario también usa ocasionalmente "eek", pero en realidad la gran mayoría de sus palabras son "ook")
Tenga en cuenta que Stack Exchange tiene una pila enfocada específicamente en lenguajes construidos . Aceptamos una amplia variedad de preguntas, pero es probable que obtenga una mejor respuesta allí.
El código Morse tiene solo 2 sonidos (3 si incluye el intervalo más largo) y solo 1 tipo de sonido (solo difiere la duración), pero proporciona una comunicación efectiva, aunque más lenta que el habla tal como la conocemos.
También es obvio que cualquier cosa se puede codificar como binario, con 2 sonidos.

Respuestas (3)

Dependiendo de cómo cuentes los fonemas, el "número mínimo de fonemas necesarios para que un idioma funcione" es obviamente uno o dos.

En las descripciones lingüísticas de la vida real, las lenguas polinesias presentan pequeños inventarios de fonemas; por ejemplo, el tahitiano se conforma con cinco vocales y nueve consonantes (/a/, /e/, /i/, /o/, /u/, /p/, /t/, /m/, /n/, / f/, /v/, /ʔ/, /h/ y /r/) y el hawaiano se las arregla con las mismas cinco vocales y solo ocho consonantes (al no tener uso para /f/). El alfabeto hawaiano tiene solo 13 letras: a, e, i, o, u, h, k, l, m, n, p, w y ʻ (que se llama ʻokina y se usa para escribir la parada glotal / ʔ / ). (Y sí, ese es el orden alfabético). (Dependiendo de quién cuente, pueden ser diez vocales, porque cada una de ellas puede ser corta y larga).

Lectores atentos habrán notado que en el párrafo anterior hablé del número de fonemas en las descripciones lingüísticas , y no en las lenguas . Las lenguas no tienen fonemas; los fonemas son elementos de los modelos que hacemos de las lenguas. En la realidad física, todo lo que tenemos son (alo-) teléfonos : los teléfonos son las realidades físicas, los fonemas son los modelos abstractos. En gran medida, la cantidad de fonemas depende de los principios detrás de un modelo de lenguaje específico.

Para dar un ejemplo extremo, ¿cuántas vocales tiene el chino mandarín ? Bueno, eso depende de quién esté contando. El número mínimo que he visto es cero ( modelo de Edwin Pulleyblank ). El máximo es 25 (contando /a/, /ə/, /i/, /u/, /y/, cada uno con uno de los cuatro tonos o con el tono "cero"). O, para un ejemplo quizás más conocido, ¿cuántas vocales hay en el latín clásico? ¿Son cinco, cada uno con una versión larga y otra corta, o son diez, o son once? ¿Cuántas vocales hay en BBC English ? La descripción usual (para el uso de nosotros, los extranjeros que aprendemos inglés) da 19 (¡diecinueve!) vocales y diptongos, más 4 cuasi-diptongos.

Entonces, con el propósito de crear una maqueta de un idioma extranjero, diría que no puedes equivocarte con tres vocales (una vocal central /a/, una vocal anterior no redondeada /e/ y una vocal posterior redondeada /o/ ), dos deslizamientos (/j/ y /w/) y un pequeño conjunto de consonantes. Qué consonantes, eso depende del conjunto de puntos de articulación que acepte; sobre si acepta distinciones de sonoridad (como entre /p/ y /b/ o entre /k/ y /g/) o no; sobre si acepta nasales o no; etcétera.

Esta es una gran respuesta, pero me preocupa que la raza alienígena no tenga vocales ni capacidad para deslizarse. Ligeramente fuera del alcance de la pregunta, pero ¿es funcional un inventario aún más pequeño?
@Pureferret: Eso depende mucho de lo que quieras decir cuando dices que su idioma no tiene vocales ... (No hay un idioma hablado por humanos que no tenga al menos vocales superficiales , es decir, alófonos que funcionan como un núcleo de sílaba). Pero en términos prácticos, debe jugar (por ejemplo, en Excel o LibreOffice Calc) con varios inventarios fonéticos y reglas fonotácticas, y ver si está satisfecho con la cantidad de raíces distintas de una o dos sílabas que se pueden construir. O genere palabras de muestra con Awkwords .
la raza alienígena tiene un neumóstomo pero no produce sonidos de esa manera, sino que usa su equivalente, el equivalente a una rádula para raspar y golpear para hacer ruidos. Miraré Awkwords y veré si algo hace clic.
@Pureferret: es posible que desee ver esta respuesta , relacionada específicamente con el tema de representar un discurso extraterrestre que utiliza un mecanismo de producción de sonido extraterrestre. Básicamente, en lugar de representar directamente los sonidos extraterrestres, puedes asignar los roles de los sonidos extraterrestres a los roles de los sonidos humanos; los sonidos que pueden sostenerse y constituyen el núcleo de las secuencias de fonación elementales se asignan a las vocales humanas, los sonidos momentáneos que no pueden sostenerse se asignan a las oclusivas humanas, etc.

En teoría, cualquier número desde 1 hasta infinitos fonemas funcionaría para un idioma.

Aquí hay un resumen de los números más bajos y cómo funcionarían.

Lenguaje unario

Suponiendo que puede hacer una pausa entre palabras (de una manera que no codifique sus propios datos), unary funciona, aunque probablemente sea muy poco práctico:

El sistema numérico unario es el sistema numérico más simple para representar números naturales: 1 para representar un número N, un símbolo que representa 1 se repite N veces. 2

En el sistema unario, el número 0 (cero) está representado por la cadena vacía, es decir, la ausencia de un símbolo. Los números 1, 2, 3, 4, 5, 6, ... se representan en unario como 1, 11, 111, 1111, 11111, 111111, ...

-Wikipedia _

Entonces, en este idioma, 1 sonido reflejaría la primera palabra, 11 la segunda palabra, etc. La complicación surge cuando se combinan palabras en una oración para reflejar conceptos más complejos:

La oración relacionada con "1 11 111 1 111 1", podría codificar bastante complicación si, por ejemplo, "1 11" y "1 111" codifican más información que sus partes solas.

sin pausas

Binario y Ternario

Como en las preguntas y respuestas que encontraste , se explica en detalle cómo funciona el sistema binario, además de tocar el tema ternario.

incluso puede comprimir esas palabras por frecuencia de uso simplemente adoptando el mismo truco que guardó Unicode

Como puede ver, existe una concepción similar de codificar más que la suma de sus partes.

En ternario:

Tri-state te permite desechar los "bits de extensión" UTF-8, o te da otro símbolo para jugar (log (26)/log (3) ahora). Ganancias de velocidad o compresión de cualquier manera.

Este es el número de fonemas más 'eficiente', si hacemos una analogía en términos de economía de radix , sin embargo, como vemos a continuación, hay otras consideraciones. Esta no es una analogía perfecta.

Más de 4 fonemas

Con más de 4 fonemas, podemos comenzar a considerar palabras más pequeñas e incluso cómo funcionan juntas las combinaciones de sonidos. Uno podría asumir con seguridad que las palabras más comunes son también las más cortas.

Por ejemplo, si considera cualquier combinación de los 4 fonemas en una palabra de 3 fonemas (suponiendo que solo Onset, Nucleus y Coda ), obtiene

4 ! ( 4 3 ! ) = 24 , palabras

¿Es esto suficiente para un idioma? Sí, en teoría. Tenga en cuenta que esto supone que, por ejemplo, a, s, d and f represente nuestros fonemas, esa fffes una palabra válida, que en realidad puede no ser distinguible de ff(nota, dos palabras de fonema no son parte de nuestro cálculo, pero es posible que aún existan en el ¡idioma!).

¿Cuántas palabras se requieren en un idioma para transmitir conceptos básicos? Si son más de 24, necesitaremos más fonemas. Afortunadamente, tenemos la Lista Swadesh para este mismo propósito, que afirma que, por ejemplo, se necesitan 100/207/35 palabras para transmitir conceptos básicos.

Dadas estas restricciones, podemos usar wolframalpha para decirnos los fonemas mínimos para hacer suficientes palabras de 3 fonemas para transmitir estos conceptos:

X ! ( X 3 ! ) > 100 , x = 5.7 o ~6 fonemas ,

X ! ( X 3 ! ) > 207 , x = 6.9 o ~7 fonemas ,

X ! ( X 3 ! ) > 35 , x = 4.3 o ~5 fonemas ,

Esto da una región aproximada para el número mínimo, dadas las restricciones anteriores. Dado que las palabras más largas y más cortas que 3 fonemas pueden existir y existen en los idiomas, este no es un límite absoluto. Entonces, puede tener solo 5 fonemas, lo que da 60 palabras de 3 fonemas y luego 40 palabras con 1, 2, 4 o más fonemas. O más mínimamente con 4 fonemas, 24 palabras de 3 fonemas y al menos 11 con 1,2,4 o más fonemas.

4 ! ( 4 3 ) ! + 4 ! ( 4 2 ) ! + 4 ! ( 4 1 ) ! = 24 + 12 + 4 = 40 palabras

Como puede ver, incluir las palabras más cortas significa que podemos redondear hacia abajo en lugar de hacia arriba con 4 fonemas para obtener la lista más pequeña (35). Hacer lo mismo con 5 fonemas nos deja 15 palabras por debajo de las 100, pero incluir palabras de 4 fonemas nos deja 3 palabras por debajo de la lista más larga . Si asumimos que muchas menos combinaciones son palabras válidas, se necesitan combinaciones de fonemas aún más largas.

Conclusión

Cualquier número de fonemas funciona, pero dependiendo de si elige 1, 2, 3 o más, cambia la forma en que construye el idioma en sí.

Si combina inflexiones complejas y acentúa, la densidad de información aumenta enormemente, incluso sin la adición potencial de gestos/expresiones faciales.
@Rottweileronmarket-day. estuvo de acuerdo, pero entonces diría que solo tienes más fonemas en tus manos (¿oídos?). Al menos así es como yo intentaría calcularlo. Por ejemplo, A-acentuado-FS y AFS varían según un fonema, porque ahora está distinguiendo entre acentuado y no acentuado.
Bastante justo, eso tiene sentido.
No estás pensando muy "alienígena". Está asumiendo que el modo de comunicación es un habla humana, cuando incluso los humanos exhiben al menos otros dos modos (señales y silbidos).
@JohnO No necesito hacerlo para esta pregunta... Pensé que sí, puedes hacer que el 'fonema' sea lo que quieras si te hace sentir más como si esto fuera 'alienígena'.
Es posible que desee mencionar en algún lugar que el CÓDIGO MORSE es un ejemplo de un lenguaje unario. El código Morse es simplemente señal o no hay señal. Sonido, o sin sonido. Sin embargo, es suficiente para transmitir mensajes complejos. De hecho, también lo es este Internet que está transmitiendo todo lo que discutimos ahora. TCP/IP es transmisión asíncrona de: señal o silencio. Sin embargo, uno puede exprimir una película de transmisión completa a través de él.
Sin embargo, el código morse de @PcMan no es un idioma, es un código. También está hecho de puntos y rayas, por lo que no es unario.
@Pureferret ¡No! El código Morse no contiene puntos ni guiones. Solo contiene silencio o pitido . un punto es solo un pitido corto, una raya es un pitido largo. mismo sonido, solo duración relativa. ¿Y qué es esa tontería de discriminar un "código" de un "lenguaje"? ¿ Especialmente un lenguaje construido como pregunta el OP?
Estoy de acuerdo, para una especie alienígena, puede haber poca diferencia entre el código y el lenguaje. Sin embargo, ahora estoy indeciso sobre si Morse es unario o binario, parece cruzar la línea allí.
@Pureferret Genial, ¡nunca antes me había encontrado con la lista Swadesh! Gracias por incluirlo. Sin embargo, me pregunto acerca de la afirmación de que tenía la intención de enumerar "palabras necesarias para transmitir conceptos básicos" ... la página wiki parece afirmar que el propósito de la lista es más comparar idiomas entre sí por similitud. Aunque hay una fuerte superposición, supongo. ¡De todos modos! Otra "lista básica de palabras/ideas" con la que me he topado se llama Metalenguaje Semántico Natural, o NSM. ¿Ya te lo has encontrado? Podría ser útil
@pcman un código o cifrado codifica el lenguaje existente. Es por eso que en el código Morse cada 'palabra' es en realidad una letra.
@johno si solo hay un pitido y un pitido, es binario. Si la duración del pitido importa es unaria.
Esta no es una muy buena respuesta. Una buena respuesta haría referencia a la lingüística real, esto es solo combinatoria desinformada.
@ AzorAhai-him- correcto. No estoy seguro de por qué ha sido votado tan altamente.
Re: Código Morse. No importa que el código Morse de IRL codifique letras en inglés, lo que importa es que con un sonido se puede codificar el significado, usando solo la tasa de uso. Si una persona está lo suficientemente bien entrenada, puede "leer" Morse con solo escuchar los pitidos, no necesita escribirlo. Puede omitir al intermediario y simplemente tratarlos como palabras directamente. Los extraterrestres obviamente tendrían diferentes patrones con las palabras más comunes siendo las más cortas, por ejemplo, '--'. para 'rock' o algo así.
@rbarret en ese momento no estás hablando del código Morse. Ese era mi único punto. De lo contrario, tienes razón

Tonos e inflexión

Teóricamente necesitas uno .

Una letra puede tener múltiples significados con solo Inflexión. Existe en muchos idiomas. Una flexión diferente del mismo fonema puede distinguir una palabra de otra. Con un idioma limitado en fonemas, es probable que expresen las diferencias de otras maneras, de las cuales la inflexión es una de las primeras que se les ocurre. Sin embargo, incluso puedes hacer que se silben.

Puede pensar que es imposible o demasiado difícil, pero una raza alienígena que creció con él puede distinguir las diferencias de tonos a un nivel mucho más profundo. Es la diferencia entre una persona sorda o un músico altamente calificado, solo que en lugar de aprender, tienen miles, si no millones/billones de generaciones de evolución. Podían distinguir detalles tan minuciosos en los tonos que parecerían imposibles sin la electrónica. Esto puede significar que, en teoría, un solo fonema puede transmitir más información que todos los fonemas de los lenguajes humanos.

Incluso si necesita un lenguaje similar al humano, puede ponerle inflexiones o tonos. Dependiendo de si quieres un lenguaje similar al humano o completamente extraño, la respuesta es dos o uno respectivamente.

¿En qué se diferencia un fonema con diferentes tonos e inflexiones de solo varios fonemas?
@Pureferret si dice que la letra E con ag bemol o e bemol sigue siendo el mismo fonema por lo que puedo decir, pero puede transmitir información. Pero alguien más informado puede corregirme.
@Trioxidane Fonema: "cualquiera de las unidades de sonido perceptivamente distintas en un idioma específico". Si puede escuchar la diferencia, entonces, por definición, no son el mismo fonema. Así, la letra E con ag bemol o e bemol son dos fonemas diferentes. Entonces, una E sostenida durante 500 ms es diferente de una E sostenida durante 520 ms, si el hablante y el oyente pueden discernir la diferencia entre esas dos longitudes. Si no pueden percibir una diferencia, entonces son el mismo fonema.
@PcMan eso es cierto. Aún así puede ser una respuesta válida. Es posible que tenga muchos fonemas, pero soluciona el problema de la articulación. La inflexión ahora también se sugiere en el comentario de la otra respuesta, lo que los convierte en un fonema diferente también.
@PcMan: No, incluso si puede escuchar la diferencia, puede ser el mismo fonema. Solo si puede escuchar la diferencia y puede encontrar dos palabras que se distinguen solo por esa diferencia, entonces puede decir que tiene dos fonemas distintos. Quizás en inglés un buen ejemplo sería la diferencia entre la clara [l] (como en lean ) y la oscura [ɫ] (como en all ); son claramente distintos, pero no hay un par mínimo de palabras donde la distinción haga una diferencia (porque los dos alófonos no pueden aparecer en el mismo contexto fonético).
@AlexP eso solo hace que esto sea diferente, pero sigue siendo relevante para mi respuesta. Como usted menciona, es válido si puede distinguir diferentes significados para él, que es la idea en mi respuesta. Así que cada uno es un fonema diferente.
@Trioxidane: Estaba respondiendo yo PcMan... (Pero entonces los fonemas son entidades abstractas de todos modos, y puedes contar, por ejemplo, en griego, η , ή y como tres fonemas, o como un fonema + uno de tres tonos .)