¿Hay una forma más efectiva de construir un idioma que una lista de frecuencia de palabras?

Estoy en el proceso de crear mi propio idioma y, hasta ahora, he creado un conjunto de vocabulario básico de unas 200 palabras. A partir de aquí, sin embargo, no estoy seguro de qué vocabulario debo trabajar para agregar primero. Obviamente, crear un lenguaje con el vocabulario de un lenguaje natural completo, con cientos de miles de palabras, es improbable y poco práctico. Sin embargo, quiero poder expresar una variedad de pensamientos e ideas en mi idioma, como lo haríamos en cualquier otro idioma natural, así que para lograr este efecto, he estado usando Wordcount , que rastrea la frecuencia de las palabras en inglés y los clasifica.

Según Nation & Waring (1997) ,

  • 1000 palabras más frecuentes: 72,0%
  • 2000 palabras más frecuentes: 79,7%
  • 3000 palabras más frecuentes: 84,0%
  • 4000 palabras más frecuentes: 86,8%

Como puede ver, conocer las primeras 2000 palabras de un idioma representa casi el 80% del uso en la comunicación diaria. Debido a estas estadísticas, me inclino a seguir usando listas de frecuencia de palabras. Sin embargo, no estoy seguro de si esta es la forma más efectiva de hacerlo.

¿Existe una forma más efectiva de construir el vocabulario de un idioma ficticio que una lista de frecuencia de palabras? (¡No quiero simplemente ir al diccionario! como respuesta, por cierto).

Esto es muy amplio. Después de todo, siempre puede modificar la gramática del idioma y la práctica del habla de manera adecuada para evitar palabras extrañas: puede permitir que una palabra signifique cosas diferentes según el tono (como el tailandés), puede borrar los sustantivos de género (como el inglés), puede deshacerse de tiempos en conjunto (como el chino). No estoy seguro de cómo podemos responder a esto sin algún conocimiento de las reglas específicas de su idioma.
@AkshatMahajan Tenemos toneladas y toneladas de sustantivos de género, esa es la norma. ¿Te refieres a verbos de género? Nosotros pocos a ninguno de esos.
@XandarTheZenon Quise decir en términos de inflexión. Podemos referirnos a los sustantivos como un él o ella implícito , pero "silla" todavía se pronuncia "silla" independientemente de de quién sea la silla.
Concepto interesante, ¿cuáles son algunos lenguajes que hacen eso?
¿Debería migrarse esto a stackexchange de lingüística ? AFAIK la construcción del lenguaje es un tema lingüístico que hace que la pregunta encaje perfectamente. Nota: Todos los profesionales en la Lista de creadores de idiomas de Wikipedia tienen experiencia en lingüística, al igual que JRR Tolkien, mundialmente famoso no solo por sus novelas sino también por los idiomas que creó para ellas.
Hay más en un idioma que solo el significado de las palabras individuales, por ejemplo , en.wikipedia.org/wiki/Darmok . No sé si quieres tomar una dirección similar. Y luego está Janeway insultando a los extraterrestres poniendo sus manos sobre sus hibs. Para los alienígenas, la postura era tan importante como las palabras.
y no se olvide de las palabrotas, la leyenda dice que cuando se desarrolló el hebreo moderno dejaron de lado las palabrotas y el peor insulto disponible era burro .
@XandarTheZenon El francés tiene sustantivos masculinos y femeninos (en lugar del "eso" indefinido en inglés). Para mayor diversión, algunos sustantivos se pueden usar con cualquier género, o el género puede cambiar con el significado. Tampoco hay una regla al respecto, es arbitrario. También alemán, con un tercer género neutro. AFAIK, idiomas basados ​​​​en latín también.
Una nota: no haga que sus palabras coincidan perfectamente con el inglés, ya que entonces es solo "inglés, pero las palabras se escriben de manera diferente". Por ejemplo, en lugar de perro, puede tener una palabra para perros grandes y una palabra para perros pequeños. Lobo podría ser la misma palabra que un perro grande (tal vez con un adjetivo, lo que lo convierte literalmente en "perro grande salvaje"). Si no pierdes nada al traducir tu idioma con el inglés (u otro idioma), lo estás haciendo mal.
Aparentemente, tal lenguaje se llama Relex .
@PyRulez Tengo exactamente lo que dijiste ya en mi idioma. Por ejemplo, hermano en mi idioma es "minlitkin" que significa hombre-pequeña-familia. ¿Quién es un niño en tu familia? ¡Su hermano!
@ fi12 Un buen recurso para llevar eso a un nivel superior es este , si está interesado.
Hay una propuesta de lenguajes construidos A51 que puede resultarle interesante @ fi12
¿Está extrapolando del lenguaje existente o creando un lenguaje natural fingido de un grupo divorciado de la realidad? Si es lo primero, ya tienes tus raíces, sintaxis, et alis, y tu creación es un ejercicio de evolución. Si no, necesita averiguar un poco más, por ejemplo, cómo piensa su gente y qué es importante para ellos. La cultura impulsa el lenguaje más que al revés. (contrariamente al absurdo concepto de "tienes que pensar en palabras"). Para obtener respuestas significativas, debes especificar... Aunque el caso trivial: "Sí".
Uno podría pensar que si una pregunta se iba a poner en espera por ser demasiado amplia para atraer respuestas útiles, sería mejor hacerlo antes de que atrajera 10 respuestas excelentes, 33 comentarios de 23 comentaristas diferentes, 50 votos positivos, más de 100 votos positivos de respuesta, Más de 50 comentarios positivos, al menos 4700 visitas a la página, tres días de debates animados y fascinantes, y un espacio en la barra Hot Network Questions.
Nominado para la reapertura, por todas las razones mencionadas por @AIBreveleri pero también porque leí todas las respuestas y hay mucho material excelente de construcción de mundos allí. Esta página debería aparecer en una búsqueda de Google de 'cómo crear un idioma' y no cerrarse.
@OldBunny2800: Los lenguajes construidos están vivos ahora y también tienen una pregunta relacionada aquí: conlang.stackexchange.com/q/459/142

Respuestas (12)

No tengo una referencia, pero algunos filólogos y lingüistas han especulado que podrías sobrevivir (explicar quién eres, pedir trabajo y comida, etc.) en una tierra extranjera con tan solo 500 palabras. Henry C. Fenn, autor de varios textos de idiomas, consideró que un vocabulario de 5000 palabras era suficiente para apoyar el aprendizaje de nuevas palabras por contexto, por ejemplo, conversando con nativos y leyendo periódicos. En mi propia experiencia como lingüista y traductor, encontré 5000 palabras genéricas más unas 2000 palabras tópicas (las que fueron populares durante unos pocos años) suficientes para mantenerse al día con los acontecimientos actuales. Esto le da una idea del tamaño del vocabulario que debe considerar.

Estoy de acuerdo en que generar un vocabulario simplemente inventando alternativas a las 5000 a 7000 palabras más populares en su idioma nativo es tedioso y lento. Peor aún, no es divertido. Peor aún, el lenguaje resultante tiene un riesgo elevado de ser insípido y posiblemente tonto.

Le sugiero que primero cree una lista de elementos de palabras y luego componga la mayoría de las palabras de su vocabulario alterando y uniendo estos elementos. Si lees sobre la Ley de Grimm y cómo se reconstruyó el protoindoeuropeo (PIE), verás a lo que me refiero.

Busque en la web "lista de palabras proto indoeuropeas" y cree una lista de significados de los elementos. Deseche las palabras PIE y sustitúyalas por las suyas. Probablemente solo necesite hacer unas 300 raíces de palabras.

Inventa algunas reglas sobre la combinación de raíces en palabras. No necesitas ser perfecto o completo porque estás imitando un proceso que tiene lugar durante milenios, durante el cual las reglas cambiarían.

Inventa algunas reglas sobre cómo los sonidos pueden cambiar con el tiempo y aplícalas de manera consistente en todas las palabras. Por ejemplo: después de generar 1000 o 1500 palabras, cambie todos los sonidos 'P' en su lista de elementos a 'B' y todos los 'T' a 'D'.

Ahora, así es como alivia el tedio y el trabajo, que es el punto de todo esto: ya que está seguro de que tiene un método racional para producir palabras creíbles, no invente las 7000 palabras a la vez. Comience con unos pocos cientos y, después de eso, cree nuevas entradas de diccionario a medida que las necesite.

Cada vez que necesitas una palabra, la buscas en tu diccionario. Si no está allí, lo genera y lo agrega al diccionario en ese momento. Como ya tiene muchas reglas para formar palabras, inventar la nueva será rápido.

Si no quiere ser la única autoridad en la formación de palabras, puede tirar los dados o escribir un programa de computadora aleatorio. Si el idioma se usa en un juego de rol, la regla podría ser "El primer jugador en abrir el diccionario genera la nueva palabra".

¿Qué pasa con las 200 palabras que ya tienes? Bueno, considera esto. El inglés, aunque es un idioma del grupo PIE, en realidad desciende de dos ramas distintas, la teutónica y la romance. (Es por eso que la ortografía en inglés es tan difícil. Casi la mitad de nuestras palabras provienen del bajo alemán, anglicano, danés, etc. y presentan una ortografía germánica, mientras que casi la mitad provienen del latín, francés y normando, y presentan una ortografía del francés antiguo. )

Por lo tanto, si tiene palabras de sus 200 originales que desea conservar y que no se pueden derivar racionalmente de su lista de elementos, simplemente declare que surgieron de una rama separada o incluso de un protolenguaje separado.

No veo cómo esto podría dejar de ser divertido.

Breverli Me interesó genuinamente en esta pregunta y proporcionó recursos muy útiles. Buen trabajo.
Como apéndice, Randall Munroe mostró en "Thing Explainer" que si alguien sabe solo las diezcientas palabras más comunes, esas palabras son suficientes para describir casi cualquier cosa. Por supuesto, las descripciones son muy específicas del contexto, pero todas las conversaciones son específicas del contexto de todos modos.
"No veo cómo esto podría dejar de ser divertido" +1. Gran respuesta.
+1 por reconocer el estatus especial del inglés. La mayoría de los lingüistas lo colocan en germánico occidental, pero siempre lo he considerado el hijo bastardo de las familias germánica y romance. La influencia romance se encuentra casi sin excepción en versiones "corteses", literalmente de clase alta, de las palabras comunes, "vulgares" derivadas del anglosajón, debido a los nobles franceses normandos traídos con Guillermo el Conquistador. Si su idioma tiene una historia de fondo como esa, puede ser tan complicado como el inglés.
Combina dados con las raíces de la palabra. buen consejo!
"algunos filólogos y lingüistas han especulado que podrías sobrevivir (explicar quién eres, pedir trabajo y comida, etc.) en una tierra extranjera con tan solo 500 palabras". Me parece que solo se necesitarían tres o cuatro palabras para estas cosas: hombre, trabajo, comida y agua. E incluso esas cuatro palabras no serían necesarias para sobrevivir si pudieras usar gestos con las manos y lenguaje corporal para imitar cada una de esas cosas.
@Monty: Hay una teoría seria, popular entre los lingüistas, de que el vocabulario del inglés que hablamos hoy en día es en gran parte el resultado de los soldados normandos que intentaron recoger a las camareras sajonas alrededor de 1075-1155 EC.
@Monty, re 'cortés' frente a palabras 'vulgares': es por eso que tantas palabras para animales vivos son anglicanos o sajones, pero las palabras para su carne en la mesa son normandas: venado -> venado (venaison); vaca --> carne de res (boeuf); pollo --> aves de corral (poulet); cerdo --> puerco (cerdo). Adivina quién tuvo que cazar o criar a los animales y quién se los comió. -- Pero no hay una sola palabra para carne de caballo. ¿Por qué? Porque ni los normandos ni sus súbditos comían sus caballos. Si lo hubieran hecho, la carne de caballo sería 'chevalle'.

Mi recomendación sería realizar una conversación simulada en tu cabeza entre dos hablantes que sean típicos de la cultura en cuestión.

Algunas cosas para tener en mente:

  • ¿De qué hablarán probablemente los hablantes del idioma? Por ejemplo, algunos temas pueden usarse más en un escenario medieval (p. ej., "hacha") que en un escenario del espacio exterior. Elija una conversación que trate sobre un tema común de interés.
  • ¿En qué patrones de habla es probable que caigan los hablantes? Por ejemplo, los klingon a menudo no usan saludos sino que van directo al grano, mientras que otras especies los usan mucho. "Hola" puede no ser una de las palabras más comunes, pero va a ser esencial.

Usando esta visión, dos oradores típicos hablan sobre un tema relativamente común. Revísalo en tu cabeza en tu idioma nativo y averigua qué palabras necesitarás. Muchos diálogos tendrán algunas características comunes, incluso si el contenido exacto difiere. Una vez más, habrá patrones de habla comunes y frases compartidas.

La razón por la que elegiría una conversación en lugar de una lista de palabras es que las palabras más comunes en inglés pueden no ser las palabras más necesarias en este idioma. Varios factores influirán en qué palabras son esenciales para cada conversación (por eso di saludos como ejemplo) y cuáles no. La frecuencia no siempre es la mejor determinación de la importancia.

Incluso si la gente deja de usar hachas, la palabra puede sobrevivir a través de la metáfora.
@AntonSherwood Buen punto, aunque supongo que con el tiempo, el uso desaparecerá a medida que menos y menos personas entiendan la esencia de la metáfora.
La mayoría de los hablantes de francés e italiano probablemente no conocen los significados de la palabra latina ancestral de su palabra común para 'cabeza'...
@AntonSherwood, especialmente si tienes un hacha para moler. O si necesitas romper el hielo antes de enterrar el hacha.

Un hombre llamado Mark Rosenfelder ha escrito tres libros muy respetados sobre la creación de un conlang. El más relevante para su consulta es The Conlanger's Lexipedia . Entre otras cosas, contiene una "Lista de palabras de frecuencia de fantasía, una lista de 1500 elementos de las raíces más comunes de un corpus de fantasía y ciencia ficción de 1,1 millones de palabras". Igualmente importante, también hay un material sobre cómo hacer que sus elecciones de palabras y definiciones sean creíblemente diferentes del inglés y/o los idiomas humanos en general.

Confieso que no he puesto el trabajo duro necesario para hacer más que jugar un poco creando un conlang, pero los tres libros me parecieron muy interesantes de leer. Los otros dos son The Language Construction Kit y Advanced Language Construction , los cuales también tienen secciones que tratan sobre la construcción de vocabulario. Si desea un libro más ligero, Create a Language Clinic de Holly Lisle es una introducción accesible al tema. Es mucho menos científico que los libros de Rosenfelder, pero lo ayuda a comenzar ahora mismo.

En mi experiencia, las versiones en papel de los libros combinados son más fáciles de trabajar que las versiones de libros electrónicos.

Metalenguaje semántico natural

El Metalenguaje Semántico Natural (NSM, por sus siglas en inglés) es una especie de mini-lenguaje, para el cual cualquier otro lenguaje (al menos los que han estudiado, que entiendo que son numerosos) se puede descomponer. Por ejemplo, una traducción de la palabra inglesa "feliz"

alguien X es feliz (en este momento) -se traduce como->

  • alguien X piensa así en este momento:
    • "muchas cosas buenas me estan pasando como quiero
    • Puedo hacer muchas cosas ahora como quiero
    • Esto es bueno"
  • por eso este alguien siente algo bueno en este momento
    • como alguien puede sentir cuando piensa así

Contiene 56 "palabras" primitivas o números primos, a partir de los cuales se pueden formar frases como las anteriores. Dado que no es un idioma completo, estas "palabras" no recibieron ortografía ni nada. Tampoco tiene gramática. Si proporciona palabras en su idioma que se correspondan con estas, podrá decir todo lo que necesite, aunque podría ser largo. Sin embargo, esto es bueno si a su idioma le faltan algunas palabras.

Traducciones de ejemplo de lista de palabras

Una vez más, no basaría su lenguaje completamente en esto, pero es un buen comienzo y puede llenar los agujeros hasta que los rellene.

Este tipo de proceso de pensamiento sería especialmente útil si estás creando un lenguaje polisintético. Puedo imaginar perfectamente "me están pasando muchas cosas buenas como quiero" como la traducción de "Soy feliz" en algún lenguaje polisintético.

Si todas las palabras del idioma coinciden 1 a 1 con las palabras en inglés, es básicamente un código para inglés.

Pitjantjatjara, por ejemplo, no tiene una palabra que signifique lo que significa la palabra en inglés brother.

Incluso los idiomas europeos difieren en los contextos que tienen. Si quiero traducir la palabra alemana al Wahrscheinlichkeitpolaco, me ofrece una opción prawdopodobieństwosegún Leo . Por otro lado, el inglés me ofrece 8 opciones : probability, verisimilitude, chance, plausibility, presumptiony .feasibilitylikeliness

El inglés permite hacer muchas más distinciones que el polaco cuando se habla de probabilidades.

Por otro lado, los idiomas ingleses usan palabras como to feelo to been muchas formas diferentes. Ser sirve esencialmente al propósito de cuatro términos del Metalenguaje Semántico Natural ubicación, existencia, especificación y posesión.

Dejar que 4 de los 56 conceptos más importantes de un idioma estén representados por la misma palabra parece un desperdicio y, sin embargo, el inglés funciona bien. Esto significa que su idioma también puede reutilizar palabras si no tiene suficientes palabras.

Dependiendo del propósito de su idioma, no tiene que agregar toda la palabra al principio. Cuando descubra que actualmente no puede hablar sobre algo que sería importante, simplemente puede agregar nuevas palabras.

No haga una lista de palabras de propósito general, si está creando su propio idioma, probablemente lo esté creando para algún propósito (supongo que para algún libro, juego o algún trabajo ficticio). Así que primero crea palabras para oraciones que realmente se usan en tu trabajo (eso es todo, haz que tu trabajo valga la pena, no pierdas el tiempo inventando cosas que probablemente no usarás).

No tiene sentido, por ejemplo, hacer las 5000 palabras más comunes si está escribiendo una historia de un mago que trabaja en su torre mágica usando nombres técnicos.

También sea creativo y reutilice las palabras existentes que ya no están en uso, para el lector habitual esas palabras parecerán un nuevo idioma, pero al menos algunas de ellas tendrán un significado para una persona superior a la media. Como programador, de hecho, encuentro que hay muchos términos relacionados con la informática que podrían ser útiles en la vida real, pero desafortunadamente la mayoría de los no programadores no saben el significado de esas palabras (por ejemplo: el concepto de "localidad de caché" y la eficiencia explica por qué la gente desordenada es más productiva, cuando veo que la gente de los demás se ensucia, pienso "es solo su caché", pero para la gente común, un desastre es solo un desastre).

También invente algo de etimología, debería ser fácil usar pocas palabras para hacer nuevas palabras a partir de eso, eso le da a su idioma una historia y lo hace más realista. El idioma depende mucho de cómo se comporte su mundo, así que asegúrate de tener un mundo muy realista, trata de descubrir posibles situaciones en ese mundo, toma ejemplos de autores que ya intentaron hacer eso y descubre falacias y puntos fuertes en su idiomas

el lenguaje evoluciona en el contexto, por ejemplo, para la mayoría de los animales de granja tenemos diferentes nombres para bebés, versiones masculinas y femeninas, mientras que para los animales fuera de las granjas solo tenemos un nombre único, eso se debe a nuestro pasado trabajando en granjas).

sabía que algún programador invocaría a yagni.

Me disculpo de antemano porque siento que esto sería más adecuado como comentario, pero no tengo la reputación necesaria.

Creo que todas las demás respuestas son excelentes, pero solo quiero agregar otra consideración que usé en mi último conlang y que encontré realmente útil. Si considera los dominios semánticos en la generación de vocabulario, evitará mucho más fácilmente volver a mapear el inglés (o cualquiera que sea su idioma preferido). Solía ​​​​tener un PDF que tenía varias docenas de webs de dominio semántico que cubrían mucho vocabulario básico y también provocaban palabras más oscuras, pero el enlace está muerto ahora y por mi vida no puedo encontrar un buen reemplazo a través de una búsqueda superficial en Google. Pero estoy seguro de que si realiza una búsqueda por su cuenta, puede encontrar algunos buenos ejemplos básicos para observar.

Esencialmente, lo que esto implica es que tienes una red de conceptos relacionados, y diferentes idiomas asignarán diferentes lexemas a diferentes agrupaciones de estos conceptos. Por ejemplo, en inglés tenemos: cloud, fog, mist, steam, smoke; y sin molestarse en buscar sus etimologías, todas esas palabras parecen no tener relación. Mirar redes conceptuales como esta podría ayudarlo a pensar si desea que una palabra cubra "nube" y "niebla" pero tenga dos palabras diferentes para vapor de agua hirviendo y vapor de agua tibia (como en una fuente termal en el invierno ).

Desearía tener webs o mapas de dominios semánticos listos para vincularlos, pero me resulta difícil encontrar algo mejor que ejemplos genéricos. Sin embargo, como herramienta complementaria, creo que es algo que no debería ser demasiado difícil de hacer por su cuenta en su idioma nativo solo para usarlo como punto de partida para la generación de vocabulario. No creo que alcance las 10.000 palabras como esta, pero puedo atestiguar personalmente que puede mejorar significativamente su tasa de generación para sus primeros cientos de palabras una vez que se acostumbre a considerar inmediatamente todos los lexemas relacionados conceptualmente para cada uno. palabra básica. Puede colapsar algunos en una sola palabra y agregar distinciones adicionales para otros. Es un poco alucinante cuántas palabras diferentes emplean los humanos para cosas que apenas son diferentes. (Por supuesto,

No necesitas disculparte. El concepto de 'dominios semánticos' es lo suficientemente distinto del 'metalenguaje semántico natural' (lo siguiente más cercano ya mencionado en otras respuestas) para justificar su propia respuesta.
Un diccionario de sinónimos parece un buen punto de partida para tales mapas.

Al inventar un idioma eres básicamente un aprendiz de idiomas (de tu propio idioma). Tienes que averiguar qué palabras se necesitan para hacer uso del idioma. Por lo tanto, le sugiero que no reinvente la rueda, sino que eche un vistazo a lo que otros ya hicieron en este campo.

¿Tu mundo es el típico estilo tardorromano/medieval temprano? Entonces, el vocabulario de un aprendiz de latín o griego sería perfecto para lo que está buscando: contiene normalmente entre 1500 y 5000 (según el nivel) palabras muy comunes que van desde la vida cotidiana (por ejemplo, nombres de alimentos, comercio, etc.), vida política (por ejemplo, "carrera", "soborno", etc.), vida religiosa (palabras para "templo", "rito", etc.) hasta la vida militar (por ejemplo, palabras para armamento y otros equipos de guerra).

¿ Tu mundo es más bien steampunk ? Entonces, el vocabulario de un aprendiz de francés-inglés o inglés-francés de finales del siglo XIX podría cubrir lo que necesita. Estos son difíciles de conseguir, lo sé, pero lo más probable es que http://www.archive.org o http://books.google.com alberguen algunos escaneos. En caso contrario consultar en anticuarios (de todo tipo: libros, muebles, etc.). Dichos libros normalmente tienen un valor (monetario) más bien pequeño, por lo que no deberían costarle demasiado. Compré un diccionario de francés del siglo XIX por tan solo 8 CHF (aprox. 8,50 USD).

Si su mundo es ciencia ficción , entonces el vocabulario de un estudiante de idiomas moderno sería suficiente. Contiene términos de la vida cotidiana, términos tecnológicos, etc.

Ese método me ayudó mucho a crear mis primeros idiomas. Los vocabularios (y las gramáticas) de los alumnos siempre cubren a la perfección los conceptos básicos para que un idioma sea utilizable.

principalmente un resumen de otras respuestas:

  1. invoca el principio yagni y solo inventa palabras cuando las necesites. simplemente agréguelos al diccionario a medida que los inventa para el diálogo de su historia.
  2. tendrá que inventar tanto el vocabulario (palabras) como la gramática (por ejemplo, la estructura de las oraciones) para crear un idioma verdaderamente único (en lugar de un simple libro de códigos de palabras en inglés).
  3. probablemente querrá inventar raíces, conjugaciones y declinaciones (p. ej., prefijos, cambios de vocales, sufijos) para crear un vocabulario realista y coherente. una buena introducción a la lingüística le dará una idea de lo que es posible.
  4. Además del idioma, probablemente querrás pensar en el sistema de escritura . críticamente, fonético vs no fonético y ligaduras .
  5. busca el consejo de alguien que realmente haya logrado lo que estás tratando de hacer. por ejemplo, tolkien escribió un libro ( un vicio secreto ) sobre la invención de idiomas.

Como es habitual en este tipo de preguntas, el descargo de responsabilidad habitual. La forma en que crearía un idioma depende en gran medida del propósito para el que lo quiera poner. Si su objetivo es simplemente poner un par de palabras que suenan extrañas en una obra de ficción, puede inventarlas a medida que avanza. Si desea comunicarse en un conlang, puede consultar la lista de frecuencias; sería más un código de sustitución que un idioma.

Sin embargo, si tu objetivo es crear un lenguaje que sea semi-independiente de la obra de ficción que escribes, te propongo hacerlo de otra manera. Me basaré ahora tanto en mi experiencia de trabajar con el Procesamiento del lenguaje natural como en mi interés por los lenguajes de Tolkien.

Primero, necesitas fonología y gramática, en el orden que sea. Si está creando un lenguaje realista desde cero, va a trabajar con raíces, no con palabras individuales. Entonces, antes de ir allí, debe averiguar qué fonemas tiene en su idioma, cuáles son las reglas fonéticas que funcionan en él. Debe comprender qué partes del habla tiene y la forma en que la raíz se puede convertir en otra parte del habla.

Las raíces vienen después. Recomendaría usar no la lista de frecuencias, sino la lista de Swadesh . Las palabras de la lista serían las más arcaicas, y eso significa muchas cosas. Primero, revisando esta lista, puede hacer correcciones que serían importantes para su entorno y las personas que hablan este idioma. Tal vez no tengan roles de género y no los hayan tenido desde el comienzo mismo de la especie, entonces no tendrán raíces separadas para el hombre y la mujer. Otra cosa importante de las raíces arcaicas sería que serán en su mayoría irregulares en conjugación y declinación.

Cuando haya pasado esos pasos, tenga el marco gramatical básico en su lugar, las leyes fonéticas y el vocabulario básico (swadesh, no de frecuencia), tendrá la sensación de su idioma, su ritmo y cadencia, comprenderá la forma en que se construyen las frases, etc. Ahora puedes ir llenando los huecos de tu diccionario según sea necesario escribiendo textos en ese idioma.

Una buena ventaja de una forma de construir el idioma de esta manera es que puedes aplicarle las leyes de la glotocronología para crear idiomas relacionados con diferentes grados de separación; eso es más o menos lo que hizo Tolkien con varias ramas de los idiomas élficos.

Una posibilidad es tomar un idioma real completamente extraño para ti (que no conoces) y luego aprenderlo. (por ejemplo, esas cosas del tipo aprender el idioma en cinta)

Sin embargo, cada palabra que aprenda de ese idioma, sustitúyala por su propia palabra.

Algunos inconvenientes que conozco, por ejemplo

  1. No obtendrá una etimología adecuada y, por lo tanto, las palabras que "deberían" sonar similares no lo harán. (Aunque podría modificar con respecto a la historia y cultura de su mundo)

  2. Tendrás que vivir con la misma estructura de oración que el lenguaje "fáctico"

  3. Puede que acabes pensando en formas de preguntar cómo llegar a la playa ;)

Aprender idiomas extranjeros reales es realmente útil para crear un conlang, pero no es muy satisfactorio copiar las palabras y la estructura de la oración directamente, y si obtienes vocabulario de tutoriales de idiomas reales, terminarás con un montón de palabras que no conoces. necesita y no tendrá un montón de lo que necesita, por ejemplo, su antigua lengua élfica podría terminar con palabras para "inodoro" y "piña" y carecer de palabras para "árbol" y "cuerda".

Tengo una idea mejor para ti. ¿Qué tal si agregas una palabra cuando sea necesario? Así que di que le estás escribiendo una carta a tu novia y necesitas una palabra de amor, ¡haz una entonces! De esa manera, no tiene que preocuparse por tener que crear miles de palabras en el acto y no volver a usarlas nunca más. ¡Porque recuerda que las palabras más frecuentes no son tus palabras más frecuentes!