Estoy en el proceso de crear mi propio idioma y, hasta ahora, he creado un conjunto de vocabulario básico de unas 200 palabras. A partir de aquí, sin embargo, no estoy seguro de qué vocabulario debo trabajar para agregar primero. Obviamente, crear un lenguaje con el vocabulario de un lenguaje natural completo, con cientos de miles de palabras, es improbable y poco práctico. Sin embargo, quiero poder expresar una variedad de pensamientos e ideas en mi idioma, como lo haríamos en cualquier otro idioma natural, así que para lograr este efecto, he estado usando Wordcount , que rastrea la frecuencia de las palabras en inglés y los clasifica.
Según Nation & Waring (1997) ,
Como puede ver, conocer las primeras 2000 palabras de un idioma representa casi el 80% del uso en la comunicación diaria. Debido a estas estadísticas, me inclino a seguir usando listas de frecuencia de palabras. Sin embargo, no estoy seguro de si esta es la forma más efectiva de hacerlo.
¿Existe una forma más efectiva de construir el vocabulario de un idioma ficticio que una lista de frecuencia de palabras? (¡No quiero simplemente ir al diccionario! como respuesta, por cierto).
No tengo una referencia, pero algunos filólogos y lingüistas han especulado que podrías sobrevivir (explicar quién eres, pedir trabajo y comida, etc.) en una tierra extranjera con tan solo 500 palabras. Henry C. Fenn, autor de varios textos de idiomas, consideró que un vocabulario de 5000 palabras era suficiente para apoyar el aprendizaje de nuevas palabras por contexto, por ejemplo, conversando con nativos y leyendo periódicos. En mi propia experiencia como lingüista y traductor, encontré 5000 palabras genéricas más unas 2000 palabras tópicas (las que fueron populares durante unos pocos años) suficientes para mantenerse al día con los acontecimientos actuales. Esto le da una idea del tamaño del vocabulario que debe considerar.
Estoy de acuerdo en que generar un vocabulario simplemente inventando alternativas a las 5000 a 7000 palabras más populares en su idioma nativo es tedioso y lento. Peor aún, no es divertido. Peor aún, el lenguaje resultante tiene un riesgo elevado de ser insípido y posiblemente tonto.
Le sugiero que primero cree una lista de elementos de palabras y luego componga la mayoría de las palabras de su vocabulario alterando y uniendo estos elementos. Si lees sobre la Ley de Grimm y cómo se reconstruyó el protoindoeuropeo (PIE), verás a lo que me refiero.
Busque en la web "lista de palabras proto indoeuropeas" y cree una lista de significados de los elementos. Deseche las palabras PIE y sustitúyalas por las suyas. Probablemente solo necesite hacer unas 300 raíces de palabras.
Inventa algunas reglas sobre la combinación de raíces en palabras. No necesitas ser perfecto o completo porque estás imitando un proceso que tiene lugar durante milenios, durante el cual las reglas cambiarían.
Inventa algunas reglas sobre cómo los sonidos pueden cambiar con el tiempo y aplícalas de manera consistente en todas las palabras. Por ejemplo: después de generar 1000 o 1500 palabras, cambie todos los sonidos 'P' en su lista de elementos a 'B' y todos los 'T' a 'D'.
Ahora, así es como alivia el tedio y el trabajo, que es el punto de todo esto: ya que está seguro de que tiene un método racional para producir palabras creíbles, no invente las 7000 palabras a la vez. Comience con unos pocos cientos y, después de eso, cree nuevas entradas de diccionario a medida que las necesite.
Cada vez que necesitas una palabra, la buscas en tu diccionario. Si no está allí, lo genera y lo agrega al diccionario en ese momento. Como ya tiene muchas reglas para formar palabras, inventar la nueva será rápido.
Si no quiere ser la única autoridad en la formación de palabras, puede tirar los dados o escribir un programa de computadora aleatorio. Si el idioma se usa en un juego de rol, la regla podría ser "El primer jugador en abrir el diccionario genera la nueva palabra".
¿Qué pasa con las 200 palabras que ya tienes? Bueno, considera esto. El inglés, aunque es un idioma del grupo PIE, en realidad desciende de dos ramas distintas, la teutónica y la romance. (Es por eso que la ortografía en inglés es tan difícil. Casi la mitad de nuestras palabras provienen del bajo alemán, anglicano, danés, etc. y presentan una ortografía germánica, mientras que casi la mitad provienen del latín, francés y normando, y presentan una ortografía del francés antiguo. )
Por lo tanto, si tiene palabras de sus 200 originales que desea conservar y que no se pueden derivar racionalmente de su lista de elementos, simplemente declare que surgieron de una rama separada o incluso de un protolenguaje separado.
No veo cómo esto podría dejar de ser divertido.
Mi recomendación sería realizar una conversación simulada en tu cabeza entre dos hablantes que sean típicos de la cultura en cuestión.
Algunas cosas para tener en mente:
Usando esta visión, dos oradores típicos hablan sobre un tema relativamente común. Revísalo en tu cabeza en tu idioma nativo y averigua qué palabras necesitarás. Muchos diálogos tendrán algunas características comunes, incluso si el contenido exacto difiere. Una vez más, habrá patrones de habla comunes y frases compartidas.
La razón por la que elegiría una conversación en lugar de una lista de palabras es que las palabras más comunes en inglés pueden no ser las palabras más necesarias en este idioma. Varios factores influirán en qué palabras son esenciales para cada conversación (por eso di saludos como ejemplo) y cuáles no. La frecuencia no siempre es la mejor determinación de la importancia.
Un hombre llamado Mark Rosenfelder ha escrito tres libros muy respetados sobre la creación de un conlang. El más relevante para su consulta es The Conlanger's Lexipedia . Entre otras cosas, contiene una "Lista de palabras de frecuencia de fantasía, una lista de 1500 elementos de las raíces más comunes de un corpus de fantasía y ciencia ficción de 1,1 millones de palabras". Igualmente importante, también hay un material sobre cómo hacer que sus elecciones de palabras y definiciones sean creíblemente diferentes del inglés y/o los idiomas humanos en general.
Confieso que no he puesto el trabajo duro necesario para hacer más que jugar un poco creando un conlang, pero los tres libros me parecieron muy interesantes de leer. Los otros dos son The Language Construction Kit y Advanced Language Construction , los cuales también tienen secciones que tratan sobre la construcción de vocabulario. Si desea un libro más ligero, Create a Language Clinic de Holly Lisle es una introducción accesible al tema. Es mucho menos científico que los libros de Rosenfelder, pero lo ayuda a comenzar ahora mismo.
En mi experiencia, las versiones en papel de los libros combinados son más fáciles de trabajar que las versiones de libros electrónicos.
El Metalenguaje Semántico Natural (NSM, por sus siglas en inglés) es una especie de mini-lenguaje, para el cual cualquier otro lenguaje (al menos los que han estudiado, que entiendo que son numerosos) se puede descomponer. Por ejemplo, una traducción de la palabra inglesa "feliz"
alguien X es feliz (en este momento) -se traduce como->
Contiene 56 "palabras" primitivas o números primos, a partir de los cuales se pueden formar frases como las anteriores. Dado que no es un idioma completo, estas "palabras" no recibieron ortografía ni nada. Tampoco tiene gramática. Si proporciona palabras en su idioma que se correspondan con estas, podrá decir todo lo que necesite, aunque podría ser largo. Sin embargo, esto es bueno si a su idioma le faltan algunas palabras.
Traducciones de ejemplo de lista de palabras
Una vez más, no basaría su lenguaje completamente en esto, pero es un buen comienzo y puede llenar los agujeros hasta que los rellene.
Si todas las palabras del idioma coinciden 1 a 1 con las palabras en inglés, es básicamente un código para inglés.
Pitjantjatjara, por ejemplo, no tiene una palabra que signifique lo que significa la palabra en inglés brother
.
Incluso los idiomas europeos difieren en los contextos que tienen. Si quiero traducir la palabra alemana al Wahrscheinlichkeit
polaco, me ofrece una opción prawdopodobieństwo
según Leo . Por otro lado, el inglés me ofrece 8 opciones : probability
, verisimilitude
, chance
, plausibility
, presumption
y .feasibility
likeliness
El inglés permite hacer muchas más distinciones que el polaco cuando se habla de probabilidades.
Por otro lado, los idiomas ingleses usan palabras como to feel
o to be
en muchas formas diferentes. Ser sirve esencialmente al propósito de cuatro términos del Metalenguaje Semántico Natural ubicación, existencia, especificación y posesión.
Dejar que 4 de los 56 conceptos más importantes de un idioma estén representados por la misma palabra parece un desperdicio y, sin embargo, el inglés funciona bien. Esto significa que su idioma también puede reutilizar palabras si no tiene suficientes palabras.
Dependiendo del propósito de su idioma, no tiene que agregar toda la palabra al principio. Cuando descubra que actualmente no puede hablar sobre algo que sería importante, simplemente puede agregar nuevas palabras.
No haga una lista de palabras de propósito general, si está creando su propio idioma, probablemente lo esté creando para algún propósito (supongo que para algún libro, juego o algún trabajo ficticio). Así que primero crea palabras para oraciones que realmente se usan en tu trabajo (eso es todo, haz que tu trabajo valga la pena, no pierdas el tiempo inventando cosas que probablemente no usarás).
No tiene sentido, por ejemplo, hacer las 5000 palabras más comunes si está escribiendo una historia de un mago que trabaja en su torre mágica usando nombres técnicos.
También sea creativo y reutilice las palabras existentes que ya no están en uso, para el lector habitual esas palabras parecerán un nuevo idioma, pero al menos algunas de ellas tendrán un significado para una persona superior a la media. Como programador, de hecho, encuentro que hay muchos términos relacionados con la informática que podrían ser útiles en la vida real, pero desafortunadamente la mayoría de los no programadores no saben el significado de esas palabras (por ejemplo: el concepto de "localidad de caché" y la eficiencia explica por qué la gente desordenada es más productiva, cuando veo que la gente de los demás se ensucia, pienso "es solo su caché", pero para la gente común, un desastre es solo un desastre).
También invente algo de etimología, debería ser fácil usar pocas palabras para hacer nuevas palabras a partir de eso, eso le da a su idioma una historia y lo hace más realista. El idioma depende mucho de cómo se comporte su mundo, así que asegúrate de tener un mundo muy realista, trata de descubrir posibles situaciones en ese mundo, toma ejemplos de autores que ya intentaron hacer eso y descubre falacias y puntos fuertes en su idiomas
el lenguaje evoluciona en el contexto, por ejemplo, para la mayoría de los animales de granja tenemos diferentes nombres para bebés, versiones masculinas y femeninas, mientras que para los animales fuera de las granjas solo tenemos un nombre único, eso se debe a nuestro pasado trabajando en granjas).
Me disculpo de antemano porque siento que esto sería más adecuado como comentario, pero no tengo la reputación necesaria.
Creo que todas las demás respuestas son excelentes, pero solo quiero agregar otra consideración que usé en mi último conlang y que encontré realmente útil. Si considera los dominios semánticos en la generación de vocabulario, evitará mucho más fácilmente volver a mapear el inglés (o cualquiera que sea su idioma preferido). Solía tener un PDF que tenía varias docenas de webs de dominio semántico que cubrían mucho vocabulario básico y también provocaban palabras más oscuras, pero el enlace está muerto ahora y por mi vida no puedo encontrar un buen reemplazo a través de una búsqueda superficial en Google. Pero estoy seguro de que si realiza una búsqueda por su cuenta, puede encontrar algunos buenos ejemplos básicos para observar.
Esencialmente, lo que esto implica es que tienes una red de conceptos relacionados, y diferentes idiomas asignarán diferentes lexemas a diferentes agrupaciones de estos conceptos. Por ejemplo, en inglés tenemos: cloud, fog, mist, steam, smoke; y sin molestarse en buscar sus etimologías, todas esas palabras parecen no tener relación. Mirar redes conceptuales como esta podría ayudarlo a pensar si desea que una palabra cubra "nube" y "niebla" pero tenga dos palabras diferentes para vapor de agua hirviendo y vapor de agua tibia (como en una fuente termal en el invierno ).
Desearía tener webs o mapas de dominios semánticos listos para vincularlos, pero me resulta difícil encontrar algo mejor que ejemplos genéricos. Sin embargo, como herramienta complementaria, creo que es algo que no debería ser demasiado difícil de hacer por su cuenta en su idioma nativo solo para usarlo como punto de partida para la generación de vocabulario. No creo que alcance las 10.000 palabras como esta, pero puedo atestiguar personalmente que puede mejorar significativamente su tasa de generación para sus primeros cientos de palabras una vez que se acostumbre a considerar inmediatamente todos los lexemas relacionados conceptualmente para cada uno. palabra básica. Puede colapsar algunos en una sola palabra y agregar distinciones adicionales para otros. Es un poco alucinante cuántas palabras diferentes emplean los humanos para cosas que apenas son diferentes. (Por supuesto,
Al inventar un idioma eres básicamente un aprendiz de idiomas (de tu propio idioma). Tienes que averiguar qué palabras se necesitan para hacer uso del idioma. Por lo tanto, le sugiero que no reinvente la rueda, sino que eche un vistazo a lo que otros ya hicieron en este campo.
¿Tu mundo es el típico estilo tardorromano/medieval temprano? Entonces, el vocabulario de un aprendiz de latín o griego sería perfecto para lo que está buscando: contiene normalmente entre 1500 y 5000 (según el nivel) palabras muy comunes que van desde la vida cotidiana (por ejemplo, nombres de alimentos, comercio, etc.), vida política (por ejemplo, "carrera", "soborno", etc.), vida religiosa (palabras para "templo", "rito", etc.) hasta la vida militar (por ejemplo, palabras para armamento y otros equipos de guerra).
¿ Tu mundo es más bien steampunk ? Entonces, el vocabulario de un aprendiz de francés-inglés o inglés-francés de finales del siglo XIX podría cubrir lo que necesita. Estos son difíciles de conseguir, lo sé, pero lo más probable es que http://www.archive.org o http://books.google.com alberguen algunos escaneos. En caso contrario consultar en anticuarios (de todo tipo: libros, muebles, etc.). Dichos libros normalmente tienen un valor (monetario) más bien pequeño, por lo que no deberían costarle demasiado. Compré un diccionario de francés del siglo XIX por tan solo 8 CHF (aprox. 8,50 USD).
Si su mundo es ciencia ficción , entonces el vocabulario de un estudiante de idiomas moderno sería suficiente. Contiene términos de la vida cotidiana, términos tecnológicos, etc.
Ese método me ayudó mucho a crear mis primeros idiomas. Los vocabularios (y las gramáticas) de los alumnos siempre cubren a la perfección los conceptos básicos para que un idioma sea utilizable.
principalmente un resumen de otras respuestas:
Como es habitual en este tipo de preguntas, el descargo de responsabilidad habitual. La forma en que crearía un idioma depende en gran medida del propósito para el que lo quiera poner. Si su objetivo es simplemente poner un par de palabras que suenan extrañas en una obra de ficción, puede inventarlas a medida que avanza. Si desea comunicarse en un conlang, puede consultar la lista de frecuencias; sería más un código de sustitución que un idioma.
Sin embargo, si tu objetivo es crear un lenguaje que sea semi-independiente de la obra de ficción que escribes, te propongo hacerlo de otra manera. Me basaré ahora tanto en mi experiencia de trabajar con el Procesamiento del lenguaje natural como en mi interés por los lenguajes de Tolkien.
Primero, necesitas fonología y gramática, en el orden que sea. Si está creando un lenguaje realista desde cero, va a trabajar con raíces, no con palabras individuales. Entonces, antes de ir allí, debe averiguar qué fonemas tiene en su idioma, cuáles son las reglas fonéticas que funcionan en él. Debe comprender qué partes del habla tiene y la forma en que la raíz se puede convertir en otra parte del habla.
Las raíces vienen después. Recomendaría usar no la lista de frecuencias, sino la lista de Swadesh . Las palabras de la lista serían las más arcaicas, y eso significa muchas cosas. Primero, revisando esta lista, puede hacer correcciones que serían importantes para su entorno y las personas que hablan este idioma. Tal vez no tengan roles de género y no los hayan tenido desde el comienzo mismo de la especie, entonces no tendrán raíces separadas para el hombre y la mujer. Otra cosa importante de las raíces arcaicas sería que serán en su mayoría irregulares en conjugación y declinación.
Cuando haya pasado esos pasos, tenga el marco gramatical básico en su lugar, las leyes fonéticas y el vocabulario básico (swadesh, no de frecuencia), tendrá la sensación de su idioma, su ritmo y cadencia, comprenderá la forma en que se construyen las frases, etc. Ahora puedes ir llenando los huecos de tu diccionario según sea necesario escribiendo textos en ese idioma.
Una buena ventaja de una forma de construir el idioma de esta manera es que puedes aplicarle las leyes de la glotocronología para crear idiomas relacionados con diferentes grados de separación; eso es más o menos lo que hizo Tolkien con varias ramas de los idiomas élficos.
Una posibilidad es tomar un idioma real completamente extraño para ti (que no conoces) y luego aprenderlo. (por ejemplo, esas cosas del tipo aprender el idioma en cinta)
Sin embargo, cada palabra que aprenda de ese idioma, sustitúyala por su propia palabra.
Algunos inconvenientes que conozco, por ejemplo
No obtendrá una etimología adecuada y, por lo tanto, las palabras que "deberían" sonar similares no lo harán. (Aunque podría modificar con respecto a la historia y cultura de su mundo)
Tendrás que vivir con la misma estructura de oración que el lenguaje "fáctico"
Puede que acabes pensando en formas de preguntar cómo llegar a la playa ;)
Tengo una idea mejor para ti. ¿Qué tal si agregas una palabra cuando sea necesario? Así que di que le estás escribiendo una carta a tu novia y necesitas una palabra de amor, ¡haz una entonces! De esa manera, no tiene que preocuparse por tener que crear miles de palabras en el acto y no volver a usarlas nunca más. ¡Porque recuerda que las palabras más frecuentes no son tus palabras más frecuentes!
Akshat Mahajan
Xandar El Zenón
Akshat Mahajan
Xandar El Zenón
Søren D. Ptæus
BentNielsen
Separadora
AmiralPatate
PyRulez
PyRulez
fi12
PyRulez
AAM111
el nato
AI Breveleri
reyledion
jk - Reincorporar a Monica