Listas de palabras para lenguajes construidos

Al construir un idioma para su mundo, las palabras son "sorprendentemente" importantes. Todo lenguaje natural tiene palabras de algún tipo y solo los lenguajes construidos extremadamente experimentales carecen de ellas.

La elección de palabras y las categorías a menudo son difíciles de crear desde cero, por lo que seguramente debe haber una forma más sencilla de crear palabras.

¿Existen listas que incluyan palabras para la creación del léxico?


Para las notas de Cort, estoy buscando una lista que contenga una gran cantidad de palabras, que varíen en todo tipo de palabras, por lo que la lista Swadesh es insuficiente .

¿Está solicitando una lista de vocabulario de "estas son las N palabras más comunes que su nuevo idioma querrá definir"?
@SRM esa sería una respuesta aceptable, los enlaces a esa lista también serían buenos.
@MolbOrg esa lista es demasiado simple para mi gusto, así que no
no significó exactamente esto, un poco como eso, como el núcleo del lenguaje. En realidad, cualquier cosa como aprender un idioma en 14 días, libro de frases, etc. En esa dirección hay vocabularios de diferentes tamaños, como diferentes mínimos para saber. En formato impreso es más obvio y era bastante común. Incluyeron palabras basadas en frecuencias. El corpus de lenguaje en línea vio pocos recursos: debe preguntar a personas más orientadas lingüísticamente (traductores y demás), Google tenía algún tipo de corpus en línea con un gráfico de tiempo con qué frecuencia y cuándo se usó, no recuerdo el enlace ahora, y dudo que pueda usarse en forma de base de datos.
¿Puede ampliar sus problemas con la recomendación de MolbOrg de la lista Swadesh? Parece una muy buena coincidencia para lo que ha escrito que sea la pregunta. Creo que si hace una lista demasiado complicada, comenzará a meterse en cuestiones culturales que no son universales.
@CortAmmon esta bien
¿Algún tipo particular de lenguaje, es decir, sonidos, alfabeto? Parece que está buscando raíces de palabras como en el procesamiento del lenguaje natural. También por curiosidad, ¿qué quiere decir con lenguaje "experimental" sin palabras? ¿Quiere decir como una gramática en un lenguaje formal?
Consulte también esta pregunta y sus respuestas: conlang.stackexchange.com/questions/459/…
Empecé a armar una lista de palabras base para Tune (más de 3000 palabras). Me he esforzado mucho para incluir solo palabras "base" en esta lista, pero todavía falta mucho. Algunas palabras están muy cerca de otras palabras ("decir, hablar, hablar, decir"), por lo que potencialmente podría omitirlas.

Respuestas (3)

Estas son listas de raíces de palabras lematizadas . Simplemente elija el idioma que más se acerque a sus necesidades.

http://www.lexiconista.com/datasets/lemmatization/

Editar:

El enlace de arriba está muerto. Las listas relevantes ahora están disponibles en Github:

https://github.com/michmech/lemmatization-lists/

interesante conjunto de lenguas eslavas))
el enlace esta muerto
@Craeft arreglado, ¡gracias!

Conlanger's Lexipedia de Zompist.com tiene la Lista de palabras de frecuencia de fantasía, que es una lista de 1500 palabras muy comunes, y se puede encontrar aquí (haga clic en el enlace al archivo de texto cerca de la parte superior: http://www.zompist.com/resources/ lex.html

También hay un conjunto de listas de palabras en la parte posterior del Kit de construcción de idiomas. En cuanto a la asignación de palabras a estos, también hay un generador de vocabulario, disponible aquí: http://www.zompist.com/gen.html

¡Espero que esto ayude!

No creo que haya publicado la Lista hasta el momento (parece ser un trabajo en progreso a largo plazo), pero podría considerar consultar el Vocabulario básico de Landau . Creo que esto terminará superando a la Lista Swadesh por al menos un orden de magnitud.