Considere un conlang diseñado para una transmisión interestelar a un destinatario que tendrá que resolverlo.
Estoy pensando que será inventado para el propósito, formal y riguroso. Al parecer, hará una transición de la notación matemática o los algoritmos informáticos a la declaración de hechos sobre cosas del mundo real.
Entonces, además de los sustantivos y verbos obvios, ¿cuántos "tipos" diferentes de palabras hay realmente?
¿Alguien sabe algo sobre lenguajes ontológicos o Lojban ? Me pregunto si hay más categorías universales que las partes del discurso que se usan en inglés.
La razón por la que pregunto es porque el número de categorías aparece directamente en mi escenario. No hay ortografía en un sentido convencional, ya que la transmisión es solo un montón de números. Las palabras simplemente están numeradas, por lo que algo como Sustantivo #42 sería la ortografía literal. Habrá diferentes códigos que introduzcan diferentes categorías, o la categoría estará implícita en su número: la palabra #42 es un sustantivo porque el tipo está implícito en el resto del número módulo 7 (o la cantidad de tipos que necesitemos).
Además, no hay distinción entre lo que consideramos palabras y puntuación. Las agrupaciones y los separadores también necesitan sus propios códigos y se codifican de la misma manera.
Las partes del discurso son clases morfológicas o morfosintácticas de palabras. No todos los idiomas tienen partes de la oración, pero en aquellos que las tienen, como el latín, el francés o el inglés, las partes de la oración se distinguen según sus patrones de inflexión (o la falta de ellos) y sus combinaciones permitidas.
(Para aquellos de nosotros que tenemos experiencia con compiladores, las partes del discurso son comparables a las clases de tokens reconocidos por el lexer, como identificadores, números, operadores y separadores).
Por ejemplo, en latín hay tres patrones de inflexión muy diferentes (conjugación verbal, declinación nominal y declinación pronominal); adverbios, preposiciones y conjunciones no tienen flexión pero sus combinaciones permitidas son distintas (adverbios con adjetivos o verbos, preposiciones con sustantivos o grupos nominales, conjunciones con grupos nominales u oraciones). Los gramáticos hacen tablas con patrones de inflexión y combinaciones permitidas; las celdas de la tabla son las partes del discurso.
Por ejemplo, en inglés, podemos hacer el siguiente árbol de clasificación:
¿La palabra tiene una forma -ing , un tiempo pasado, puede hacer un tiempo futuro con voluntad ? Si es así, entonces es un verbo ordinario . (Ejemplos: ser, beber, poner, ver, tomar).
De lo contrario, ¿puede aparecer if en la misma posición sintáctica que un verbo regular? Si es así, entonces es un verbo modal . (Ejemplos: puede, puede, debe.)
De lo contrario:
¿Puede determinar un verbo? Si es así, entonces es un adverbio . (Ejemplos: rápido, rápido, verdaderamente, bien.)
¿Puede funcionar como sujeto de un verbo? En caso afirmativo, entonces es un sustantivo o un pronombre :
¿La palabra identifica un objeto en particular? Si es así, es un nombre propio .
De lo contrario, ¿puede ser determinado por un adjetivo? Si es así, entonces es un sustantivo común .
De lo contrario, es un pronombre . (Los pronombres en inglés también se pueden identificar por su peculiar inflexión).
¿Puede determinar un sustantivo? En caso afirmativo, entonces es un artículo o un adjetivo o un número :
¿Puede la palabra formar grados de comparación? (Hablando puramente morfológicamente: "más único" es morfológicamente correcto aunque lógicamente tonto). En caso afirmativo, es un adjetivo ordinario .
De lo contrario, ¿pertenece la palabra a una clase de adjetivos que deben aparecer con sustantivos utilizados como sujetos u objetos directos? Si es así, entonces es un artículo o demostrativo .
De lo contrario, ¿expresa un número específico? Si es así, entonces es un número .
Muchas palabras pertenecen a más de una de estas clases. En particular, la gran mayoría de los sustantivos también pueden funcionar como adjetivos y viceversa.
De lo contrario, ¿debe usarse la palabra inmediatamente delante de un sustantivo o grupo nominal, o inmediatamente después de un verbo? Si es así, entonces es una preposición .
De lo contrario, ¿puede usarse la palabra para vincular sustantivos, grupos nominales, verbos u oraciones? Si es así, entonces es una conjunción .
De lo contrario, ha encontrado una palabra que no puede ser clasificada por este árbol de decisión. (Sugerencia: considere interjecciones como ah y oh ).
En inglés, los verbos tienen un patrón de inflexión diferente al de los sustantivos, y ambos tienen un patrón de inflexión diferente al de los pronombres; a diferencia del latín, el inglés hace poca o ninguna diferencia entre sustantivos y adjetivos (en realidad no son partes diferentes del discurso en inglés), pero el inglés tiene artículos. (Los artículos funcionan sintácticamente exactamente como los adjetivos demostrativos, con la diferencia de que se dice que una lengua tiene artículos si hay construcciones sintácticas en las que es absolutamente necesario un artículo o un demostrativo, aplicándose la etiqueta "artículos" a aquellos demostrativos que tienen el significado más débil .)
En idiomas con una rica morfología, la distinción entre las partes del discurso es clara y la estructura de la oración se lleva a cabo solo por la morfología o con muy poca ayuda del orden de las palabras.
Por otro lado, un idioma aislado como el mandarín no tiene inflexión alguna (o casi ninguna); en tales lenguajes, la noción de "partes del discurso" es mucho más borrosa y se vuelve comparable a la diferencia entre palabras clave e identificadores ordinarios en lenguajes de programación. El inglés está bien encaminado hacia esto; muchas palabras en inglés pueden funcionar como sustantivos, adjetivos y verbos completamente sin cambios (" van " -- verbo, "tuvimos un viaje " -- sustantivo, "todos los sistemas van " -- adjetivo; o "ir a un lugar " -- sustantivo, " colocar algo" -- verbo; o "tomar un trago " -- sustantivo, " beberalgo" -- verbo) o con pocos cambios ("rojo" -- adjetivo o sustantivo; "enrojecer"). En esos idiomas sin morfología o con muy poca morfología, la distinción entre las partes del discurso es muy atenuada, y la estructura sintáctica de oraciones se representa por el orden de las palabras, al igual que en los lenguajes de programación.
Por ejemplo, en latín "puer puellam vidit", "puellam puer vidit", "vidit puellam puer", etc., todos significan "[el] niño vio a [la] niña", mientras que en inglés no es posible otro orden de palabras sin cambiar el significado o hacer incomprensible la expresión.
Las partes del discurso son en realidad una división artificial elegida por los humanos para explicar la estructura de nuestro lenguaje. No siempre se alinean perfectamente. Tome el japonés como ejemplo. El japonés tiene "partículas", que son palabras que no encajan en ninguna categoría particular que reconozcamos los angloparlantes. También están los lenguajes polisintéticos donde una sola palabra captura lo que los angloparlantes llamaríamos una oración. Y, por supuesto, en inglés tenemos algunas palabras interesantes, como una palabrota particular que comienza con la letra F, que desafía la categorización (como se demuestra en este clip decididamente NSFW de Boondock Saints ).
Una opción interesante que está en la línea de sus palabras numeradas es observar los lenguajes utilizados para describir las webs semánticas como RDF y OWL. RDF, por ejemplo, es notablemente simple. Hay tres partes del "discurso": sujetos, predicados y objetos. Los sujetos y predicados son siempre "IRI" que son similares en naturaleza a sus palabras numeradas. Los objetos son IRI o "valores de tipo de datos", que son valores concretos como números. Eso es todo lo que hay y, sin embargo, puede describir el mundo con todo el sabor de cualquier lenguaje más avanzado.
Por supuesto, no lo enviarían como una imagen así. Presentarían el contenido en un formato diferente, como Turtle, que está basado en texto y es más conciso con paralelismos más sencillos con un formato de comunicación interestelar:
<http://example.org/123> dc:subject <http://example.org/subject32> .
<http://example.org/subject32>
rdf:type ex:ExampleSubjects ;
dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ;
OWL es de naturaleza similar, pero es bastante fascinante porque puede describir su propia semántica con bastante elegancia. Por ejemplo, en realidad podría tener una regla "Todas las palabras que son el sujeto de una oración también son sustantivos". Estas relaciones se pueden especificar con suficiente regularidad para que los usuarios de OWL puedan usar "razonadores" para completar las relaciones que no se escribieron explícitamente en el documento.
El fantástico poder de estos lenguajes de la web semántica es que, si alguien no ha especificado la semántica de lo que debe significar la palabra #42 en una construcción en particular, o si no hay una palabra que satisfaga sus necesidades, puede inventar la semántica. A continuación, puede escribir esa semántica (normalmente en una ontología OWL). Otros pueden leer esa semántica y actuar algorítmicamente. Así que podría definir una nueva Palabra #3.14 que nunca antes habías visto, ¡y puedo hacerlo de tal manera que tengas la oportunidad de entender lo que quise decir con ella!
Esta habilidad semántica sería extremadamente importante si los desfases de tiempo fueran grandes. Los idiomas evolucionan con el tiempo, y si hay suficiente tiempo de retraso entre las comunicaciones, es razonable creer que el significado del Sustantivo #42 podría cambiar para una cultura y no para la otra. La capacidad de al menos intentar capturar la semántica de lo que está diciendo sería muy importante para combatir estos efectos.
El lenguaje se puede dividir en varias capas.
La semántica y la pragmática son campos muy poco conocidos.
Para analizar una transmisión de una especie alienígena, uno tendría que determinar cuál es la fonología, luego pasar por cada capa tratando de descubrir cómo las piezas se pueden combinar de manera válida e inválida.
Refiriéndose específicamente a las partes del discurso, me temo que el sistema de clasificación difiere según el idioma, ya que no clasificamos de acuerdo con algún sistema universal, distinguimos las palabras en las mismas partes del discurso que usa la gramática de ese idioma .
Lojban (ya que preguntaste) no tiene verbos, sustantivos, adverbios y adjetivos distintos. Tiene predicados como "prenu" (es una persona) o "xamgu" (es bueno). Se puede decir "le xamgu ku" (la cosa que es buena) o "le prenu ku" (la cosa que es una persona, o simplemente "persona") y en ciertos casos se pueden omitir muchas de estas partículas, por ejemplo " .i prenu cu xamgu" (la persona es buena) en lugar de ".i le prenu ku cu xamgu". Este fenómeno (los argumentos de un predicado) es algo así como las frases nominales en inglés, pero el idioma no hace absolutamente ninguna distinción entre lo que uno podría considerar verbos y adjetivos, ni tampoco debería tratar de clasificarlos de esa manera.
Una "parte del discurso" es solo un esquema de clasificación, impuesto al lenguaje por los investigadores, para describir clases de palabras. Estos grupos se basan en la función gramatical de esas palabras, y ahí es donde obtenemos "sustantivo" y "verbo" y "preposición"; describen clases de palabras en inglés. Pero también tienes sustantivos que actúan como verbos ("Google that") y muchas otras construcciones extrañas que hacen que cada "parte de la oración" se divida en su propia parte de la oración, hasta el final.
Por lo tanto, no hay un número para la suma total de "todos los tipos de partes del discurso". El inglés tiene un tipo de adverbio; El japonés tiene tres. ¿Son esas partes separadas del discurso o no?
Ahora, si quieres clasificar los símbolos en tu idioma, hay una guía bastante buena. El contacto de Carl Sagan resuelve el problema exacto que está describiendo; necesita comenzar con los primeros principios y construirlo en un lenguaje complejo. SETI ha estado tratando de dar con ese mensaje, y es muy, muy difícil.
Si puede enviar imágenes, solo necesita una "parte del discurso", la COSA. Con una COSA, puede especificar sustantivos; una vez que tienes un sustantivo (ÁTOMO) puedes crear una "cosa de igualdad" (ÁTOMO = ÁTOMO), y luego continuar desde allí, especificando COSAS que son números, contando cosas, etc.
Puede usar la sintaxis para explicar conceptos como cambio en el tiempo (PROTON = PROTON, ELECTRON OPPOSITEOF PROTON, PROTON + NEUTRON = NEUTRON, PROTON AND ELECTRON = HYDROGEN), pero todo es solo una COSA.
Si esto suena demasiado ondulado ( porque lo es ), es posible que desee ver la teoría de la codificación; lo que realmente desea es un algoritmo de compresión/algoritmo de paridad que explique las matemáticas usando símbolos genéricos.
proton
(sustantivo, genérico), =
(establecer una relación), +
(realizar una operación) ,
y ( )
(estructura). Sí, todas son palabras que se pueden codificar; decir eso no agrega nada.
AlexP
JDługosz
Catalizador
nigel222
nigel222
JDługosz