¿Cuántas partes del discurso hay, realmente?

Considere un conlang diseñado para una transmisión interestelar a un destinatario que tendrá que resolverlo.

Estoy pensando que será inventado para el propósito, formal y riguroso. Al parecer, hará una transición de la notación matemática o los algoritmos informáticos a la declaración de hechos sobre cosas del mundo real.

Entonces, además de los sustantivos y verbos obvios, ¿cuántos "tipos" diferentes de palabras hay realmente?

¿Alguien sabe algo sobre lenguajes ontológicos o Lojban ? Me pregunto si hay más categorías universales que las partes del discurso que se usan en inglés.

La razón por la que pregunto es porque el número de categorías aparece directamente en mi escenario. No hay ortografía en un sentido convencional, ya que la transmisión es solo un montón de números. Las palabras simplemente están numeradas, por lo que algo como Sustantivo #42 sería la ortografía literal. Habrá diferentes códigos que introduzcan diferentes categorías, o la categoría estará implícita en su número: la palabra #42 es un sustantivo porque el tipo está implícito en el resto del número módulo 7 (o la cantidad de tipos que necesitemos).

Además, no hay distinción entre lo que consideramos palabras y puntuación. Las agrupaciones y los separadores también necesitan sus propios códigos y se codifican de la misma manera.

Las partes del discurso se distinguen en función de sus patrones de inflexión (o la falta de ellos) y sus combinaciones permitidas. Por ejemplo, en latín hay tres patrones de inflexión muy diferentes (conjugación verbal, declinación nominal y pronominal); adverbios, preposiciones y conjunciones no tienen flexión pero sus combinaciones permitidas son distintas (adverbios con adjetivos o verbos, preposiciones con sustantivos o grupos nominales, conjunciones con grupos nominales u oraciones). Los gramáticos hacen tablas con patrones de inflexión y combinaciones permitidas; las celdas son las partes del discurso.
@AlexP tenga en cuenta que, al igual que los lenguajes informáticos modernos y la notación matemática, no habrá inflexiones en el conlang. Me gusta a dónde va en términos de dejar que la gramática dirija lo que se considera las partes del discurso, si quisiera desarrollar eso en una Respuesta completa.
¿Sobre qué idioma estás preguntando? ¿Inglés? ¿¿Latín?? Su conlang en gran parte indefinido??? ¿Estás preguntando si hay universales???? Poco claro y en mi humilde opinión demasiado amplio
Una pregunta fascinante y sin respuesta es si hay algún instinto gramatical o lingüístico profundo por encima del deseo de aprender de un bebé, integrado en nosotros. Si lo hay, ¿es exclusivamente humano o un mamífero universal?
Vale la pena leer sobre algunos idiomas que no pertenecen a la familia indoeuropea. Xhosa, Navaho, Thai,... Todos los intentos de codificar los universales han fallado, sin embargo, cualquier bebé humano aprenderá todos los idiomas humanos que forman una parte importante de su vida temprana.
@ nigel222 es probablemente la variedad de "programas" que se pueden manejar en la red neuronal proporcionada: cuántas capas tiene, cómo está estructurado, etc.

Respuestas (4)

Las partes del discurso son clases morfológicas o morfosintácticas de palabras. No todos los idiomas tienen partes de la oración, pero en aquellos que las tienen, como el latín, el francés o el inglés, las partes de la oración se distinguen según sus patrones de inflexión (o la falta de ellos) y sus combinaciones permitidas.

(Para aquellos de nosotros que tenemos experiencia con compiladores, las partes del discurso son comparables a las clases de tokens reconocidos por el lexer, como identificadores, números, operadores y separadores).

Por ejemplo, en latín hay tres patrones de inflexión muy diferentes (conjugación verbal, declinación nominal y declinación pronominal); adverbios, preposiciones y conjunciones no tienen flexión pero sus combinaciones permitidas son distintas (adverbios con adjetivos o verbos, preposiciones con sustantivos o grupos nominales, conjunciones con grupos nominales u oraciones). Los gramáticos hacen tablas con patrones de inflexión y combinaciones permitidas; las celdas de la tabla son las partes del discurso.

Por ejemplo, en inglés, podemos hacer el siguiente árbol de clasificación:

  1. ¿La palabra tiene una forma -ing , un tiempo pasado, puede hacer un tiempo futuro con voluntad ? Si es así, entonces es un verbo ordinario . (Ejemplos: ser, beber, poner, ver, tomar).

  2. De lo contrario, ¿puede aparecer if en la misma posición sintáctica que un verbo regular? Si es así, entonces es un verbo modal . (Ejemplos: puede, puede, debe.)

  3. De lo contrario:

    • ¿Puede determinar un verbo? Si es así, entonces es un adverbio . (Ejemplos: rápido, rápido, verdaderamente, bien.)

    • ¿Puede funcionar como sujeto de un verbo? En caso afirmativo, entonces es un sustantivo o un pronombre :

      • ¿La palabra identifica un objeto en particular? Si es así, es un nombre propio .

      • De lo contrario, ¿puede ser determinado por un adjetivo? Si es así, entonces es un sustantivo común .

      • De lo contrario, es un pronombre . (Los pronombres en inglés también se pueden identificar por su peculiar inflexión).

    • ¿Puede determinar un sustantivo? En caso afirmativo, entonces es un artículo o un adjetivo o un número :

      • ¿Puede la palabra formar grados de comparación? (Hablando puramente morfológicamente: "más único" es morfológicamente correcto aunque lógicamente tonto). En caso afirmativo, es un adjetivo ordinario .

      • De lo contrario, ¿pertenece la palabra a una clase de adjetivos que deben aparecer con sustantivos utilizados como sujetos u objetos directos? Si es así, entonces es un artículo o demostrativo .

      • De lo contrario, ¿expresa un número específico? Si es así, entonces es un número .

    • Muchas palabras pertenecen a más de una de estas clases. En particular, la gran mayoría de los sustantivos también pueden funcionar como adjetivos y viceversa.

  4. De lo contrario, ¿debe usarse la palabra inmediatamente delante de un sustantivo o grupo nominal, o inmediatamente después de un verbo? Si es así, entonces es una preposición .

  5. De lo contrario, ¿puede usarse la palabra para vincular sustantivos, grupos nominales, verbos u oraciones? Si es así, entonces es una conjunción .

  6. De lo contrario, ha encontrado una palabra que no puede ser clasificada por este árbol de decisión. (Sugerencia: considere interjecciones como ah y oh ).

En inglés, los verbos tienen un patrón de inflexión diferente al de los sustantivos, y ambos tienen un patrón de inflexión diferente al de los pronombres; a diferencia del latín, el inglés hace poca o ninguna diferencia entre sustantivos y adjetivos (en realidad no son partes diferentes del discurso en inglés), pero el inglés tiene artículos. (Los artículos funcionan sintácticamente exactamente como los adjetivos demostrativos, con la diferencia de que se dice que una lengua tiene artículos si hay construcciones sintácticas en las que es absolutamente necesario un artículo o un demostrativo, aplicándose la etiqueta "artículos" a aquellos demostrativos que tienen el significado más débil .)

En idiomas con una rica morfología, la distinción entre las partes del discurso es clara y la estructura de la oración se lleva a cabo solo por la morfología o con muy poca ayuda del orden de las palabras.

Por otro lado, un idioma aislado como el mandarín no tiene inflexión alguna (o casi ninguna); en tales lenguajes, la noción de "partes del discurso" es mucho más borrosa y se vuelve comparable a la diferencia entre palabras clave e identificadores ordinarios en lenguajes de programación. El inglés está bien encaminado hacia esto; muchas palabras en inglés pueden funcionar como sustantivos, adjetivos y verbos completamente sin cambios (" van " -- verbo, "tuvimos un viaje " -- sustantivo, "todos los sistemas van " -- adjetivo; o "ir a un lugar " -- sustantivo, " colocar algo" -- verbo; o "tomar un trago " -- sustantivo, " beberalgo" -- verbo) o con pocos cambios ("rojo" -- adjetivo o sustantivo; "enrojecer"). En esos idiomas sin morfología o con muy poca morfología, la distinción entre las partes del discurso es muy atenuada, y la estructura sintáctica de oraciones se representa por el orden de las palabras, al igual que en los lenguajes de programación.

Por ejemplo, en latín "puer puellam vidit", "puellam puer vidit", "vidit puellam puer", etc., todos significan "[el] niño vio a [la] niña", mientras que en inglés no es posible otro orden de palabras sin cambiar el significado o hacer incomprensible la expresión.

Las partes del discurso son en realidad una división artificial elegida por los humanos para explicar la estructura de nuestro lenguaje. No siempre se alinean perfectamente. Tome el japonés como ejemplo. El japonés tiene "partículas", que son palabras que no encajan en ninguna categoría particular que reconozcamos los angloparlantes. También están los lenguajes polisintéticos donde una sola palabra captura lo que los angloparlantes llamaríamos una oración. Y, por supuesto, en inglés tenemos algunas palabras interesantes, como una palabrota particular que comienza con la letra F, que desafía la categorización (como se demuestra en este clip decididamente NSFW de Boondock Saints ).

Una opción interesante que está en la línea de sus palabras numeradas es observar los lenguajes utilizados para describir las webs semánticas como RDF y OWL. RDF, por ejemplo, es notablemente simple. Hay tres partes del "discurso": sujetos, predicados y objetos. Los sujetos y predicados son siempre "IRI" que son similares en naturaleza a sus palabras numeradas. Los objetos son IRI o "valores de tipo de datos", que son valores concretos como números. Eso es todo lo que hay y, sin embargo, puede describir el mundo con todo el sabor de cualquier lenguaje más avanzado.

ejemplo RDF

Por supuesto, no lo enviarían como una imagen así. Presentarían el contenido en un formato diferente, como Turtle, que está basado en texto y es más conciso con paralelismos más sencillos con un formato de comunicación interestelar:

<http://example.org/123>  dc:subject  <http://example.org/subject32> .

<http://example.org/subject32>
    rdf:type          ex:ExampleSubjects ;
    dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ;

OWL es de naturaleza similar, pero es bastante fascinante porque puede describir su propia semántica con bastante elegancia. Por ejemplo, en realidad podría tener una regla "Todas las palabras que son el sujeto de una oración también son sustantivos". Estas relaciones se pueden especificar con suficiente regularidad para que los usuarios de OWL puedan usar "razonadores" para completar las relaciones que no se escribieron explícitamente en el documento.

El fantástico poder de estos lenguajes de la web semántica es que, si alguien no ha especificado la semántica de lo que debe significar la palabra #42 en una construcción en particular, o si no hay una palabra que satisfaga sus necesidades, puede inventar la semántica. A continuación, puede escribir esa semántica (normalmente en una ontología OWL). Otros pueden leer esa semántica y actuar algorítmicamente. Así que podría definir una nueva Palabra #3.14 que nunca antes habías visto, ¡y puedo hacerlo de tal manera que tengas la oportunidad de entender lo que quise decir con ella!

Esta habilidad semántica sería extremadamente importante si los desfases de tiempo fueran grandes. Los idiomas evolucionan con el tiempo, y si hay suficiente tiempo de retraso entre las comunicaciones, es razonable creer que el significado del Sustantivo #42 podría cambiar para una cultura y no para la otra. La capacidad de al menos intentar capturar la semántica de lo que está diciendo sería muy importante para combatir estos efectos.

Eso está muy en la línea de lo que estaba pensando. Un ejemplo importante (y lo que quiero resolver lo suficientemente bien como para representarlo) es una página donde nos dicen cosas que ya sabemos: las propiedades de nuestro sistema solar, incluidas cosas como la masa, el radio y los parámetros orbitales de los planetas. Eso es principalmente atributos de nombres
Excepto que los sujetos, predicados y objetos son partes de la oración, no partes del discurso , es decir, pertenecen a la sintaxis y no a la morfología . Este es un error de categoría. Tanto la palabra "él" como la palabra "lector" pueden funcionar como sujetos u objetos (partes sintácticas u oraciones), pero "él" es un pronombre y "lectores" es un sustantivo (partes morfológicas del discurso). (La palabra "lector" puede ser determinada por un artículo o un adjetivo, y forma el plural en -s ; entonces la palabra "él" no puede ser determinada por un artículo o un adjetivo y tiene una inflexión peculiar.)
@AlexP En ese caso, supongo que las "partes del discurso" serían IRI y tipo de datos en estos idiomas. Tendré que pensar en la mejor manera de expresarlo. Sentí que ya iba a perder al lector tratando de profundizar lo suficiente en los idiomas para vincularlos a la pregunta.
Gran punto sobre el retraso en las comunicaciones y las connotaciones de las palabras cambiando. Me estoy imaginando extraterrestres de Gliese 581 c que aprendieron inglés de los Picapiedra y nos saludan deseándonos un "viejo tiempo gay". También me gustaría poder darte puntos extra por la referencia de Boondock Saints.

El lenguaje se puede dividir en varias capas.

  • La fonología es el estudio de las piezas indivisibles más pequeñas a partir de las cuales se construye el lenguaje. Esto se refiere a sonidos como /g/ o /k/ en el lenguaje humano hablado. Si sus lingüistas estudiaron una transmisión de radio, podría ser un bit de computadora u otra construcción similar.
  • La morfología es el estudio de las piezas más pequeñas del lenguaje que tienen significado. Los morfemas, por supuesto, se construyen a partir de un número variable de fonemas. Un ejemplo de un morfema sería el -ista en morfólogo, que tiene significado aunque no se sostenga por sí solo. Las partes del discurso caen bajo este campo.
  • La sintaxis es el estudio de cómo los hablantes combinan morfemas para formar oraciones gramaticalmente correctas. Por ejemplo, "El gato caminó sobre la montaña usando sus patas". es agramatical, aunque es comprensible.
  • La semántica es el estudio del significado de las oraciones. "El gato voló a través de la montaña por sus bigotes". es gramatical y tiene un significado semántico. Lo cual resulta ser una tontería.
  • La pragmática es el estudio de cómo el lenguaje se relaciona con el mundo exterior. Por ejemplo, "¿Podrías cerrar la puerta?" es semánticamente una pregunta, pero pragmáticamente es una petición (en inglés). Otro ejemplo es con los contratos. Al decir sí a un trato, no solo está diciendo que acepta el trato, sino que la declaración misma es lo que hace que el trato sea válido.

La semántica y la pragmática son campos muy poco conocidos.

Para analizar una transmisión de una especie alienígena, uno tendría que determinar cuál es la fonología, luego pasar por cada capa tratando de descubrir cómo las piezas se pueden combinar de manera válida e inválida.

Refiriéndose específicamente a las partes del discurso, me temo que el sistema de clasificación difiere según el idioma, ya que no clasificamos de acuerdo con algún sistema universal, distinguimos las palabras en las mismas partes del discurso que usa la gramática de ese idioma .

Lojban (ya que preguntaste) no tiene verbos, sustantivos, adverbios y adjetivos distintos. Tiene predicados como "prenu" (es una persona) o "xamgu" (es bueno). Se puede decir "le xamgu ku" (la cosa que es buena) o "le prenu ku" (la cosa que es una persona, o simplemente "persona") y en ciertos casos se pueden omitir muchas de estas partículas, por ejemplo " .i prenu cu xamgu" (la persona es buena) en lugar de ".i le prenu ku cu xamgu". Este fenómeno (los argumentos de un predicado) es algo así como las frases nominales en inglés, pero el idioma no hace absolutamente ninguna distinción entre lo que uno podría considerar verbos y adjetivos, ni tampoco debería tratar de clasificarlos de esa manera.

""El gato voló por la montaña por sus bigotes". /.../ resulta que es una tontería". Estamos en Worldbuilding . Yo no estaría tan seguro.
Por «absolutamente ninguna distinción entre lo que uno podría considerar verbos y adjetivos» solo puedo suponer que te refieres a una cuestión de sintaxis; por ejemplo, "es rojo" y "se está ejecutando" son predicados que se manejan de la misma manera. Pero la parte de una relación y el atributo interno son cosas semánticamente diferentes.

Una "parte del discurso" es solo un esquema de clasificación, impuesto al lenguaje por los investigadores, para describir clases de palabras. Estos grupos se basan en la función gramatical de esas palabras, y ahí es donde obtenemos "sustantivo" y "verbo" y "preposición"; describen clases de palabras en inglés. Pero también tienes sustantivos que actúan como verbos ("Google that") y muchas otras construcciones extrañas que hacen que cada "parte de la oración" se divida en su propia parte de la oración, hasta el final.

Por lo tanto, no hay un número para la suma total de "todos los tipos de partes del discurso". El inglés tiene un tipo de adverbio; El japonés tiene tres. ¿Son esas partes separadas del discurso o no?

Ahora, si quieres clasificar los símbolos en tu idioma, hay una guía bastante buena. El contacto de Carl Sagan resuelve el problema exacto que está describiendo; necesita comenzar con los primeros principios y construirlo en un lenguaje complejo. SETI ha estado tratando de dar con ese mensaje, y es muy, muy difícil.

Si puede enviar imágenes, solo necesita una "parte del discurso", la COSA. Con una COSA, puede especificar sustantivos; una vez que tienes un sustantivo (ÁTOMO) puedes crear una "cosa de igualdad" (ÁTOMO = ÁTOMO), y luego continuar desde allí, especificando COSAS que son números, contando cosas, etc.

Puede usar la sintaxis para explicar conceptos como cambio en el tiempo (PROTON = PROTON, ELECTRON OPPOSITEOF PROTON, PROTON + NEUTRON = NEUTRON, PROTON AND ELECTRON = HYDROGEN), pero todo es solo una COSA.

Si esto suena demasiado ondulado ( porque lo es ), es posible que desee ver la teoría de la codificación; lo que realmente desea es un algoritmo de compresión/algoritmo de paridad que explique las matemáticas usando símbolos genéricos.

"Cosa" no tiene ningún significado ya que no hay distinciones. Pero su ejemplo tiene proton(sustantivo, genérico), =(establecer una relación), +(realizar una operación) ,y ( )(estructura). Sí, todas son palabras que se pueden codificar; decir eso no agrega nada.
«sustantivos que actúan como verbos» tu ejemplo es un verbo que proviene de un sustantivo y se usa como un verbo (de acción). ¿Quizás quisiste mirar los gerundios (o lo contrario de eso)?
"Cosa" no era la mejor palabra porque realmente me refiero más a "un símbolo que describe un objeto". "Google" es un nombre propio para un motor de búsqueda, pero se puede usar como verbo para describir la acción de hacer una búsqueda en la web ahora. Mi intención era decir que (1) lo que realmente quiere ver es un método para codificar sustantivos como símbolos, no "palabras" o "partes del discurso", y (2) con un contexto y una organización inteligentes, puede usar solo sustantivos (y sustantivos como verbos) para comunicar ideas complejas, y (3) "partes del discurso" no tiene sentido para su caso de uso, lo que realmente necesita es un método para codificar símbolos para objetos.