¿Deberían las palabras ser representadas únicamente por grafemas finitos y linealmente estructurados?

Sabiendo que las palabras en un lenguaje escrito se pueden representar mediante combinaciones de símbolos (por ejemplo, letras de un alfabeto), me interesaría saber qué tipos de restricciones estructurales existen para las palabras individuales. En concreto, tengo dos preguntas:

1) En principio, ¿puede una lengua escrita contener infinitas palabras?

2) En principio, ¿puede un idioma contener algunas palabras que estén representadas únicamente por una estructura no lineal de letras? Por ejemplo, ¿puede el siguiente conglomerado de símbolos ser considerado como una "palabra", si asumimos que las matemáticas son un lenguaje?

\int_{a}^{b}{e^{x}}dx

Esto parece ser de interés. amazon.com/…
Ver chino y jeroglífico : no todos los idiomas usan letras de un alfabeto.
Sobre el uso de una secuencia infinita de símbolos para representar una palabra en un idioma: ¿cómo escribir/pronunciar una frase si la primera palabra nunca terminará?
Su integral se puede escribir en marcado LaTeX como una secuencia típica de símbolos (nota pedante: edite para eliminar las "combinaciones lineales". Las palabras son secuencias finitas de símbolos de un alfabeto finito, no combinaciones lineales, que es algo completamente diferente. El alfabeto generalmente se llama \Sigma, con el monoide libre de secuencias escrito \Sigma^*. Entonces, un lenguaje L es el subconjunto de \Sigma^* que comprende las wff de L.)
Sugeriría que la inflexión vocal es parte de cualquier idioma. Si quisieras representar con precisión un gemido inarticulado, con todos los detalles, podrías requerir infinitas decoraciones, y muchas de ellas serían elaboraciones diacríticas o gráficas y, por lo tanto, no colocadas linealmente. El lenguaje no se escribe naturalmente , por lo que la pregunta proviene de un lugar extraño. Por supuesto, al registrar la expresión, en algún momento, "redondeamos" los sonidos reales a un arreglo disponible de símbolos, pero la naturaleza de la aproximación no es fija.
Esto depende en gran medida de lo que llamarías un idioma. Quizás Linguistics es un mejor sitio para esto. Por cierto, el hebreo vocalizado no es lineal.
@Mauro ALLEGRRANZA, Los números periódicos como 89.898989(89) pueden ser uno de los ejemplos de cómo escribir/pronunciar palabras con secuencias infinitas de símbolos.
@John Forkosh. De acuerdo, esta integral se puede convertir a la estructura lineal de símbolos de LaTeX con algunas reglas adicionales sobre cómo se debe convertir. Y esta integral en el formato LaTeX debería verse así: \int_{a}^{b}e^{x}dx Sin embargo, me parece que es una decisión arbitraria que un símbolo 'a' en esta conversión deba preceder un símbolo 'b' y no al revés.
¿Cuál es el problema con la "decisión arbitraria"? Y de todos modos, te equivocas :) -- \int^b_a funciona igual de bien. E incluso de manera más general que el marcado de LaTeX, podría usar, por ejemplo, el "marcado" de netPBM en.wikipedia.org/wiki/Netpbm_format#PBM_example para representar sintácticamente cualquier imagen . Esa podría ser una imagen que represente texto escaneado, por lo tanto, palabras. O podría ser la Mona Lisa, o cualquier imagen. Entonces, las secuencias de símbolos pueden representar casi todo.
@John Forkosh Mi punto es que dos elementos en una estructura lineal deben tener la relación de preceder/seguir. Por ejemplo, en \int^b_a 'b' precede a 'a' y en \int_a^b 'a' precede a 'b'. Sin embargo, en la fórmula integral esta relación entre 'a' y 'b' simplemente no existe.
Bueno, sí, sintácticamente , un símbolo debe preceder o seguir a otro en una secuencia. Pero semánticamente , es posible que ambas variaciones signifiquen lo mismo, por ejemplo, 2+3=3+2 así como \int_a^b=\int^b_a, etc, etc. función" que mapea sintaxis-->semántica. Y son las propiedades de ese mapeo las que quieres estudiar.
Sí, la fórmula integral puede no ser la mejor opción para ejemplificar una estructura no más delgada. Probablemente, un acorde musical encajaría mejor para este propósito.
Sí, la notación musical parece un mejor ejemplo. Pero mientras hablemos de LaTeX, les recuerdo que incluso hay marcas de LaTeX para eso, por ejemplo, stackoverflow.com/questions/648429/typesetting-music-in-latex Por supuesto, su "infinito" original no sería t suceder de cualquier manera.
89.898989(89) no es una cadena infinita de símbolos: es claramente finita . Y sobre "la constante e en realidad está representada por la secuencia infinita de dígitos: 2.71828...", es al revés: el número e (su nombre es claramente una cadena finita de símbolos) se puede calcular con una secuencia de dígitos que comienza con 2.71828.
esta pregunta no muestra ningún esfuerzo de investigación, y solo es interesante si adivinamos alguna motivación profunda para hacerla -1
@MATHMETICIAN Sugiérame cualquier literatura o referencia relacionada con mi pregunta.

Respuestas (6)

Recientemente me encontré con el término morfema

En lingüística, un morfema es la unidad gramatical más pequeña de una lengua. En otras palabras, es la unidad significativa más pequeña de una lengua. El campo de estudio dedicado a los morfemas se denomina morfología. Un morfema no es idéntico a una palabra, y la principal diferencia entre los dos es que un morfema puede estar solo o no, mientras que una palabra, por definición, es independiente. Cuando se sostiene por sí mismo, se considera raíz porque tiene un significado propio (p. ej., el morfema gato) y cuando depende de otro morfema para expresar una idea, se considera un afijo porque tiene una función gramatical (p. ej., el morfema gato). la –s en cats para indicar que es plural).[1] Cada palabra comprende uno o más morfemas.

Además, en relación con el concepto de una palabra, es interesante notar el término en un contexto de informática donde se considera el tamaño de la palabra.

En informática, una palabra es la unidad natural de datos utilizada por un diseño de procesador en particular. Una palabra es un dato de tamaño fijo manejado como una unidad por el conjunto de instrucciones o el hardware del procesador. El número de bits en una palabra (el tamaño de la palabra, el ancho de la palabra o la longitud de la palabra) es una característica importante de cualquier diseño de procesador o arquitectura de computadora específicos.

Gracias, Ron. Creo que esta es una buena adición a este tema.

En respuesta a (2),

"La integral definida, desde x=a hasta x=b, del número de Euler multiplicado por sí mismo x-número de veces" no es una oración, sino un predicado cuando se combina con una cópula. En ella, puede ser una palabra como término proposicional que es referente del mencionado término predicativo.

Es palabra en la medida en que un predicado sin cópula puede ser palabra. Es un predicado porque se refiere a las propiedades que están en la extensión de esa función matemática. Igualar la función a algo es crear una oración en la que "igual" es la cópula del predicado. Por ejemplo, "La integral definida, desde x=a hasta x=b, del número de Euler multiplicado por sí mismo x-número de veces es igual al número Z", en lógica de primer orden, tiene la siguiente forma (donde P es el predicado término "es igual al número Z" y donde Q es el término predicado "es igual a la integral definida, desde x=a hasta x=b, del número de Euler multiplicado por sí mismo x número de veces":

∃y:Py∧Qy.

Si la proposición categórica es verdadera o no es otra cuestión completamente diferente. Es posible que ∃y:Py∧Qy sea falso, de modo que ∄y:Py∧Qy posiblemente sea verdadero.

Estoy de acuerdo en que esta integral no es una oración. Mi pregunta es "¿Podemos considerar esta integral como una palabra en el lenguaje matemático?" Y de tu respuesta concluyo que “puede ser una palabra como término proposicional…”
He hecho una edición. Por favor, hágamelo saber si puedo ser más claro.
(+1) Gracias por tu aclaración.

1) En principio, ¿puede una lengua escrita contener infinitas palabras?

La mayoría de los idiomas pueden generar expresiones que tienen un número infinito de palabras. El argumento decisivo para eso, para mí, fue esta publicación de Allan C. Wechsler .

(2) if and only if there exist utterances of infinite length.
This inference is false. A simple counterexample: Although there are
only a finite number of digits (= language elements) and although no
decimal numeral (= utterance) is of infinite length, there are
undoutedly an infinite number of decimal numerals.

Nuestras gramáticas innatas permiten que existan tales frases. Considere también esta lista de palabras más largas en todos los idiomas , donde muchos de los idiomas permiten la composición arbitraria. El ejemplo más largo es una palabra en sánscrito de 431 letras que se escribió en algún momento de la Edad Media. O considere el ejemplo inglés del nombre científico de Titin, que consta de 189.819 letras. Las reglas de la física y la química pueden impedirnos crear moléculas infinitamente grandes, pero las reglas de la nomenclatura de la IUPAC no nos impiden crear nombres para moléculas infinitamente largas. Ya sea que estemos usando las reglas sandhi del sánscrito o la nomenclatura de la IUPAC, las gramáticas no nos impiden formar palabras infinitamente largas.

En principio, ¿puede un idioma contener algunas palabras que estén representadas únicamente por una estructura no lineal de letras?

La mayoría de las escrituras índicas no son tan lineales como las escrituras latinas. Devanagari presenta compuestos y conjunciones donde algunas letras modifican otras letras desde la izquierda, la derecha, arriba, abajo o dentro. Pero, ¿por qué es eso relevante? Los idiomas indios también se pueden escribir en forma lineal, comúnmente con IAST o ITRANS . Lo mismo ocurre con las expresiones matemáticas. Su ejemplo bidimensional a menudo se escribe de forma lineal en LaTeX o Mathematica.

A menos que realmente no te gusten los kanji y los logoramas en general, los jeroglíficos y los ideogramas , no tengo idea de por qué.

Supongo que podría argumentar que los ideogramas son letras, pero estoy bastante seguro de que estos caracteres no son un alfabeto .

Los signos escritos en otros sistemas de escritura se denominan mejor silabogramas (que denotan una sílaba) o logogramas (que denotan una palabra o frase).


Las palabras habladas se componen de unidades de sonido llamadas fonemas y las palabras escritas de símbolos llamados grafemas, como las letras del alfabeto inglés.

Claramente los símbolos son grafemas:

Hay componentes grafémicos adicionales que se utilizan en la escritura, como signos de puntuación, símbolos matemáticos, separadores de palabras como el espacio y otros símbolos tipográficos.


En cuanto a sus preguntas:

  1. Todos los idiomas son construcciones, y cualquier palabra infinitamente larga sería imposible de escribir, y ese idioma no podría escribirse. A menos que permita un grafema que diga, por ejemplo, que las letras anteriores tuvieron que pronunciarse un número infinito de veces. Ese sería un lenguaje planeado.

  2. Realmente solo puedo adivinar lo que quiere decir con "estructuras no lineales de letras", pero, por ejemplo, en chino hay 214 radicales en el diccionario Kangxi, y

Los radicales pueden aparecer en cualquier posición de un carácter. Por ejemplo, el radical 女 aparece del lado izquierdo en los caracteres 姐, 媽, 她, 好 y 姓, pero aparece al final en 妾.

Me interesaría ver un lenguaje, además de las matemáticas, que use un alfabeto de manera similar.

Esta parece una pregunta muy extraña en términos de idiomas como realmente son.

En principio, ¿puede un idioma contener algunas palabras que solo pueden representarse mediante infinitas secuencias de letras?

No. Después de todo, la ciencia analiza la evidencia; y la evidencia apropiada aquí son los lenguajes naturales; no hay idiomas con 'secuencias infinitas de letras'; y esto puede deducirse fácilmente de un principio: ¿quién tendría tiempo para escribir tal secuencia?

Las gramáticas están representadas por autómatas de estado finito; existe la jerarquía chomskiana de gramáticas formales de tipos 0-3.

El tipo de gramática que encajaría en un lenguaje como el que sugieres es tipo-0; pero esto se debe a que permite cualquier cosa, son equivalentes a una máquina de Turing, por lo que se parecen más a una computadora que a una gramática viva real; aunque no debería decir que incluso las computadoras reales tienen recursos finitos, por lo que no existe una máquina de Turing real con una cinta infinita.

Gracias por su respuesta. En su respuesta, afirmó que "no hay idiomas con 'secuencias infinitas de letras'" . ¿Y el lenguaje de las matemáticas? En este idioma, la constante matemática e está representada en realidad por la secuencia infinita de dígitos: 2.71828 ...., y cada dígito no es más que una letra en el alfabeto numérico. Estoy de acuerdo contigo en que el lenguaje de las matemáticas no es un lenguaje formal en la jerarquía de Chomsky y sus declaraciones no pueden ser procesadas por la máquina de Turing; pero, me parece un lenguaje válido.
@Noviff: lo entendiste al revés. el infinito sec 2.71828... está representado por el símbolo e, no al revés. muchas palabras del lenguaje natural "representan" infinitos sin ser ellos mismos infinitos. por ejemplo, "Dios", "amor", "infinito".
@mobileink, Buen punto. Sin embargo, creo que los símbolos y las letras son dos cosas diferentes. El propósito del alfabeto numérico es representar cualquier número (incluidos los trascendentales) por dígitos, y este alfabeto no contiene un dígito e . Por esta razón, un símbolo e no tiene sentido si no tiene una interpretación digital.
Re e , pi , etc., son reales computables , por lo que existen programas de computadora relativamente cortos que los generan, dígito por dígito (por supuesto, tardan mucho tiempo en ejecutarse hasta completarse :). Entonces e puede representarse por la secuencia de símbolos que comprende cualquier programa correspondiente. Sin embargo, también existen reales no computables , que comprenden la gran mayoría de los reales (de hecho, los reales computables son de medida cero). Y se necesitaría una "secuencia infinita de símbolos" para representar completamente cualquiera de ellos. Pero en un sentido épsilon-delta, una secuencia finita puede denotarlos con cualquier precisión.
@noviff: como dice el hombre, lo entendiste al revés; es la letra e que representa el número. La representación numérica a la que te refieres es siempre aproximada ya que nunca puedes escribir la expansión infinita ; mientras que, la letra e que lo representa, es siempre exacta.
Todas las gramáticas de la jerarquía de Chomsky permiten secuencias potencialmente infinitas, existe una gramática de nivel 0 cuyas palabras son: a, aa, aaa, aaaa, aaaaa,... etc.
@Mozibur Ullah. Entiendo tu punto y estoy de acuerdo contigo en que cualquier secuencia infinita debe representarse mediante combinaciones finitas de letras. Según su nota, hago una corrección en el elemento n. ° 1 de mi pregunta original.

Las estructuras lineales de palabras, oraciones, párrafos e incluso libros en lenguajes naturales podrían explicarse por la propiedad del cerebro humano de procesar símbolos secuencialmente, uno a la vez. Interesante, pero los sonidos y las imágenes los procesamos de manera diferente, y es por eso que podemos escuchar todos los instrumentos musicales en la orquesta al mismo tiempo y podemos ver los objetos visuales al mismo tiempo. Por esta razón, los acordes musicales no son solo secuencias de notas y los elementos pictóricos en los dibujos no están dispuestos linealmente.

Otro caso son los lenguajes de programación. Utilizados para interacciones entre humanos y computadoras, estos lenguajes están diseñados para presentar la misma información en dos formas diferentes: como códigos fuente para humanos y como códigos de máquina para computadoras. Si bien los códigos fuente son estructuras lineales, se ven casi como textos en lenguajes naturales; Los códigos de máquina no son estructuras lineales: las computadoras no procesan los códigos de máquina secuencialmente, en un orden predefinido.

Además, el lenguaje de las matemáticas es probablemente el caso más difícil. Por ejemplo, sin duda, la fórmula matemática que representa la ley de la gravedad contiene alguna información; sin embargo, no estoy seguro de quién/qué son los originadores y consumidores primarios de esta información: ¿son objetos físicos en sí mismos, un campo gravitatorio alrededor de estos objetos, o es solo mi imaginación la que propone esta ley? Además, ni siquiera está claro cuánta información contiene esta fórmula: ¿hay pocos bytes de datos que sean suficientes para escribir esta fórmula o una cantidad infinita de información que define todas las trayectorias gravitacionales posibles en nuestro Universo?