Sabiendo que las palabras en un lenguaje escrito se pueden representar mediante combinaciones de símbolos (por ejemplo, letras de un alfabeto), me interesaría saber qué tipos de restricciones estructurales existen para las palabras individuales. En concreto, tengo dos preguntas:
1) En principio, ¿puede una lengua escrita contener infinitas palabras?
2) En principio, ¿puede un idioma contener algunas palabras que estén representadas únicamente por una estructura no lineal de letras? Por ejemplo, ¿puede el siguiente conglomerado de símbolos ser considerado como una "palabra", si asumimos que las matemáticas son un lenguaje?
Recientemente me encontré con el término morfema
En lingüística, un morfema es la unidad gramatical más pequeña de una lengua. En otras palabras, es la unidad significativa más pequeña de una lengua. El campo de estudio dedicado a los morfemas se denomina morfología. Un morfema no es idéntico a una palabra, y la principal diferencia entre los dos es que un morfema puede estar solo o no, mientras que una palabra, por definición, es independiente. Cuando se sostiene por sí mismo, se considera raíz porque tiene un significado propio (p. ej., el morfema gato) y cuando depende de otro morfema para expresar una idea, se considera un afijo porque tiene una función gramatical (p. ej., el morfema gato). la –s en cats para indicar que es plural).[1] Cada palabra comprende uno o más morfemas.
Además, en relación con el concepto de una palabra, es interesante notar el término en un contexto de informática donde se considera el tamaño de la palabra.
En informática, una palabra es la unidad natural de datos utilizada por un diseño de procesador en particular. Una palabra es un dato de tamaño fijo manejado como una unidad por el conjunto de instrucciones o el hardware del procesador. El número de bits en una palabra (el tamaño de la palabra, el ancho de la palabra o la longitud de la palabra) es una característica importante de cualquier diseño de procesador o arquitectura de computadora específicos.
En respuesta a (2),
"La integral definida, desde x=a hasta x=b, del número de Euler multiplicado por sí mismo x-número de veces" no es una oración, sino un predicado cuando se combina con una cópula. En ella, puede ser una palabra como término proposicional que es referente del mencionado término predicativo.
Es palabra en la medida en que un predicado sin cópula puede ser palabra. Es un predicado porque se refiere a las propiedades que están en la extensión de esa función matemática. Igualar la función a algo es crear una oración en la que "igual" es la cópula del predicado. Por ejemplo, "La integral definida, desde x=a hasta x=b, del número de Euler multiplicado por sí mismo x-número de veces es igual al número Z", en lógica de primer orden, tiene la siguiente forma (donde P es el predicado término "es igual al número Z" y donde Q es el término predicado "es igual a la integral definida, desde x=a hasta x=b, del número de Euler multiplicado por sí mismo x número de veces":
∃y:Py∧Qy.
Si la proposición categórica es verdadera o no es otra cuestión completamente diferente. Es posible que ∃y:Py∧Qy sea falso, de modo que ∄y:Py∧Qy posiblemente sea verdadero.
1) En principio, ¿puede una lengua escrita contener infinitas palabras?
La mayoría de los idiomas pueden generar expresiones que tienen un número infinito de palabras. El argumento decisivo para eso, para mí, fue esta publicación de Allan C. Wechsler .
(2) if and only if there exist utterances of infinite length.
This inference is false. A simple counterexample: Although there are
only a finite number of digits (= language elements) and although no
decimal numeral (= utterance) is of infinite length, there are
undoutedly an infinite number of decimal numerals.
Nuestras gramáticas innatas permiten que existan tales frases. Considere también esta lista de palabras más largas en todos los idiomas , donde muchos de los idiomas permiten la composición arbitraria. El ejemplo más largo es una palabra en sánscrito de 431 letras que se escribió en algún momento de la Edad Media. O considere el ejemplo inglés del nombre científico de Titin, que consta de 189.819 letras. Las reglas de la física y la química pueden impedirnos crear moléculas infinitamente grandes, pero las reglas de la nomenclatura de la IUPAC no nos impiden crear nombres para moléculas infinitamente largas. Ya sea que estemos usando las reglas sandhi del sánscrito o la nomenclatura de la IUPAC, las gramáticas no nos impiden formar palabras infinitamente largas.
En principio, ¿puede un idioma contener algunas palabras que estén representadas únicamente por una estructura no lineal de letras?
La mayoría de las escrituras índicas no son tan lineales como las escrituras latinas. Devanagari presenta compuestos y conjunciones donde algunas letras modifican otras letras desde la izquierda, la derecha, arriba, abajo o dentro. Pero, ¿por qué es eso relevante? Los idiomas indios también se pueden escribir en forma lineal, comúnmente con IAST o ITRANS . Lo mismo ocurre con las expresiones matemáticas. Su ejemplo bidimensional a menudo se escribe de forma lineal en LaTeX o Mathematica.
A menos que realmente no te gusten los kanji y los logoramas en general, los jeroglíficos y los ideogramas , no tengo idea de por qué.
Supongo que podría argumentar que los ideogramas son letras, pero estoy bastante seguro de que estos caracteres no son un alfabeto .
Los signos escritos en otros sistemas de escritura se denominan mejor silabogramas (que denotan una sílaba) o logogramas (que denotan una palabra o frase).
Las palabras habladas se componen de unidades de sonido llamadas fonemas y las palabras escritas de símbolos llamados grafemas, como las letras del alfabeto inglés.
Claramente los símbolos son grafemas:
Hay componentes grafémicos adicionales que se utilizan en la escritura, como signos de puntuación, símbolos matemáticos, separadores de palabras como el espacio y otros símbolos tipográficos.
En cuanto a sus preguntas:
Todos los idiomas son construcciones, y cualquier palabra infinitamente larga sería imposible de escribir, y ese idioma no podría escribirse. A menos que permita un grafema que diga, por ejemplo, que las letras anteriores tuvieron que pronunciarse un número infinito de veces. Ese sería un lenguaje planeado.
Realmente solo puedo adivinar lo que quiere decir con "estructuras no lineales de letras", pero, por ejemplo, en chino hay 214 radicales en el diccionario Kangxi, y
Los radicales pueden aparecer en cualquier posición de un carácter. Por ejemplo, el radical 女 aparece del lado izquierdo en los caracteres 姐, 媽, 她, 好 y 姓, pero aparece al final en 妾.
Me interesaría ver un lenguaje, además de las matemáticas, que use un alfabeto de manera similar.
Esta parece una pregunta muy extraña en términos de idiomas como realmente son.
En principio, ¿puede un idioma contener algunas palabras que solo pueden representarse mediante infinitas secuencias de letras?
No. Después de todo, la ciencia analiza la evidencia; y la evidencia apropiada aquí son los lenguajes naturales; no hay idiomas con 'secuencias infinitas de letras'; y esto puede deducirse fácilmente de un principio: ¿quién tendría tiempo para escribir tal secuencia?
Las gramáticas están representadas por autómatas de estado finito; existe la jerarquía chomskiana de gramáticas formales de tipos 0-3.
El tipo de gramática que encajaría en un lenguaje como el que sugieres es tipo-0; pero esto se debe a que permite cualquier cosa, son equivalentes a una máquina de Turing, por lo que se parecen más a una computadora que a una gramática viva real; aunque no debería decir que incluso las computadoras reales tienen recursos finitos, por lo que no existe una máquina de Turing real con una cinta infinita.
Las estructuras lineales de palabras, oraciones, párrafos e incluso libros en lenguajes naturales podrían explicarse por la propiedad del cerebro humano de procesar símbolos secuencialmente, uno a la vez. Interesante, pero los sonidos y las imágenes los procesamos de manera diferente, y es por eso que podemos escuchar todos los instrumentos musicales en la orquesta al mismo tiempo y podemos ver los objetos visuales al mismo tiempo. Por esta razón, los acordes musicales no son solo secuencias de notas y los elementos pictóricos en los dibujos no están dispuestos linealmente.
Otro caso son los lenguajes de programación. Utilizados para interacciones entre humanos y computadoras, estos lenguajes están diseñados para presentar la misma información en dos formas diferentes: como códigos fuente para humanos y como códigos de máquina para computadoras. Si bien los códigos fuente son estructuras lineales, se ven casi como textos en lenguajes naturales; Los códigos de máquina no son estructuras lineales: las computadoras no procesan los códigos de máquina secuencialmente, en un orden predefinido.
Además, el lenguaje de las matemáticas es probablemente el caso más difícil. Por ejemplo, sin duda, la fórmula matemática que representa la ley de la gravedad contiene alguna información; sin embargo, no estoy seguro de quién/qué son los originadores y consumidores primarios de esta información: ¿son objetos físicos en sí mismos, un campo gravitatorio alrededor de estos objetos, o es solo mi imaginación la que propone esta ley? Además, ni siquiera está claro cuánta información contiene esta fórmula: ¿hay pocos bytes de datos que sean suficientes para escribir esta fórmula o una cantidad infinita de información que define todas las trayectorias gravitacionales posibles en nuestro Universo?
usuario4894
usuario4894
Mauro ALLEGRANZA
Mauro ALLEGRANZA
usuario19423
usuario9166
usuario2953
novicia
novicia
usuario19423
novicia
usuario19423
novicia
usuario19423
Mauro ALLEGRANZA
usuario6917
novicia