Los primeros sistemas formales como el Begriffsschrift de Frege o el trabajo de Peano sobre la axiomatización de los números naturales usaban un sistema de axiomas con una lógica subyacente de predicados de segundo orden (desde el punto de vista actual). ¿Por qué se abandonaron estos sistemas lógicos de segundo orden en favor de la lógica de predicados de primer orden? Después de todo, la lógica de segundo orden es lo suficientemente poderosa para caracterizar el número natural hasta el isomorfismo, mientras que la lógica de primer orden no puede caracterizar estructuras infinitas hasta el isomorfismo (como se desprende del teorema de Löwenheim Skolem ).
Editar Las siguientes especulaciones de la pregunta inicial son incorrectas (ver respuesta aceptada):
Una cosa que podría imaginar es que la comprensión de que no puede haber un sistema de deducción completo (secuencial) para la lógica de segundo orden generó sospechas en su contra. Pero la integridad de la lógica de primer orden solo fue demostrada por Kurt Gödel en un momento en que la lógica de primer orden ya había desplazado a la lógica de segundo orden. De lo que sí me doy cuenta es que la lógica de primer orden se adoptó en un momento antes de que se entendieran completamente sus propias deficiencias.
Sin embargo, todavía me pregunto por qué se abandonó la lógica de segundo orden y por qué la incapacidad de la lógica de primer orden para caracterizar la estructura infinita no se considera un problema.
El contexto histórico relevante para responder a su pregunta es la larga búsqueda de la lógica para proporcionar fundamentos para todas las matemáticas . La teoría axiomática de conjuntos de Zermelo desplazó a contendientes como la teoría de tipos y ganó la carrera desde el principio, porque los lógicos de esta tradición desarrollaron herramientas metalógicas (teoría de modelos, teoría de pruebas) para investigar los sistemas de axiomas. La contribución de Zermelo se produjo alrededor de 1908 y, a través del trabajo de Fraenkel, Skolem y otros a mediados de los años 20 (antes del resultado de completitud de Gödel), rápidamente se convirtió en la teoría de conjuntos estándar que conocemos hoy, la teoría de conjuntos de Zermelo-Fraenkel + Elección (ZFC)
El hecho de que ZFC se convirtiera en una teoría pura de primer orden se debe a los primeros trabajos de David Hilbert sobre un subsistema de lógica que denominó cálculo funcional restringido (efectivamente, la lógica de primer orden actual) y a Thoralf Skolem , quien en 1923 dio la teoría original de primer orden. axiomatización de la teoría de conjuntos de Zermelo. La teoría axiomática de conjuntos se convirtió efectivamente en una teoría dominante de primer orden a mediados de los años 30 y es de primer orden hasta el día de hoy. A la mayoría de los teóricos de conjuntos les gustan mucho las propiedades de la lógica de primer orden (completitud, compacidad, etc.). El hecho de que la teoría de conjuntos de primer orden se desvíe de la práctica matemática en realidad se ve como una característica, no como un error.
Parece trivial hoy en día, pero para adoptar la lógica de primer orden ( FOL ), uno tiene que ser capaz de aislarla de la lógica de segundo orden ( SOL ) o de las lógicas de orden superior. Y esta posibilidad fue en sí misma una conquista importante. Hasta Principia Mathematica , los lógicos solían emplear sin mucho cuidado varias versiones de lógica de segundo orden (incluida la lógica infinitaria ). FOL y SOL no se distinguían realmente (¿distinguibles?) hasta que los relativos méritos y viciosde cada uno fueron investigados. O, para decirlo al revés: fue la búsqueda fundacionalista la que condujo a estudiar no solo la expresibilidad, sino también las propiedades de varios fragmentos y fue a través de este lugar que se discernieron FOL y SOL.
Me parece que fue el descubrimiento de Russell de la famosa paradoja en 1901 en la ingenua teoría de conjuntos de Cantor (descubierta independientemente por Zermelo, quien se la comunicó a Hilbert) lo que comenzó todo. Dado que la paradoja también apareció en la versión formalizada de Frege de la teoría ingenua de conjuntos, los lógicos comenzaron a idear varias formas de evitar el problema y construyeron nuevos enfoques teóricos de conjuntos. Las dos propuestas más importantes que solucionaron estas (y otras) paradojas fueron la teoría de conjuntos de la teoría de tipos de Russell y la teoría de conjuntos de Zermelo .
Estas dos soluciones se consideran comúnmente como expresiones de dos "tensiones" diferentes dentro de la lógica, la tradición Peano-Frege-Whitehead-Russell y la tradición (Peirce)-Schröder-Hilbert-Zermelo .
El punto importante es que estas dos tradiciones obtuvieron puntajes desiguales en la tarea antes mencionada de investigar fragmentos lógicos y sus propiedades. De los dos, el último fue en términos lakatosianos el programa de investigación progresista porque se interesó desde el principio en las cuestiones metalógicas , mientras que el primero no.
Para entender por qué esto es así, ayuda recordar que la primera tradición se identifica comúnmente con el logicismo , una concepción que define la razón de ser de la lógica como la tarea de fundamentar todas las matemáticas. Para la mayoría de los logicistas, esto implicaba que era imposible "permanecer fuera" de la lógica y, por lo tanto, estudiarla como un sistema (en la forma en que uno podría, por ejemplo, estudiar los números reales). Esto tuvo graves consecuencias: Russell y Whitehead
¡Hoy en día es difícil entender lo que significa hacer lógica sin una distinción lenguaje-metalenguaje y una distinción sintaxis-semántica !
No es una coincidencia, creo, que fue en este marco metateórico, y en la tradición de Schröder-Hilbert-Zermelo, que la lógica se puso en la mesa de operaciones para ser diseccionada, por así decirlo. Fue una consecuencia directa de la necesidad de investigar metalógicamente las propiedades (solidez, completitud, compacidad, consistencia, categoricidad, etc.) de varios fragmentos lógicos: en 1918 Bernays dio la primera prueba rigurosa de completitud de tal subsistema de lógica, es decir proposicional. lógica. Otro fragmento resultó ser lo que ahora llamamos FOL . Específicamente, fue desarrollado por primera vez en 1917 bajo el nombre de cálculo funcional restringido por Hilbert como un subsistema de su cálculo funcional (efectivamente unteoría de tipos ramificados ), pero solo se publicó en el libro de texto clásico en coautoría con Ackermann Grundzüge der theoretischen Logik en 1928, donde todavía se trataba como un subsistema.
De hecho, el caso estaba lejos de resolverse. Si bien la teoría de conjuntos original de Zermelo puede interpretarse como una teoría de FO (con el axioma de separación reemplazado por un esquema de axioma con un axioma para cada fórmula de FO), según la propia concepción de Zermelo, era una teoría de segundo orden (con el axioma de separación como un solo axioma). Zermelo siguió siendo un fuerte defensor de una teoría de conjuntos de segundo orden. De hecho, la mayoría de los lógicos usaron diferentes fragmentos de lógica para diferentes tareas y no dudaron en emplear teorías de segundo orden o teorías de FO anómalas (es decir, que incluyen operaciones infinitas).
El hecho de que la teoría de conjuntos sea hoy una teoría FO probablemente se deba a Thoralf Skolem . En 1923 Skolem presentó la axiomatización FO original de la teoría de conjuntos de Zermelo. Ahora, existe una visión estándar que considera que un "eje" Skolem-Gödel insta a adoptar una teoría de conjuntos FO y es responsable del establecimiento final de la teoría de conjuntos FO. Sin embargo, no está del todo claro que este fuera el caso, es decir, que Skolem (y Gödel) estaban impulsando un lenguaje de objetos FO en la teoría de conjuntos. Si bien Skolem criticó la teoría de conjuntos de segundo orden como base de las matemáticas, demostró que su teorema (hacia abajo) se cumple en FOL . El resultado - en un modelo contable es cierto que hay un conjunto incontable - lo llamó una paradoja filosófica (aunque no formal)para argumentar que tampoco FOL podría servir como fundamento de las matemáticas:
Creía que estaba tan claro que la axiomatización en términos de conjuntos no era un fundamento último satisfactorio de las matemáticas que los matemáticos, en su mayor parte, no estarían muy interesados en ello. Pero en tiempos recientes he visto con sorpresa que tantos matemáticos piensan que estos axiomas de la teoría de conjuntos proporcionan la base ideal para las matemáticas; por lo tanto, me pareció que había llegado el momento de una crítica. (Skolem 1922)
(¡Incluso existe la sospecha de que la axiomatización de Skolem fue FO por casualidad ...! Existe buena evidencia de que muchas de las mentes más brillantes de su época, como Fraenkel y von Neumann, tuvieron problemas para desarrollar una comprensión real de la diferencia entre FOL y SOL. a mediados de los 20!).
¡Y Gödel, aunque abogó por un *metal*lenguaje FO, utilizó una variante de la teoría de tipos en su famoso artículo de 1931!
Sin duda, es innegable que tanto Skolem como Gödel contribuyeron con importantes teoremas para ayudar a establecer FOL, pero en realidad no lo defendieron. La verdad parece que aquí no hay una historia simple de éxito con héroes que contar . Una explicación más correcta probablemente involucraría múltiples factores causales.
La declaración del OP de que
la integridad de la lógica de primer orden solo fue demostrada por Kurt Gödel en un momento en que la lógica de primer orden ya había desplazado a la lógica de segundo orden
sin embargo es incorrecto. Las axiomatizaciones de FO de la teoría de conjuntos se volvieron dominantes solo a partir de mediados de los años 30. Existe una hipótesis en el sentido de que esta línea de tiempo debería estar correlacionada con la importante contribución de Tarski a la teoría del modelo (verdad, consecuencia lógica). Desde este punto de vista, FOL se convirtió en estándar no (solo) por sus cualidades intrínsecas, sino porque demostró tener una teoría de modelo particularmente agradable.
Sin embargo, todavía me pregunto por qué […] por qué la incapacidad de la lógica de primer orden para caracterizar la estructura infinita no se considera un problema.
Bueno, una respuesta pragmática es que no se considera un problema debido a la incapacidad de FOL;)
Como no es posible caracterizar (es decir, axiomatizar categóricamente ) estructuras infinitas en FOL, como usted dice, los teóricos de conjuntos simplemente trabajan con el modelo previsto y se preocupan por los modelos no estándar solo cuando son necesarios. Eso es tan bueno como se pone, me preocupa.
La disputa más general se trata de ponderar los méritos y vicios de FOL y SOL. A primera vista parece que
FOL
+ complete, compact, nice model theory
- deviating from mathematical practice
SOL
+ adherent to mathematical practice
- completeness does not hold
Dado que nadie cuestionaría los méritos de FOL, todo se reduce a la pregunta de qué manera la adherencia a la práctica matemática es realmente algo bueno y cómo se evalúa la pérdida de los méritos de FOL. De mi experiencia con los lógicos.
los partidarios de FOL considerarían una lengua sin los méritos de FOL como una gran pérdida. Además, no ven la desviación de la práctica matemática como un vicio, sino como una característica. Esto podría ser un remanente de la tradición finitaria en lógica: se requiere que la lógica sea más estricta que las matemáticas (y su práctica) para servir como fundamento para ella.
los partidarios de SOL no considerarían fatal la pérdida de integridad, etc. Ven la teoría de conjuntos no tanto como una base de las matemáticas. En cambio, la teoría de conjuntos debería ser más una descripción de las matemáticas, es decir, cuanto más se adhiere a la práctica matemática, mejor (= más precisa) se vuelve la descripción.
algunos ven un camino intermedio entre los dos al adoptar otra teoría de conjuntos FO como la teoría de conjuntos de Morse-Kelley. MK, que permite clases adecuadas junto con conjuntos, es sintácticamente casi idéntico a ZFC de segundo orden, pero difiere bastante en su semántica.
Elige tu elección :)
Fuentes y lecturas adicionales:
A cardinal κ is measurable if and only if it is the critical point of an elementary embedding j:V → M in V
. Que estas formulaciones sean reducibles o traducibles a formulaciones de primer orden es el punto central de ZFC.V
= la jerarquía acumulativa completa. Pero, como dices, uno puede restringir V
agregando V=L
o forzando nuevos modelos a su gusto. En cuanto a mi propio punto de vista, simpatizo con el punto de vista del multiverso de Hamkins .La lógica de primer orden no es arbitraria ni generalizable, a pesar de la propaganda que da la gente al respecto. Es un sistema que es único hasta reformulaciones equivalentes, y no es un error llamarlo simplemente "lógica". La lógica de primer orden es el único sistema que uno necesita para las matemáticas o la filosofía, todo lo demás es un lujo, agradable de pensar, pero no esencial. Es mejor tratar las generalizaciones de la lógica de primer orden como ejercicios matemáticos interesantes.
Antes de principios del siglo XX, la lógica no existía en ninguna formulación lo suficientemente precisa como para permitir que una máquina dedujera consecuencias de los axiomas. Esto significa que todo el trabajo filosófico sobre lógica desde la época de Aristóteles hasta la época de Boole y Frege fue de valor negativo: creó la ilusión de que la lógica se entendía de alguna manera, cuando la gente no tenía ni idea. Nada de ese trabajo tiene más que valor histórico.
El objetivo de los esquemas de deducción de principios del siglo XX era permitir que el razonamiento matemático se hiciera mecánicamente, sin ningún conocimiento humano. El objetivo era hacer una teoría de conjuntos libre de contradicciones, tratando las matemáticas como una manipulación textual formal, lo que hoy llamaríamos computación sobre cadenas. El desarrollo de la deducción de Hilbert y el teorema de completitud de Gödel, junto con axiomas razonables de la teoría de conjuntos, completaron este programa y demostraron que la lógica de primer orden era la lógica correcta para este propósito. Dada cualquier colección de axiomas, la lógica de primer orden deducirá cualquier consecuencia y producirá un modelo de estos axiomas.
La lógica de primer orden se puede hacer en una computadora (de hecho, la computadora se definió históricamente como la abstracción de una máquina mínima que puede hacer lógica de primer orden). La lógica de segundo orden habla de colecciones demasiado grandes (como el conjunto de subconjuntos de números enteros, los números reales) y no se puede razonar sobre estas colecciones de manera absoluta en una computadora. La única forma de saber exactamente lo que quiere decir con el "conjunto de todos los números reales" es hacer axiomas que reflejen sus creencias metafísicas sobre cómo se comportan las colecciones infinitas, y obtiene interminables debates sobre la corrección de estos axiomas, debates que no se pueden resolver. porque son positivistamente sin sentido.
Debido a que las teorías de segundo orden hablan de colecciones cuyas propiedades no son absolutas, es mejor verlas como definidas de manera imprecisa hasta que se incrustan dentro de una teoría de conjuntos, y esta teoría más grande solo se hace precisa cuando es una teoría de primer orden, de modo que usted puede razonar sobre ello en una computadora. Uno no debería admitir nada que no pueda ser decidido por este tipo de razonamiento como absolutamente significativo.
Debido a que la lógica de primer orden puede modelar cualquier sistema con el que podamos trabajar, sus limitaciones son nuestras limitaciones, son verdaderas limitaciones del conocimiento no limitaciones del sistema, y es un error imaginar que la lógica de segundo orden lo extiende de manera significativa. No tiene sentido imaginar criaturas de segundo orden razonando en lógica de segundo orden "de verdad", porque no hay razonamiento en nuestro universo que exceda el razonamiento de primer orden.
La lógica de primer orden llegó a ser la lógica formal dominante porque es fundamental para toda lógica. Cualquier desviación de FOL crea ambigüedades que deben resolverse. Por ejemplo, la oración de segundo orden "un hombre entró en una habitación con flores" es ambigua. Podría significar que un hombre llevó flores a una habitación, o que un hombre entró en una habitación donde ya había flores.
John Sowa escribió lo siguiente sobre FOL:
"Entre todas las variedades de lógica, la lógica clásica de primer orden tiene un estatus privilegiado. Tiene suficiente poder expresivo para definir todas las matemáticas, cada computadora digital que se haya construido y la semántica de cada versión de la lógica, incluida ella misma. Fuzzy la lógica, la lógica modal, las redes neuronales e incluso la lógica de orden superior se pueden definir en [lógica de primer orden]... Además del poder expresivo, la lógica de primer orden tiene la teoría del modelo y la teoría de la prueba mejor definidas y menos problemáticas, y puede definirse en términos de un mínimo de primitivos... Dado que la lógica de primer orden tiene un poder tan grande, muchos filósofos y lógicos como Quine han argumentado con fuerza que la clásica [lógica de primer orden] es, en cierto sentido, "la única lógica verdadera". lógica'' y que las otras versiones son redundantes, innecesarias o mal concebidas".
DBK
mitch
Tomas Klimpel
DBK
Tomas Klimpel
DBK
DBK