¿Cómo llegó la lógica de primer orden a ser la lógica formal dominante?

Los primeros sistemas formales como el Begriffsschrift de Frege o el trabajo de Peano sobre la axiomatización de los números naturales usaban un sistema de axiomas con una lógica subyacente de predicados de segundo orden (desde el punto de vista actual). ¿Por qué se abandonaron estos sistemas lógicos de segundo orden en favor de la lógica de predicados de primer orden? Después de todo, la lógica de segundo orden es lo suficientemente poderosa para caracterizar el número natural hasta el isomorfismo, mientras que la lógica de primer orden no puede caracterizar estructuras infinitas hasta el isomorfismo (como se desprende del teorema de Löwenheim Skolem ).

Editar Las siguientes especulaciones de la pregunta inicial son incorrectas (ver respuesta aceptada):

Una cosa que podría imaginar es que la comprensión de que no puede haber un sistema de deducción completo (secuencial) para la lógica de segundo orden generó sospechas en su contra. Pero la integridad de la lógica de primer orden solo fue demostrada por Kurt Gödel en un momento en que la lógica de primer orden ya había desplazado a la lógica de segundo orden. De lo que sí me doy cuenta es que la lógica de primer orden se adoptó en un momento antes de que se entendieran completamente sus propias deficiencias.

Sin embargo, todavía me pregunto por qué se abandonó la lógica de segundo orden y por qué la incapacidad de la lógica de primer orden para caracterizar la estructura infinita no se considera un problema.

+1 ¿Tiene alguna referencia para su afirmación de que alrededor de 1930 "la lógica de primer orden ya había desplazado a la lógica de segundo orden" o, de manera más general, una línea de tiempo de este "declive" y cómo se mediría? (Tengo dudas de que tu valoración histórica sea correcta, pero tal vez tengas pruebas que me convenzan de lo contrario).
Es posible que desee considerar hacer esta misma pregunta en math.SE; hay varios lógicos allí con conocimientos históricos.
@DBK Probablemente tenga razón en que mi evaluación histórica es incorrecta. Identifiqué demasiado a Hilbert y Russell con las fechas 1900 (el segundo problema de Hilbert) y 1903 (Principios de las matemáticas), aun así, sus principales contribuciones a la lógica elaboradas formalmente aparecieron mucho más tarde (de lo cual me di cuenta solo después de que usted mencionó que mi línea de tiempo es incorrecta) ). Sin embargo, incluso si la elaboración de la lógica de primer orden con todo detalle tomó algún tiempo, la distinción entre la lógica de primer y segundo orden debe haber sido posible en 1915, cuando Löwenheim publicó su resultado sobre la lógica de primer orden.
Publiqué mi respuesta totalmente refactorizada.
@DBK ¡Guau! Me gusta especialmente la sección de referencias. Después de leer algunas de las referencias, tengo la impresión de que su respuesta/resumen es correcta. Especialmente, tiene razón en que la afirmación "la integridad de la lógica de primer orden solo fue probada por Kurt Gödel en un momento en que la lógica de primer orden ya había desplazado a la lógica de segundo orden " es incorrecta. Y realmente aprendí mucho ahora, no solo sobre historia, sino también sobre la lógica misma.
¡Gracias! Encuentro que los dos documentos enumerados en la parte superior son particularmente útiles. Intentaré aclarar el breve resumen sobre la actitud de Skolem con respecto a la teoría de conjuntos FOL y FO, ya que hubo algunos escrúpulos al respecto. Aún así, es posible que desee seguir la sugerencia de @ Mitch y hacer su pregunta sobre math.SE y/o mathoverflow también. Hay muchos lógicos conocedores de la historia de su disciplina allí. (Enlace a ellos aquí, en caso de que lo haga).
Agregué un párrafo que trata específicamente el problema de caracterizar estructuras infinitas en FOL (§4): probablemente no sea una respuesta satisfactoria, pero creo que es tan buena como parece.

Respuestas (3)

La respuesta corta (tl; dr)

El contexto histórico relevante para responder a su pregunta es la larga búsqueda de la lógica para proporcionar fundamentos para todas las matemáticas . La teoría axiomática de conjuntos de Zermelo desplazó a contendientes como la teoría de tipos y ganó la carrera desde el principio, porque los lógicos de esta tradición desarrollaron herramientas metalógicas (teoría de modelos, teoría de pruebas) para investigar los sistemas de axiomas. La contribución de Zermelo se produjo alrededor de 1908 y, a través del trabajo de Fraenkel, Skolem y otros a mediados de los años 20 (antes del resultado de completitud de Gödel), rápidamente se convirtió en la teoría de conjuntos estándar que conocemos hoy, la teoría de conjuntos de Zermelo-Fraenkel + Elección (ZFC)

El hecho de que ZFC se convirtiera en una teoría pura de primer orden se debe a los primeros trabajos de David Hilbert sobre un subsistema de lógica que denominó cálculo funcional restringido (efectivamente, la lógica de primer orden actual) y a Thoralf Skolem , quien en 1923 dio la teoría original de primer orden. axiomatización de la teoría de conjuntos de Zermelo. La teoría axiomática de conjuntos se convirtió efectivamente en una teoría dominante de primer orden a mediados de los años 30 y es de primer orden hasta el día de hoy. A la mayoría de los teóricos de conjuntos les gustan mucho las propiedades de la lógica de primer orden (completitud, compacidad, etc.). El hecho de que la teoría de conjuntos de primer orden se desvíe de la práctica matemática en realidad se ve como una característica, no como un error.


la respuesta larga

Parece trivial hoy en día, pero para adoptar la lógica de primer orden ( FOL ), uno tiene que ser capaz de aislarla de la lógica de segundo orden ( SOL ) o de las lógicas de orden superior. Y esta posibilidad fue en sí misma una conquista importante. Hasta Principia Mathematica , los lógicos solían emplear sin mucho cuidado varias versiones de lógica de segundo orden (incluida la lógica infinitaria ). FOL y SOL no se distinguían realmente (¿distinguibles?) hasta que los relativos méritos y viciosde cada uno fueron investigados. O, para decirlo al revés: fue la búsqueda fundacionalista la que condujo a estudiar no solo la expresibilidad, sino también las propiedades de varios fragmentos y fue a través de este lugar que se discernieron FOL y SOL.

1. Dos tradiciones en lógica

Me parece que fue el descubrimiento de Russell de la famosa paradoja en 1901 en la ingenua teoría de conjuntos de Cantor (descubierta independientemente por Zermelo, quien se la comunicó a Hilbert) lo que comenzó todo. Dado que la paradoja también apareció en la versión formalizada de Frege de la teoría ingenua de conjuntos, los lógicos comenzaron a idear varias formas de evitar el problema y construyeron nuevos enfoques teóricos de conjuntos. Las dos propuestas más importantes que solucionaron estas (y otras) paradojas fueron la teoría de conjuntos de la teoría de tipos de Russell y la teoría de conjuntos de Zermelo .

Estas dos soluciones se consideran comúnmente como expresiones de dos "tensiones" diferentes dentro de la lógica, la tradición Peano-Frege-Whitehead-Russell y la tradición (Peirce)-Schröder-Hilbert-Zermelo .

2. Investigación metalógica

El punto importante es que estas dos tradiciones obtuvieron puntajes desiguales en la tarea antes mencionada de investigar fragmentos lógicos y sus propiedades. De los dos, el último fue en términos lakatosianos el programa de investigación progresista porque se interesó desde el principio en las cuestiones metalógicas , mientras que el primero no.

Para entender por qué esto es así, ayuda recordar que la primera tradición se identifica comúnmente con el logicismo , una concepción que define la razón de ser de la lógica como la tarea de fundamentar todas las matemáticas. Para la mayoría de los logicistas, esto implicaba que era imposible "permanecer fuera" de la lógica y, por lo tanto, estudiarla como un sistema (en la forma en que uno podría, por ejemplo, estudiar los números reales). Esto tuvo graves consecuencias: Russell y Whitehead

  • carecía de cualquier concepción de un metalenguaje
  • negó explícitamente la posibilidad de pruebas de independencia para sus axiomas
  • creía imposible probar que la sustitución es generalmente aplicable en la teoría de tipos
  • insistió en que el Principio de inducción matemática no puede usarse para probar teoremas sobre su sistema de lógica

¡Hoy en día es difícil entender lo que significa hacer lógica sin una distinción lenguaje-metalenguaje y una distinción sintaxis-semántica !

3. El surgimiento de FOL

No es una coincidencia, creo, que fue en este marco metateórico, y en la tradición de Schröder-Hilbert-Zermelo, que la lógica se puso en la mesa de operaciones para ser diseccionada, por así decirlo. Fue una consecuencia directa de la necesidad de investigar metalógicamente las propiedades (solidez, completitud, compacidad, consistencia, categoricidad, etc.) de varios fragmentos lógicos: en 1918 Bernays dio la primera prueba rigurosa de completitud de tal subsistema de lógica, es decir proposicional. lógica. Otro fragmento resultó ser lo que ahora llamamos FOL . Específicamente, fue desarrollado por primera vez en 1917 bajo el nombre de cálculo funcional restringido por Hilbert como un subsistema de su cálculo funcional (efectivamente unteoría de tipos ramificados ), pero solo se publicó en el libro de texto clásico en coautoría con Ackermann Grundzüge der theoretischen Logik en 1928, donde todavía se trataba como un subsistema.

De hecho, el caso estaba lejos de resolverse. Si bien la teoría de conjuntos original de Zermelo puede interpretarse como una teoría de FO (con el axioma de separación reemplazado por un esquema de axioma con un axioma para cada fórmula de FO), según la propia concepción de Zermelo, era una teoría de segundo orden (con el axioma de separación como un solo axioma). Zermelo siguió siendo un fuerte defensor de una teoría de conjuntos de segundo orden. De hecho, la mayoría de los lógicos usaron diferentes fragmentos de lógica para diferentes tareas y no dudaron en emplear teorías de segundo orden o teorías de FO anómalas (es decir, que incluyen operaciones infinitas).

El hecho de que la teoría de conjuntos sea hoy una teoría FO probablemente se deba a Thoralf Skolem . En 1923 Skolem presentó la axiomatización FO original de la teoría de conjuntos de Zermelo. Ahora, existe una visión estándar que considera que un "eje" Skolem-Gödel insta a adoptar una teoría de conjuntos FO y es responsable del establecimiento final de la teoría de conjuntos FO. Sin embargo, no está del todo claro que este fuera el caso, es decir, que Skolem (y Gödel) estaban impulsando un lenguaje de objetos FO en la teoría de conjuntos. Si bien Skolem criticó la teoría de conjuntos de segundo orden como base de las matemáticas, demostró que su teorema (hacia abajo) se cumple en FOL . El resultado - en un modelo contable es cierto que hay un conjunto incontable - lo llamó una paradoja filosófica (aunque no formal)para argumentar que tampoco FOL podría servir como fundamento de las matemáticas:

Creía que estaba tan claro que la axiomatización en términos de conjuntos no era un fundamento último satisfactorio de las matemáticas que los matemáticos, en su mayor parte, no estarían muy interesados ​​en ello. Pero en tiempos recientes he visto con sorpresa que tantos matemáticos piensan que estos axiomas de la teoría de conjuntos proporcionan la base ideal para las matemáticas; por lo tanto, me pareció que había llegado el momento de una crítica. (Skolem 1922)

(¡Incluso existe la sospecha de que la axiomatización de Skolem fue FO por casualidad ...! Existe buena evidencia de que muchas de las mentes más brillantes de su época, como Fraenkel y von Neumann, tuvieron problemas para desarrollar una comprensión real de la diferencia entre FOL y SOL. a mediados de los 20!).

¡Y Gödel, aunque abogó por un *metal*lenguaje FO, utilizó una variante de la teoría de tipos en su famoso artículo de 1931!

Sin duda, es innegable que tanto Skolem como Gödel contribuyeron con importantes teoremas para ayudar a establecer FOL, pero en realidad no lo defendieron. La verdad parece que aquí no hay una historia simple de éxito con héroes que contar . Una explicación más correcta probablemente involucraría múltiples factores causales.

La declaración del OP de que

la integridad de la lógica de primer orden solo fue demostrada por Kurt Gödel en un momento en que la lógica de primer orden ya había desplazado a la lógica de segundo orden

sin embargo es incorrecto. Las axiomatizaciones de FO de la teoría de conjuntos se volvieron dominantes solo a partir de mediados de los años 30. Existe una hipótesis en el sentido de que esta línea de tiempo debería estar correlacionada con la importante contribución de Tarski a la teoría del modelo (verdad, consecuencia lógica). Desde este punto de vista, FOL se convirtió en estándar no (solo) por sus cualidades intrínsecas, sino porque demostró tener una teoría de modelo particularmente agradable.

4. ¿Por qué (no) la teoría de conjuntos de primer orden?

Sin embargo, todavía me pregunto por qué […] por qué la incapacidad de la lógica de primer orden para caracterizar la estructura infinita no se considera un problema.

Bueno, una respuesta pragmática es que no se considera un problema debido a la incapacidad de FOL;)

Como no es posible caracterizar (es decir, axiomatizar categóricamente ) estructuras infinitas en FOL, como usted dice, los teóricos de conjuntos simplemente trabajan con el modelo previsto y se preocupan por los modelos no estándar solo cuando son necesarios. Eso es tan bueno como se pone, me preocupa.

La disputa más general se trata de ponderar los méritos y vicios de FOL y SOL. A primera vista parece que

  • FOL

     + complete, compact, nice model theory 
     - deviating from mathematical practice
    
  • SOL

     + adherent to mathematical practice
     - completeness does not hold
    

Dado que nadie cuestionaría los méritos de FOL, todo se reduce a la pregunta de qué manera la adherencia a la práctica matemática es realmente algo bueno y cómo se evalúa la pérdida de los méritos de FOL. De mi experiencia con los lógicos.

  • los partidarios de FOL considerarían una lengua sin los méritos de FOL como una gran pérdida. Además, no ven la desviación de la práctica matemática como un vicio, sino como una característica. Esto podría ser un remanente de la tradición finitaria en lógica: se requiere que la lógica sea más estricta que las matemáticas (y su práctica) para servir como fundamento para ella.

  • los partidarios de SOL no considerarían fatal la pérdida de integridad, etc. Ven la teoría de conjuntos no tanto como una base de las matemáticas. En cambio, la teoría de conjuntos debería ser más una descripción de las matemáticas, es decir, cuanto más se adhiere a la práctica matemática, mejor (= más precisa) se vuelve la descripción.

  • algunos ven un camino intermedio entre los dos al adoptar otra teoría de conjuntos FO como la teoría de conjuntos de Morse-Kelley. MK, que permite clases adecuadas junto con conjuntos, es sintácticamente casi idéntico a ZFC de segundo orden, pero difiere bastante en su semántica.

Elige tu elección :)


Fuentes y lecturas adicionales:

Esto es un poco demasiado relativista. La lógica de segundo orden debe construirse sobre la lógica de primer orden y una teoría de conjuntos para ser precisa, porque la lógica misma sufre de incompletitud. El resultado de Gödel estableció que la computación existe y que los límites de la computación son los límites de la razón misma. No es razonable usar un sistema que presupone que se pueden exceder estos límites, porque no se puede.
Gracias por su respuesta (tanto la parte definitiva "... la teoría axiomática de conjuntos es una teoría de primer orden, este tipo de respuestas..." y la advertencia). Espero con ansias la segunda parte anunciada de su respuesta ...
@Ron ¿Qué quieres decir con "relativista"? ¿Te refieres a la circunstancia de que no profeso amor incondicional y elogios para FOL? ;)
@DBK: Sí, más o menos, no amor ni elogios, sino comprensión total. No tengo una comprensión completa de la lógica de segundo orden, porque no puedo calcularla como FOL.
@RonMaimon Bueno, dado que las matemáticas son de segundo orden, entonces no entiendes completamente las matemáticas;) Por cierto, reescribí totalmente mi respuesta...
@DBK: las matemáticas son de primer orden --- ZF es más fuerte que la aritmética de segundo orden, y es más fuerte que toda lógica razonable de "segundo orden", pero es una teoría de primer orden. Es precisamente porque quieres las colecciones incontables en la teoría, no en la lógica, que la gente estandarizó la lógica de primer orden. Esta lógica es suficiente para todas las matemáticas tal como se practican, y puede describir teorías de segundo orden con mayor precisión que las propias teorías de segundo orden. Para que la cuantificación de segundo orden sea precisa, necesita un marco de primer orden para definir el dominio.
@RonMaimon Por "las matemáticas son de segundo orden", simplemente quise decir que los matemáticos a menudo usan un razonamiento informal de segundo orden (por ejemplo, cuantifican todas las funciones con una determinada propiedad). Incluso en la teoría de conjuntos se encuentra que, por ejemplo, A cardinal κ is measurable if and only if it is the critical point of an elementary embedding j:V → M in V. Que estas formulaciones sean reducibles o traducibles a formulaciones de primer orden es el punto central de ZFC.
@DBK: Sí, por supuesto, pero ese sentimiento de segundo orden es impreciso a menos que esté en ZF. Se vuelve preciso en ZF, porque ZF tiene un programa de deducción para producir todas las consecuencias y el resultado produce un modelo de símbolo. Es por eso que la lógica de primer orden es fundamental y la de segundo orden no lo es, y esto responde la pregunta.
Esta respuesta tiene una serie de errores históricos: primero, ¡estás malinterpretando tu propia cita de Skolem! Skolem no está criticando el primer o segundo orden, está criticando la noción de infinito incontable, que creía que no tenía cabida en las matemáticas. Su caracterización de la historia como una serie de accidentes que dejaron a FOL dominante es un grave abuso de los actores principales: ellos, especialmente Hilbert, estaban tratando de hacer preciso el concepto de "algoritmo efectivo" y dar un algoritmo efectivo para lógica. deducción. Esto condujo inexorablemente a la computadora moderna.
Dado que ahora conocemos la computación, la literatura previa se puede aclarar inmensamente. Son intentos de producir una noción de deducción en una época en la que no estaba claro que existiera una noción única de computación que no se basara en ningún supuesto metafísico. El prejuicio de Skolem de que los conjuntos contables son absolutos, mientras que las colecciones incontables son paradójicas, se refleja en el hecho de que cualquier algoritmo de manipulación textual solo puede dar muchos nombres contables distintos a los objetos. No hay absolutamente ninguna forma de que este desarrollo haya terminado con algo diferente a lo que tenemos hoy.
-1, lo siento, esta respuesta es completamente incorrecta tanto en el alcance general como en el impulso, y en todos los detalles. Lo quitaré si se arregla. Las cosas de Skolem deben ser reescritas. Además, la afirmación de que la cuantificación de segundo orden está más cerca de la práctica matemática es completamente discutible en una teoría de conjuntos normal en la que cuantificas sobre conjuntos, por lo que no veo el punto.
@RonMaimon "Dado que ahora conocemos la computación, la literatura anterior se puede aclarar inmensamente..." Lo siento, no tengo tiempo ni paciencia para este tipo de relatos hegelianos de la historia de la ciencia. Las explicaciones teleológicas en la historia han quedado atrás hace mucho tiempo. Como esto no es un malentendido entre nosotros, sino dos entendimientos diferentes sobre cómo hacer historia que chocan entre sí, no pasaré más tiempo discutiendo este punto. Si eso significa obtener un voto negativo de usted , viviré con eso.
@RonMaimon Con respecto a la interpretación de la cita de Skolem: Su opinión de que Skolem está aquí criticando el concepto de conjuntos incontables (tal como lo da el teorema de Cantor) es una interpretación minoritaria presentada por Ignacio Janés (2001) . Seguí la interpretación ortodoxa (que también refleja cómo sus contemporáneos entendían a Skolem): ¡Tenía un problema con el hecho de que podemos encontrar un modelo contable en primer lugar! …
@RonMaimon ... Dado que esto es válido precisamente para cada axiomatización contable de la teoría de conjuntos en FOL, la paradoja de Skolem expresa su crítica general de las axiomatizaciones de FO de la teoría de conjuntos. La observación de Skolem también está motivada por su descubrimiento de que las teorías de primer orden no son categóricas . Löwenheim-Skolem implica que la categoricidad falla en las teorías de primer orden. Dado que la integridad semántica se deriva de la categoricidad, Skolem vio el fracaso como un argumento en contra de una axiomatización de primer orden de la teoría de conjuntos.
@DBK: En cuanto a la cuenta "hegeliana", no me gusta Hegel. La cuenta que doy es simplemente la correcta como le dirá cualquier matemático. La gente buscó a tientas una computadora a principios del siglo XX, la recursividad primitiva se definió y redefinió, Post dio una computadora, finalmente Godel y Turing la hicieron precisa en 1936 y se mantuvo. ¡ La acción fue motivada teleológicamente, como incluso ellos escriben ! Están buscando una formulación finitista precisa de algoritmo y lógica. Solo hay una manera de hacer esto, y esto es lo que encontraron. Esto no es discutible.
@DBK: Su afirmación de que el "modelo previsto" de la teoría de conjuntos es una noción obvia y bien definida es falsa. El "modelo previsto" ciertamente tiene ordinales aleph-1 aleph-2 aleph-omega, y tiene los números reales P(omega), y P(omega) asigna uno a uno a exactamente un aleph. ¿Cuál? Tal vez piense que el modelo previsto obedece a V=L. Tal vez creas que obedece a P(omega)=aleph-2. ¿Quién puede decidir? Se demuestra fácilmente que estas preguntas son vagas en ZFC de primer orden --- puede forzarlas de una forma u otra --- y los problemas nunca se resuelven, ni por cardenales superiores, ni por nada.
@DBK: todos los teóricos de conjuntos desde 1963 trabajan regularmente con modelos contables de ZF como el principal objeto de estudio, y nunca se ha decidido qué modelo contable refleja mejor la estructura "verdadera" del universo. Por supuesto, creo que la pregunta no tiene sentido, pero si tuviera que elegir, pondría los reales en un valor más alto que cualquier ordinal, y cada subconjunto de R medible (por lo que no hay elección en R). Esta es la opción más conveniente para la teoría de la medida y la integración, pero no es popular entre los matemáticos que quieren creer que los reales pueden estar bien ordenados, aunque está demostrado que en realidad no es posible.
@RonMain: ¿Dónde afirmé que el "modelo previsto de teoría de conjuntos es una noción obvia y bien definida"? no lo hice Deje de atribuir reclamaciones falsas a otros. Para fines genéricos, el modelo previsto de ZFC es V= la jerarquía acumulativa completa. Pero, como dices, uno puede restringir Vagregando V=Lo forzando nuevos modelos a su gusto. En cuanto a mi propio punto de vista, simpatizo con el punto de vista del multiverso de Hamkins .
¡Esa es una respuesta de página de wikipedia! Sin embargo, parece un argumento un poco inútil dado que Ron admite en su perfil que no ha leído mucha filosofía.
@ChrisS: No he leído mucho de nada , no leo demasiado. La lectura no es la fuente del conocimiento, el pensamiento lo es.
@Ron, entonces, ¿cómo transmites el conocimiento a otras personas? (¡Por favor, no lo digas de la manera bíblica!)
@ChrisS: Escribiendo. Pero quieres ser respetuoso con el tiempo de las personas y escribir el relato lo más breve posible. Esto significa que Hegel me está haciendo perder el tiempo, Heidegger me está haciendo perder el tiempo, Kant me está haciendo perder el tiempo y no los leeré, los hojearé rápidamente, ya que no merecen una lectura detallada. Nietzsche no merece ninguna lectura en absoluto. Trato de leer la literatura más densa posible, ya que contiene la mayor cantidad de información por palabra. ¿Cuál diablos es la forma bíblica? ¿Oración?
@ChrisS: esta respuesta es abismal y debería eliminarse. Podría ser una respuesta de "página de Wikipedia", pero eso no es un complemento en este caso.

La lógica de primer orden no es arbitraria ni generalizable, a pesar de la propaganda que da la gente al respecto. Es un sistema que es único hasta reformulaciones equivalentes, y no es un error llamarlo simplemente "lógica". La lógica de primer orden es el único sistema que uno necesita para las matemáticas o la filosofía, todo lo demás es un lujo, agradable de pensar, pero no esencial. Es mejor tratar las generalizaciones de la lógica de primer orden como ejercicios matemáticos interesantes.

Antes de principios del siglo XX, la lógica no existía en ninguna formulación lo suficientemente precisa como para permitir que una máquina dedujera consecuencias de los axiomas. Esto significa que todo el trabajo filosófico sobre lógica desde la época de Aristóteles hasta la época de Boole y Frege fue de valor negativo: creó la ilusión de que la lógica se entendía de alguna manera, cuando la gente no tenía ni idea. Nada de ese trabajo tiene más que valor histórico.

El objetivo de los esquemas de deducción de principios del siglo XX era permitir que el razonamiento matemático se hiciera mecánicamente, sin ningún conocimiento humano. El objetivo era hacer una teoría de conjuntos libre de contradicciones, tratando las matemáticas como una manipulación textual formal, lo que hoy llamaríamos computación sobre cadenas. El desarrollo de la deducción de Hilbert y el teorema de completitud de Gödel, junto con axiomas razonables de la teoría de conjuntos, completaron este programa y demostraron que la lógica de primer orden era la lógica correcta para este propósito. Dada cualquier colección de axiomas, la lógica de primer orden deducirá cualquier consecuencia y producirá un modelo de estos axiomas.

La lógica de primer orden se puede hacer en una computadora (de hecho, la computadora se definió históricamente como la abstracción de una máquina mínima que puede hacer lógica de primer orden). La lógica de segundo orden habla de colecciones demasiado grandes (como el conjunto de subconjuntos de números enteros, los números reales) y no se puede razonar sobre estas colecciones de manera absoluta en una computadora. La única forma de saber exactamente lo que quiere decir con el "conjunto de todos los números reales" es hacer axiomas que reflejen sus creencias metafísicas sobre cómo se comportan las colecciones infinitas, y obtiene interminables debates sobre la corrección de estos axiomas, debates que no se pueden resolver. porque son positivistamente sin sentido.

Debido a que las teorías de segundo orden hablan de colecciones cuyas propiedades no son absolutas, es mejor verlas como definidas de manera imprecisa hasta que se incrustan dentro de una teoría de conjuntos, y esta teoría más grande solo se hace precisa cuando es una teoría de primer orden, de modo que usted puede razonar sobre ello en una computadora. Uno no debería admitir nada que no pueda ser decidido por este tipo de razonamiento como absolutamente significativo.

Debido a que la lógica de primer orden puede modelar cualquier sistema con el que podamos trabajar, sus limitaciones son nuestras limitaciones, son verdaderas limitaciones del conocimiento no limitaciones del sistema, y ​​es un error imaginar que la lógica de segundo orden lo extiende de manera significativa. No tiene sentido imaginar criaturas de segundo orden razonando en lógica de segundo orden "de verdad", porque no hay razonamiento en nuestro universo que exceda el razonamiento de primer orden.

Todavía tengo demasiadas preguntas abiertas en mi comprensión de FOL y SOL. Por ejemplo, no me queda claro si teoremas sin sentido como us.metamath.org/mpegif/avril1.html que son causados ​​por definiciones de "segundo orden emulado" como us.metamath.org/mpegif/df-opr.html podrían haberse evitado (y solo se aceptan por razones de conveniencia), o si estos son artefactos inevitables del uso de FOL como base para Metamath Proof Explorer. Podría hacer esta pregunta en math.SE, pero es solo una de mis preguntas abiertas más concretas con respecto a SOL.

La lógica de primer orden llegó a ser la lógica formal dominante porque es fundamental para toda lógica. Cualquier desviación de FOL crea ambigüedades que deben resolverse. Por ejemplo, la oración de segundo orden "un hombre entró en una habitación con flores" es ambigua. Podría significar que un hombre llevó flores a una habitación, o que un hombre entró en una habitación donde ya había flores.

John Sowa escribió lo siguiente sobre FOL:

"Entre todas las variedades de lógica, la lógica clásica de primer orden tiene un estatus privilegiado. Tiene suficiente poder expresivo para definir todas las matemáticas, cada computadora digital que se haya construido y la semántica de cada versión de la lógica, incluida ella misma. Fuzzy la lógica, la lógica modal, las redes neuronales e incluso la lógica de orden superior se pueden definir en [lógica de primer orden]... Además del poder expresivo, la lógica de primer orden tiene la teoría del modelo y la teoría de la prueba mejor definidas y menos problemáticas, y puede definirse en términos de un mínimo de primitivos... Dado que la lógica de primer orden tiene un poder tan grande, muchos filósofos y lógicos como Quine han argumentado con fuerza que la clásica [lógica de primer orden] es, en cierto sentido, "la única lógica verdadera". lógica'' y que las otras versiones son redundantes, innecesarias o mal concebidas".

Bienvenido a Filosofía.SE. Si lo desea, aquí hay un enlace para hacer el recorrido . Gracias por tu interesante respuesta. ¡Disfruta SE!