¿Debería ser un axioma esta "definición" de igualdad de conjuntos?

Esta pregunta trata sobre la igualdad de conjuntos, tal como se presenta en el Capítulo 3, Teoría de conjuntos , Sección 1, Fundamentos , del libro de texto de Terence Tao, Análisis I. Sin embargo, creo que es prudente comenzar antes (técnicamente, más tarde) en el libro, en el Apéndice A, los fundamentos de la lógica matemática , Sección 7, Igualdad . En la página 329, escribe,

La igualdad es una relación que une dos objetos. X , y del mismo tipo T (por ejemplo, dos enteros, o dos matrices, o dos vectores, etc.). Dados dos objetos de este tipo X y y , la declaración X = y puede o no ser verdad; depende del valor de X y y y también sobre cómo se define la igualdad para la clase de objetos bajo consideración. [...]

Cómo se define la igualdad depende de la clase. T de objetos bajo consideración, y hasta cierto punto es sólo una cuestión de definición. Sin embargo, a los efectos de la lógica, requerimos que la igualdad obedezca los siguientes cuatro axiomas de igualdad :

  • (Axioma reflexivo). Dado cualquier objeto X , tenemos X = X .
  • (Axioma de simetría). Dados dos objetos X y y del mismo tipo, si X = y , entonces y = X .
  • (Axioma transitivo). Dados tres objetos X , y , z del mismo tipo, si X = y y y = z , entonces X = z .
  • (Axioma de sustitución). Dados dos objetos X y y del mismo tipo, si X = y , entonces F ( X ) = F ( y ) para todas las funciones u operaciones F .

    Del mismo modo, para cualquier propiedad PAG ( X ) Dependiendo de X , si X = y , entonces PAG ( X ) y PAG ( y ) son declaraciones equivalentes.

Basado en la información de este apéndice, me parece que Tao está desarrollando una teoría de los objetos , donde los objetos pueden ser de diferentes tipos o clases (en otras palabras, su lógica es de orden múltiple ). Volviendo al capítulo 3, Teoría de conjuntos , afirma que los conjuntos son un tipo de objeto, y que los El predicado se puede usar para formar una proposición sobre cualquier par de objetos, donde el segundo objeto es un conjunto: escribe, en la página 34,

Primero aclaramos un punto: consideramos los conjuntos en sí mismos como un tipo de objeto.

Axioma 3.1 (Los conjuntos son objetos). Si A es un conjunto, entonces A también es un objeto. En particular, dados dos conjuntos A y B , tiene sentido preguntarse si A es también un elemento de B .

[...]

Para resumir hasta ahora, entre todos los objetos estudiados en matemáticas, algunos de los objetos resultan ser conjuntos; y si X es un objeto y A es un conjunto, entonces X A es cierto o X A Es falso.

En la página 35, presenta la definición de igualdad para conjuntos:

Definición 3.1.4 (Igualdad de conjuntos). Dos conjuntos A y B son iguales , A = B , si cada elemento de A es un elemento de B y viceversa. Para decirlo de otra manera, A = B si y solo si cada elemento X de A pertenece también a B y cada elemento y de B pertenece también a A .

[...]

Se puede verificar fácilmente que esta noción de igualdad es reflexiva, simétrica y transitiva (Ejercicio 3.1.1). Observa que si X A y A = B , entonces X B , por la Definición 3.1.4. Así, la relación "es un elemento de" obedece al axioma de sustitución (ver Sección A.7). Debido a esto, cualquier operación nueva que definamos sobre conjuntos también obedecerá al axioma de sustitución, siempre que podamos definir esa operación puramente en términos de la relación .

Siento que la declaración en la Definición 3.1.4 debe considerarse un axioma , en lugar de una definición, ya que el = predicado ya fue axiomatizado en la sección A.7 como parte de su lógica de fondo. El ejercicio de "verificar que esta noción de igualdad es reflexiva, simétrica y transitiva" podría entenderse entonces como una verificación de que el axioma de igualdad de conjuntos es consistente con los axiomas de igualdad del apartado A.7 (es "consistente" el palabra correcta para usar aquí?). ¿Estoy en lo cierto al pensar que su definición de igualdad de conjuntos debería ser en realidad un axioma? De manera más general, ¿cómo debería uno distinguir si un enunciado debe ser un axioma o una definición?


Agregado en la actualización: supongo que se trata de si estamos usando lógica de primer orden con igualdad; como se indica aquí , la primera posibilidad es que asumamos los axiomas enumerados en el apéndice para el = predicado, incluidos los axiomas de sustitución de con respecto a los conjuntos:

  • Para todos los conjuntos X y y , si X = y , entonces para todos los objetos z , z X si y solo si z y .

  • Para todos los objetos X y y , si X = y , entonces para todos los conjuntos z , X z si y solo si y z .

Luego agregamos el axioma de extensionalidad para FOL con igualdad :

  • Para todos los conjuntos X y y , si para todos los objetos z , z X si y solo si z y , entonces X = y .

Por otro lado, la segunda posibilidad, que parece ser el caso en el texto de Tao (ya que nos pide que demostremos que la igualdad de conjuntos obedece a los axiomas reflexivo, simétrico y transitivo), es que no axiomatizamos nada sobre el = predicado hasta llegar a este punto, y luego "definirlo" para conjuntos con el axioma:

  • Para todos los conjuntos X y y , X = y si y solo si, para todos los objetos z , z X si y solo si z y .

Los axiomas de igualdad en el apéndice sirven más como una "lista de verificación" de lo que queremos que satisfaga la igualdad de conjuntos; como se explica en esta respuesta a otra pregunta sobre la definición de igualdad de Tao,

[...] la teoría de conjuntos, estos "axiomas" no son la definición de igualdad. Más bien, la igualdad se define a través de la fórmula anterior: dos conjuntos son iguales cuando se componen de elementos idénticos. Pero cuando definimos la igualdad de esta manera, surge una pregunta natural: ¿por qué estamos nombrando esto como "igualdad" en absoluto? Por eso probamos "axiomas de igualdad", a los que ya estamos acostumbrados, para mostrar que la denominación "igualdad" es adecuada. Y cuando los demostramos, se convierten en teoremas de teoría de conjuntos y propiedades de igualdad en lugar de axiomas. [...]

Nota. Si bien no hay en este punto ninguna suposición acerca de la = relación para objetos de otros tipos, parece confiar en que existe para su declaración del axioma de emparejamiento en la página 36:

[...] si a y b son objetos, entonces existe un conjunto { a , b } cuyos únicos elementos son a y b ; es decir, para cada objeto y , tenemos y { a , b } si y solo si y = a o y = b [...]

Además, aunque nunca lo dice explícitamente, creo que probablemente asume el axioma de extensionalidad para FOL sin igualdad :

  • Para todos los objetos X y y , si X = y , entonces para todos los conjuntos z , X z si y solo si y z .
Según la discusión en su publicación anterior , parece que Tao asume tres objetos primitivos : números naturales , conjuntos y funciones. Aparentemente, confía en FOL sin igualdad y, por lo tanto, da definiciones de igualdad para objetos primitivos ... excepto números.
@MauroALLEGRANZA Buen punto sobre los números naturales: supongo que para el predicado de igualdad de los números naturales, simplemente asume sin declararlos los axiomas de reflexividad, simetría y transitividad, así como el axioma de sustitución para la función sucesora S : si a y b son números naturales y a = b , entonces S ( a ) = S ( b ) .
Estoy de acuerdo contigo... Pero si los axiomas de igualdad no son parte de la "lógica subyacente", tenemos que probar también, por ejemplo a = b a + norte = b + norte etcétera.
@MauroALLEGRANZA Eso es cierto; en su desarrollo de la adición, se siguen los axiomas de sustitución de la adición si asumimos los axiomas de sustitución de la función sucesora, porque define la adición en términos de la función sucesora.

Respuestas (3)

Una buena observación, pero tenga en cuenta que el = predicado no fue axiomatizado previamente. De hecho, Tao dice explícitamente: "cómo se define la igualdad depende de la clase T de objetos bajo consideración". Los axiomas enumerados en esa sección describen el comportamiento de todos = predicados, pero ciertamente no definen ninguno de ellos! Es análogo al axioma "todos los divisores positivos de pag son ambos 1 o pag "; esto describe correctamente todos los números primos, pero no define un número primo en particular.

Pero seguramente OP tiene razón en que si "=" es una de las relaciones en la teoría, no puede definir esa relación posteriormente, debe tener axiomas que afirmen la equivalencia de fórmulas que contienen "=" y fórmulas que involucran los objetos que necesita para ser iguales.
@MartinRattigan En general, las "teorías" formales no admiten definiciones en absoluto; operan en un lenguaje fijo. Ciertamente, en una teoría formal necesitaríamos axiomas para esto, pero solo porque todas las definiciones requerirían axiomas. Dado que aparentemente estamos permitiendo definiciones, estamos trabajando en la metateoría, que permite convenciones de notación como usar el mismo predicado para varios significados diferentes que no se superponen (como tenemos aquí).
Interesante. Entiendo que las definiciones son parte de la metateoría, pero siempre he asumido que son "meras conveniencias tipográficas" (para citar a PM), introduciendo nuevos símbolos en el metalenguaje que se traducen directamente a cadenas en la teoría formal. No estoy seguro de cómo funcionaría la definición de símbolos antiguos que ya forman parte de la teoría formal. ¿Sería posible dar una referencia a algo que explique esto, por favor?
@MartinRattigan No estoy seguro de expresarme con claridad. " = " no es un símbolo "antiguo", porque los axiomas anteriores en realidad no lo introdujeron; proporcionaron una definición de lo que un = la relación puede ser . El = entre conjuntos es una instancia de una relación de ese tipo, de la misma manera que 47 es una instancia de un número primo; podemos definir fácilmente la noción de ser primo antes de definir el número 47 . El hecho de que el símbolo utilizado para la igualdad de conjuntos sea el mismo que el utilizado anteriormente es simplemente una conveniencia notacional, permitida por la flexibilidad del metalenguaje.
Un axioma no introduciría un símbolo, pero los axiomas en el apéndice usan = , que en un sistema formal significaría que es una letra predicada del sistema formal o que se ha definido previamente como un metasímbolo (por ejemplo, Def t = s para A 1 2 ( t , s ) o algo similar.) Al menos eso es lo que entiendo y eso es también lo que quise decir con un símbolo "antiguo". Dado el hecho de que la primera sección aparece en un apéndice, Tao puede estar simplemente describiendo una teoría con igualdad en lugar de pretender que las declaraciones etiquetadas como axiomas sean parte del desarrollo principal; observe que no están etiquetadas.
El desarrollo obviamente no es completamente formal en ningún caso.

Algunos axiomas son 'axiomas de definición'... son axiomas y definiciones al mismo tiempo. Entonces, cuando el libro define la igualdad de conjuntos, podríamos capturar eso usando un axioma de definición, como: para cualquier conjunto X y y :

X = y z ( z X z y )

El hecho de que se utilizó es a menudo indicativo de tales axiomas de definición.

También: el hecho de que = ya fue utilizado como símbolo lógico, teniendo las propiedades de reflexividad, simetría, transitividad e indiscernibilidad (lo que el libro llama el axioma de Sustitución) no significa que la igualdad de conjuntos tuviera que obedecer a esto: podríamos haber elegido un símbolo diferente específico para ' igualdad de conjuntos', y podríamos haberlo definido de tal manera que de hecho no tuviera todas estas propiedades, si hubiéramos querido. Observe, por ejemplo, cómo no usamos el = símbolo de 'cardinalidad-igualdad' o 'equinumerosidad'. Entonces, para evitar confusiones, tal vez deberíamos haber usado un símbolo especial para 'igualdad de conjuntos' también.

De hecho, decir que los conjuntos son iguales cuando tienen los mismos elementos es tener una visión "extensional" de los conjuntos, que es diferente de una visión "intensional", donde los conjuntos pueden tener los mismos elementos pero no ser el mismo conjunto. Por ejemplo, suponga que todas y sólo las personas cuyo color favorito es el verde son personas cuyo segundo nombre comienza con una 'J'. Luego, en la vista extensional, el conjunto de 'todas las personas cuyo color favorito es el verde' es igual al conjunto de 'todas las personas cuyo segundo nombre comienza con una 'J'. Pero en la vista intensional, los dos conjuntos tienen los mismos miembros, pero aún se consideran conjuntos diferentes. Así que podríamos haber definido conjuntos de esa manera, y en ese caso, el predicado 'tiene-los-mismos-miembros-que' definitivamente habría necesitado un símbolo diferente a = .

Si bien Tao sobrecarga el símbolo de igualdad aquí para significar ambiguamente la igualdad lógica o la igualdad de conjuntos (en el tipo de conjuntos), no los equipara. Hacer eso ciertamente requeriría un axioma. En cambio, lo que afirma es que si articulamos cuidadosamente todo en términos de la relación de pertenencia , entonces sería admisible agregar un axioma que identifique la igualdad lógica en conjuntos con la definición que proporcionó. Para decirlo de otra manera, si estaba tomando la fusión como un axioma, la calificación en la oración "Por esto, cualquier operación nueva que definamos sobre conjuntos también obedecerá al axioma de sustitución, siempre que podamos definir esa operación puramente en términos de la relación ." habría sido innecesario. En cambio, si el enunciado fuera un axioma, sería inconsistente tener una operación que no obedeciera al axioma de sustitución. El uso de Tao del mismo símbolo para la igualdad lógica (en conjuntos) y la igualdad de conjuntos es aunque solo justificable, si garantiza que cada definición satisface todas las instancias expresables del axioma de sustitución con respecto a la igualdad de conjuntos.Este es un ejercicio metalógico.

Si bien estoy bastante seguro de que no es importante para los propósitos de Tao, existen diferencias entre afirmar axiomáticamente que estas igualdades coinciden y no afirmar eso incluso en el caso en que el axioma sea admisible. Originalmente iba a hablar de esto como un aparte, pero con su actualización de la pregunta es más directamente relevante. Tao está trabajando en una lógica de primer orden con igualdad (al menos con el propósito de hablar sobre los "axiomas de igualdad"). El hecho de que nuestra lógica tenga igualdad no significa que no podamos tomar la segunda opción en el enlace que proporcionóy defina una relación de equivalencia que represente la igualdad de conjuntos, aunque definitivamente debería usar un símbolo diferente en ese caso. Esto es lo que Tao está haciendo. Por un abuso de notación, está usando el mismo símbolo. Esto se justifica al ser admisible la primera opción en ese vínculo, identificar la igualdad lógica y la igualdad teórica del conjunto definido.

Entonces, ¿cuál es la diferencia? Con una noción lógica de igualdad, la semántica de la igualdad es la igualdad de las interpretaciones . El axioma de sustitución no es un teorema que pueda probar (o incluso establecer) en lógica de primer orden sobre cualquier relación. En este sentido, la igualdad lógica está a la par con otros conectivos lógicos al hablar de una operación sobre interpretaciones. Para una noción definida de "igualdad", simplemente está introduciendo un nuevo símbolo de relación y probando algunas propiedades al respecto. Para el axioma de sustitución, debe probar metalógicamente que se cumple para todos los predicados/operaciones que puede escribir .

Sin embargo, esto simplemente dice que no puedes escribir nada que distinga objetos relacionados por esta relación de equivalencia; todavía podría haber cosas que pueden distinguir esos objetos. Semánticamente, esto significa que la interpretación de esta "igualdad" definida es una relación de equivalencia que es respetada por todos los predicados y operaciones definidos, pero podría haber otras funciones en la interpretación que no respeten esa relación de equivalencia. Por ejemplo, podría interpretar "conjuntos" como pares de conjuntos y pertenencia como pertenencia sólo al primer componente del par. Entonces, la condición para la sustitución sería, a nivel semántico, similar a la siguiente para los predicados (que se interpretan como subconjuntos): ( X , y ) PAG z . ( X , z ) PAG . La identificación de la igualdad lógica con la "igualdad" definida sería admisible para la definición de conjunto "igualdad" Tao siempre que hubiera una interpretación que hiciera verdadera la condición anterior (y una similar para las operaciones). Que tal interpretación exista depende de los predicados, operaciones y axiomas que afirmamos. Por supuesto, existen subconjuntos que no satisfacen lo anterior, por lo que si afirmamos el axioma que identifica las dos formas de igualdad, lo anterior ya no sería una interpretación válida.

En última instancia, en una teoría fija donde afirmar axiomáticamente que una relación de equivalencia dada coincide con la igualdad lógica es admisible, no podemos decir la diferencia entre si esa relación de equivalencia esigualdad lógica o no a nivel de lógica/sintaxis. Supongo que a Tao no le preocupan las interpretaciones de la teoría que está construyendo, y dice que mantendrá esta propiedad de admisibilidad a medida que amplía la teoría. En la medida en que desee una fórmula explícita para la igualdad, el trabajo es el mismo de cualquier manera. O tiene el axioma y debe verificar que la lógica sea (relativamente) consistente, o debe verificar la admisibilidad del axioma que verifica que sería consistente agregar el axioma. La única diferencia entre él trabajando en FOL con o sin igualdad es que en el último caso está obligado a proporcionar una definición explícita de "igualdad" (si la usa). Definir explícitamente una noción de igualdad y mostrar que es admisible que sea laLa noción (lógica) de igualdad para una clase como la que hace Tao es una buena medida de higiene lógica que recomiendo.

La segunda parte del axioma de sustitución que se muestra cuantifica sobre la propiedad P. ¿Puede seguir siendo una lógica de primer orden?
@MartinRattigan Como se formula en el extracto de Tao, no es una fórmula en lógica de primer orden, por lo que no es demostrable. No puedes probarlo si ni siquiera puedes decirlo. Es por eso que sabemos que Tao está trabajando en una lógica de orden superior o tomando la igualdad general como una noción lógica. En el último caso, el axioma de sustitución es parte de la definición de lo que es una interpretación, es decir, una interpretación lleva la igualdad lógica a una relación de equivalencia (teórica de conjuntos) que satisface el axioma de sustitución, que ahora es una fórmula FOL en ZF, por ejemplo, sobre subconjuntos. y establecer funciones.
@DerekElkins Inicialmente estaba haciendo esto como una pregunta separada, pero lo haré aquí como un comentario: ¿qué significa, o al menos, en este caso, qué quiere decir, cuando dice esa adición de un axioma es "admisible" o "consistente"? El enlace que incluyó a la página de Wikipedia sobre admisibilidad lo analiza en el contexto de las reglas, no de los axiomas. Según tengo entendido, lo que prueba Tao es que su axioma para la igualdad de conjuntos implica los axiomas existentes de igualdad para el tipo de conjuntos, ¿es correcto?
@justin Un axioma es un caso especial de una regla en general, en particular, un axioma es una regla sin premisas. Sin embargo, a menudo puede internalizar la relación de implicación con la implicación, por lo que las reglas a menudo se pueden presentar como axiomas. De hecho, en una presentación al estilo de Hilbert, la única "regla" es modus ponens y lo que son reglas en, digamos, la deducción natural, se convierten en axiomas. A menos que esté haciendo una distinción técnica, realmente no diferencio entre reglas y axiomas. En este caso, el "axioma" se puede presentar como X , y . X y X = y (llame a esto A) o como regla ...
... Γ , X , y X y Γ , X , y X = y . En el nivel más básico, solo me refiero a la noción de consistencia relativa . La admisibilidad ciertamente implica una consistencia relativa. Llame al sistema de Tao T, entonces T+A es consistente si T lo es. Verificar el "Axioma de sustitución" en todas las instancias expresables es la parte principal de una prueba sintáctica de esto. Semánticamente, está claro que Tao pretende que T sea compatible con una teoría de conjuntos como ZFC y que un modelo de ZFC "trivialmente" daría lugar...
... a un modelo de T, pero en realidad sería un modelo de T+A. Voy más allá en la respuesta y sugiero que T+ ¬ A es probablemente también relativamente consistente, es decir, que A es independiente de T. Tao afirma que demostrará que se cumple cada instancia expresable del "Axioma de Sustitución". Por ejemplo, cuando dice " X A y A B implica X B ", esta es una instancia del "Axioma de sustitución", es decir, cuando PAG ( y ) = X y . Pero hacer esto para cada predicado que podamos escribir no es lo mismo que...
... probando que se cumple para cada predicado, de la misma manera que probando metalógicamente que puedes probar q ( norte ) por cada numeral norte no es lo mismo que demostrar norte . q ( norte ) . Por eso la noción de ω -Se necesita coherencia . Una regla admisible pero no derivable se encuentra en una situación similar: podemos derivar cada instancia de sustitución de ella, pero no hay una derivación uniforme para cada instancia, que es lo que proporciona la regla admisible. Esto es lo que me llevó a pensar en la noción de admisibilidad. Tao proporcionará un...
... derivación ad-hoc del "Axioma de Sustitución" para cada instancia del mismo, pero identificando y = proporcionaría una derivación uniforme para todas las instancias (incluidas las inexpresables, pero eso solo importa semánticamente, no sintácticamente). Como dije en un comentario a su pregunta, ciertamente estoy extendiendo demasiado la noción de admisibilidad descrita por Wikipedia.
@justin Estoy viendo la Teoría de prueba estructural de Negri y von Plato en este momento, que es definitivamente el ángulo en el que vengo las cosas. La admisibilidad se define en la primera oración de la sección 1.4 como: "Dado un sistema de reglas G , decimos que una regla con premisas S 1 , , S norte y conclusión S es admisible en G si, siempre que una instancia de S 1 , , S norte es derivable en G , la instancia correspondiente de S es derivable en G ". Esta era mi intención. Requiere una presentación basada en reglas (que prefiero).