¿Cómo se seleccionan las teorías?

Mis motivaciones para hacer esta pregunta son filosóficas, pero creo que esta es una pregunta que es mejor respondida por la comunidad física.

Hay un problema en la filosofía de la ciencia llamado el problema de la 'subdeterminación'. Hay dos versiones.

  1. Una es la idea de que, para cualquier conjunto de datos, la elección de la teoría está subdeterminada. Podría haber múltiples teorías que expliquen los datos de la misma manera y aún no tenemos la capacidad o los datos necesarios para elegir entre ellas sobre bases completamente empíricas.

  2. Esta es la idea de que dos teorías podrían predecir exactamente lo mismo en todas las situaciones pero usar diferentes entidades no observables para explicarlo.

Hasta donde yo sé (al menos al principio del proceso), la interpretación lorentziana de la RS frente a la interpretación de Einstein de la RS podría compararse de esta manera. Ambos hicieron predicciones similares o iguales, pero muchos favorecieron a SR en términos de su simplicidad, al no tener que postular la existencia de un éter no observable. (Obviamente, más tarde se evaluaron las diferencias empíricas y la teoría del éter tuvo que modificarse para dar cuenta de sus predicciones fallidas y poco a poco perdió favor, pero estas consideraciones empíricas no son realmente el objetivo de esta publicación).

Hay tres preguntas principales de esto:

  1. ¿Cuáles son los criterios principales a los que se aproximan los físicos cuando deciden entre dos teorías que hacen las mismas predicciones o sobre las que aún no se han decidido experimentalmente?

  2. ¿Es incluso posible construir teorías empíricamente idénticas que postulan diferentes entidades no observables para explicar los fenómenos? ¿Hay alguna razón para creer que esto es imposible?

  3. En la práctica, ¿sucede esto alguna vez?

PD: Parece que el conflicto entre las interpretaciones de Lorentz y Einstein (al menos al principio) fue un ejemplo de esto, pero es posible que tenga algunos detalles sobre la historia de estas ideas equivocados. Hasta donde yo sé, la interpretación lorentziana pudo modificarse para ajustarse a las fallas experimentales, pero luego fue rechazada con el argumento de que era mucho más compleja (¿supongo que esto significa que requería muchas suposiciones adicionales?) y, por lo tanto, fue rechazada por el comunidad en general.

Sin embargo, parece que ambas interpretaciones postulan algo inobservable. En el caso de Lorentziano, parece como si él directamente supusiera la existencia de un éter. En el caso de Einstein, hay una deformación no observable del espacio-tiempo. Digo que esta deformación no es observable porque solo puedes observar sus efectos , aunque esto también puede estar mal. Entonces, si alguien quiere aclarar cualquier malentendido que tenga sobre las diferencias importantes entre el éter y la idea de Einstein de la deformación del espacio-tiempo, por favor hágalo. Del mismo modo, si me equivoco al decir que solo se pueden observar los efectos de la deformación del espacio-tiempo, corríjame. Aunque, en este momento, no sé qué significaría observar directamente la deformación del espacio-tiempo ya que el espacio-tiempo es el lienzo sobre el que hacemos las observaciones.

La etiqueta 'ciencia popular' está aquí porque no he estudiado mucho en física teórica. Acabo de terminar la física de nivel A (en algún punto entre la escuela secundaria y la universidad según los estándares de EE. UU.) y deseo estudiar física teórica en la universidad, por lo que encuentro el problema tan interesante y utilicé el argumento de Einstein vs Lorentzian como ejemplo para esto. pregunta porque durante mi estudio hice un informe sobre este argumento y sobre derivaciones simples de transformaciones de Lorentz, etc., así que es un argumento con el que estoy más familiarizado que otros.

Supongo que habría habido un debate similar durante el desarrollo original de la teoría cinética, ya que los teóricos cinéticos postularon la existencia de átomos que eran inobservables en ese momento para explicar ciertos fenómenos que podrían haberse explicado con algún otro tipo de inobservable (tal vez, yo no sé)?

¿Qué es una "deformación del espacio-tiempo"?
@WillO Sí, tal vez debería haber sido más claro. Me refiero a la dilatación del tiempo y la contracción de la longitud en SR.
Al principio, la antera era un medio en el que oscilaban ondas electromagnéticas. Esto no fue respaldado por la observación hasta que Lorentz usó sus ecuaciones. Luego, Einstein se dio cuenta de que con las ecuaciones de Lorentz, la existencia de la antera se volvió discutible y no supuso ninguna diferencia, por lo que era más sencillo descartarla. Y luego, en la relatividad general, el espacio-tiempo se curvó. Bueno, filosóficamente (lo que muchos matemáticos que pretenden ser físicos no entienden), un "lugar" vacío no puede ser "curvo". La curvatura es una propiedad que llena este "lugar". Y así la antera está de vuelta en una forma de tensor métrico.
Creo que tu Einstein vs Lorentz es un buen ejemplo. Por poco que valga, siempre he pensado que los físicos clasifican las teorías por (1) la escasez de hipótesis ad hoc, (2) la capacidad de hacer predicciones sorprendentes (3) la belleza, generalmente matemática. Ernest Rutherford (quizás no un profundo filósofo de la ciencia) dijo (o eso decía en la guarda de mi antiguo libro de texto de electricidad A-Level) "Estas cosas fundamentales tienen que ser simples".
Los científicos eligen enfoques que están aprobados y financiados por el establecimiento. De lo contrario, no serían financiados ni publicados.
@safesphere Gracias por su respuesta sobre la naturaleza de ese debate en particular. Creo que este también es probablemente un caso en el que solo necesito aprender más sobre las teorías involucradas para tener una comprensión completa de las diferencias entre la interpretación de Lorentz y la de Einstein. Todo lo que realmente sé es que Lorentz trató de mantener un sentido absoluto del espacio-tiempo y que a Einstein no le importaba eso. Realmente no entiendo cómo el éter salva la idea de un espacio-tiempo absoluto. Pero como digo, tendré que familiarizarme con la teoría real.
@PhilipWood Hasta donde yo sé, ese tipo de idea de 'virtud epistémica' de cómo se seleccionan las teorías es bastante común entre los físicos y los filósofos de la ciencia, así que supongo que probablemente tengas razón. También escuché a muchos físicos hablar sobre la importancia de la simplicidad (pocas suposiciones/hipótesis y simplicidad computacional) y supongo que Rutherford es otro que se incluye en la lista.
Las ecuaciones de Lorentz hacen relativo el éter. Lorentz puede haber intentado salvar el éter, pero seguramente no como referencia absoluta. La relatividad especial usa las ecuaciones de Lorentz sin ningún cambio.
La física es una ciencia de cantidades observables. Si no hay observable, entonces no puede haber medición.
@PeterDiehr Lo es, pero también es la ciencia de postular cosas potencialmente no observables cuyos efectos se pueden medir. Aquí es donde se difumina la línea entre la construcción teórica y las entidades/procesos literalmente existentes. Muchos grandes físicos han sabido esto y esta pregunta es relevante para muchas áreas de la física (supongo que el ejemplo más notable es la teoría cuántica, ya que las diferentes interpretaciones de la teoría cuántica son empíricamente idénticas).
@PeterDiehr ¿Estás diciendo que no hay materia oscura ni energía oscura? Tampoco se ha observado más que el éter. Ambos son solo conceptos de "rescate" inventados para proporcionar un soporte vital para las teorías que no logran explicar las observaciones reales. Sin embargo, ambos están avalados y financiados por el establecimiento.
@safesphere La materia oscura al menos parece ser un poco más que un mero "concepto de rescate", la evidencia de que hay alguna forma de materia física en el cosmos de algún tipo que interactúa gravitacionalmente pero interactúa débilmente o no interactúa en absoluto por otros medios es bastante fuerte. "Materia oscura" es solo un nombre dado a esta observación. Hay algunas otras explicaciones con muchos seguidores que proponen cambiar la gravedad de varias maneras, pero la mayoría (no todas) fueron refutadas por LIGO. Además, ¿por qué sigue hablando de "el establecimiento"? La física en mi experiencia tiende a ser una de las ciencias más radicales.
@safesphere: los cosmólogos asumen la existencia de materia oscura y energía oscura debido a las observaciones de sus efectos. También los están buscando... es decir, asumen que son, de hecho, observables.
@user6873235 Debe seleccionar un nombre de usuario que se vea diferente de un millón de otros. De lo contrario, declaraciones como, "en mi experiencia", suenan realmente sin sentido. ¿En la experiencia de quién? ¿Hemos hablado antes o fue user6873234? no sabría Al menos deberías tener una personalidad virtual para entablar una conversación. Ahora, parece que te estás perdiendo el significado de mi comentario. Fue una respuesta a Peter Diehr (no al usuario 6873233) quien afirmó que la física se basaba en observaciones. Si es así, ¿qué pasa con las cosas que no observamos? ¿Deberían ser despedidos? Y si no, ¿por qué debería descartarse el éter?
@PeterDiehr Estos efectos tienen explicaciones alternativas al igual que los efectos de la contracción de la longitud y la dilatación del tiempo tenían una explicación diferente a las propiedades del éter no observado. Es gracioso que no veas la llamativa analogía. En lugar de insistir en la existencia del éter no observado para respaldar la teoría fallida, Einstein ha propuesto un enfoque mejor. Y ahora solo insistimos en la existencia de energía oscura y materia oscura no observadas para respaldar teorías obsoletas. Excelente.
@safesphere: Galileo, en sus "Dos nuevas ciencias" muestra cómo la lógica, junto con la observación, produce una teoría física. Como físico experimental en ejercicio, preparo experimentos para medir un efecto; últimamente son las correlaciones cuánticas, pero la mayor parte de mi trabajo ha sido con nanopartículas, haces de electrones, sensores o láseres ultrarrápidos. Nunca he usado la palabra "ontología" en ninguno de mis trabajos, prácticos o teóricos. No dije que existan la materia oscura y la energía oscura; Dije que están siendo buscados. Si no se encuentran, finalmente serán desechados, al igual que el éter y Aristóteles.
@PeterDiehr ¡Felicitaciones a usted, señor, por hacer avanzar la física! En estos días, muchas personas con títulos en física simplemente toman una forma fácil de programar computadoras. Estoy totalmente de acuerdo con tu comentario, aunque estas cosas a veces tardan siglos en solucionarse.

Respuestas (4)

Dirigirse,

¿Cuáles son los criterios principales a los que se aproximan los físicos cuando deciden entre dos teorías que hacen las mismas predicciones o sobre las que aún no se han decidido experimentalmente?

En primer lugar, se debe tener en cuenta que, sin evidencia experimental que favorezca a uno, la comunidad probablemente continuará desarrollando hasta cierto punto todas las teorías competidoras viables, naturalmente.

Si no hay apoyo experimental disponible, los teóricos confían en dos factores significativos:

  1. Atractivo estético: ¿La teoría requiere que las restricciones se impongan a mano o surgen de forma natural? ¿La teoría posee simetrías notables o propiedades matemáticas?
  2. Consistencia teórica: ¿Está la teoría de acuerdo con otras teorías establecidas, ya sea exactamente o en algún límite? ¿Es la teoría autoconsistente?

Este último es más fácil de demostrar cuantitativamente, mientras que el primero se basa en cierta medida en una visión subjetiva de la belleza o el atractivo matemático, aunque las restricciones establecidas ad hoc a mano, por ejemplo, serían una posible señal de alerta.

Un ejemplo de una 'teoría hermosa' es ciertamente la relatividad general, en el sentido provisto por el teorema de Lovelock: para d = 4 , hasta segundas derivadas en gramo m v , la elección L = | gramo | R es la única opción.

En cuanto a la consistencia, tome su amplitud de dispersión de nivel de árbol favorita de la electrodinámica cuántica y, en el límite clásico, debería corresponder a la sección transversal para el proceso evaluado utilizando la mecánica cuántica no relativista.

Eso tiene mucho sentido. Creo que es posible que 1. pueda llevarse a cabo evaluando el 'número' de suposiciones en las teorías. Parece ser que una teoría repleta de hipótesis ad hoc tendría muchos supuestos fundamentales. Este es probablemente el caso porque si algún (mal) físico teórico ha ideado una teoría y quiere desesperadamente salvarla de la refutación experimental, ¿tendría que agregar suposiciones para crear nuevas predicciones y mantener otras para que la teoría no cambiara por completo? ¿Estarías de acuerdo con esto?
Obviamente, no tengo experiencia en investigación de física teórica (en absoluto), pero por lo que entiendo, la base de la 'construcción de teorías' es hacer ciertas suposiciones físicas, comprender sus consecuencias y luego evaluar sus predicciones experimentalmente.

Las respuestas anteriores son bastante completas, por lo que solo agregaré un punto a modo de analogía que creo que da una idea de por qué los físicos (y los científicos en general) prefieren teorías más simples y tienden a estar más inclinados a creer que de alguna manera son fundamentalmente correctas si dan las predicciones correctas.

Es común en ciencia tener que realizar "ajuste de curvas", donde uno tiene muchos conjuntos de medidas (para dar un ejemplo concreto, digamos que tenemos 50 medidas de la fuerza entre dos partículas recién descubiertas y la distancia entre ellas), generalmente con algún ruido y error de medición, y debe determinar qué tan bien concuerdan con algún modelo. En nuestro ejemplo, podríamos tener un modelo de fuerza donde F ( r ) = a r 2 . Aquí tenemos un solo parámetro, a , por lo que tenemos que responder dos preguntas: ¿qué valor de a hace que el modelo se ajuste mejor a nuestros datos medidos y, una vez que lo hemos encontrado, ¿qué tan bien se ajusta? Por lo general, no encajará perfectamente incluso si el modelo era correcto porque las medidas nunca son perfectas, pero generalmente, cuanto mejor sea el ajuste, más confianza podemos tener en el modelo. Podemos comparar dos modelos preguntando cuál se puede hacer para que se ajuste mejor a los datos.

Sin embargo, debemos tener cuidado con esta línea de razonamiento, debido a un fenómeno llamado "sobreajuste". Digamos que viene alguien más y afirma que la fuerza está descrita por un polinomio de grado 100, es decir F ( r ) = a 100 r 100 + a 99 r 99 + a 98 r 98 + . . . + a 2 r 2 + a 1 r 1 + a 0 r 0 . Resulta que, dado cualquier conjunto de norte pares de medidas, podemos ajustar perfectamente esos datos con un norte polinomio de grado 100, lo que significa que nuestro polinomio de grado 100 puede ajustarse perfectamente a nuestras 50 medidas.

Pero, obviamente, esto no significa que el modelo sea correcto, en el caso de nuestras dos nuevas partículas, porque siempre podríamos haber ajustado esos puntos de datos independientemente de la física subyacente. Esto se conoce como "sobreajuste". Esta es también la razón por la que la mayoría de los juicios sobre qué tan bien concuerda un modelo con los datos no solo tienen en cuenta qué tan cerca se ajusta, sino cuántos grados de libertad tuvo que manipular el modelo.

En general, cuando discutimos teorías físicas, es posible que no tengamos muchos parámetros numéricos fáciles de contar. Si una teoría u otra tiene mayores o menores parámetros metafóricos no es obvio, y dos teorías en las que una parece más complicada pueden resultar matemáticamente, o incluso conceptualmente, idénticas. Por lo tanto, los físicos se ven obligados a confiar en un sentido intuitivo de "elegancia", un presentimiento que dice que una teoría es "simple", "inevitable", que es correcta o incorrecta y que no puede modificarse fácilmente para adaptarse a observaciones que no están de acuerdo. levemente. Creo que Feynman una vez resumió el sentimiento cuando dijo algo como "No puedes ponerle imperfecciones a algo perfecto, tienes que crear algo nuevo y perfecto en su lugar". Quizás algún día descubramos cómo cuantificar esta idea, pero por ahora

Para responder más

¿Es incluso posible construir teorías empíricamente idénticas que postulan diferentes entidades no observables para explicar los fenómenos?

Otro ejemplo del problema de subdeterminación está en la interpretación de la mecánica cuántica. Aquí tiene varias teorías en competencia sobre cómo se comporta la naturaleza a pequeña escala, que supuestamente son consistentes con las predicciones de QM (al menos hasta ahora...). Estos incluyen las interpretaciones de muchos mundos, de onda piloto, transaccional y de Copenhague. Estas teorías ofrecen visiones dramáticamente diferentes del universo, pero por construcción tienen las mismas predicciones experimentales.

Entonces, ¿cómo se elige una interpretación? Como se mencionó anteriormente, el atractivo estético, la simplicidad, la consistencia y la utilidad de las predicciones suelen ser importantes. Pero dado que QM requiere una desviación tan grande de nuestra intuición cotidiana, creo que alguien también elegirá una interpretación que ofenda lo menos posible su sensibilidad. Por ejemplo, si realmente quiere determinismo pero no le importa la no localidad (es decir, la acción espeluznante a distancia), elija las ondas piloto de Bohm. Pero si prefiere salvar la localidad a expensas de una leve retrocausalidad, opte por la interpretación transaccional. Si no le gusta pensar en ello y prefiere seleccionar una teoría basada en la familiaridad y la ubicuidad, elija Copenhague.

Personalmente, me gusta cómo la interpretación transaccional te da la regla de probabilidad de Born "gratis", en el sentido de que no es necesaria como postulado (como lo es para cualquier otra interpretación); más bien, está "justificado". Esto realza la simplicidad de la interpretación transaccional y, en mi opinión, el atractivo estético.

En ese caso, creo que es ciertamente cierto que la simplicidad debe reinar por encima de todo. Y, como dijiste, tal vez la investigación filosófica de las suposiciones hechas por cada interpretación pueda descubrir inconsistencias internas con algunas. O al menos podemos tratar de descubrir qué interpretaciones hacen las suposiciones más 'plausibles'. Y supongo que estás tomando simplicidad = atractivo estético. Lo que la mayoría de la gente parece. De lo contrario, no creo que el atractivo estético sea un criterio racional con el que juzgar una teoría/interpretación. Creo que la gente debería tener más cuidado con el uso de la terminología de la estética.

Si desea una respuesta de 'cop out' a su número 2, siempre existe la 'oportunidad', que podría hacer que sus observaciones empíricas 'se vean similares' entre sí. Por supuesto, las mediciones repetidas harían que esto fuera menos probable en cada medición. ¡Pero significa que es posible! (¡lo que significa que no hay razón para creer que es imposible!).

En segundo lugar, adoptar un enfoque un poco filosófico / irónico para esto. Lo que estás preguntando es en cierto modo pedir un límite a nuestra 'imaginación', ya que no estarías de acuerdo en que esto es lo que se usa cuando se encuentran 'las posibles razones de lo inobservable'.

Tampoco me resulta demasiado difícil creer que haya 2 interpretaciones igualmente defectuosas que coincidan entre sí (en sus efectos de observación).

he aquí, ¡algunos ejemplos de malas 'interpretaciones' de la gravedad!

  1. la gravedad es una pequeña partícula que cuando choca con objetos, no disminuye la velocidad (pasa a través del objeto) y deposita 'energía cinética negativa' (¿por alguna razón?, se requiere más elaboración de teorías).

  2. La gravedad es un gráfico completamente conectado de bandas elásticas invisibles, intocables e irrompibles, con su estado 'relajado' en el 'punto de origen del universo' (donde ocurrió el Big Bang: p), ¡todo está conectado ! (¡Incluso fotones, ya que podemos ver la gravedad desviando la luz!). Además... las bandas se vuelven más débiles cuanto más se estiran... ¿incluso hasta el punto de alejarse después de cierta longitud?

^ esas son teorías bastante malas, pero... puedes imaginar que producirían 'resultados observables similares' (al menos... hasta cierto punto, y las grietas comienzan a mostrarse... supongo... o tal vez la teoría de las bandas de goma remendadas es la forma en que funciona: p).


Al final, supongo que solo podemos aplicar el occam's razorprincipio como una medida vaga de credibilidad para una teoría/idea.

Sí, creo que tienes razón en que se puede proponer cualquier número de teorías para explicar/describir algunos fenómenos. Sin embargo, algo que me pregunto es si realmente se pueden tener dos conjuntos de predicciones empíricas idénticas (consecuencias lógicas de algunas suposiciones) a partir de diferentes conjuntos de suposiciones. Si cualquier 'conjunto' de consecuencias tiene o no un número mínimo de suposiciones que condujeron a él. Parece al menos intuitivo pensar que, por ejemplo, si necesita un conjunto de 3 suposiciones que implican un conjunto de consecuencias, ¿no hay otro conjunto de 3 que no pueda implicar esas mismas consecuencias?
@ JoeLee-Doktor Uno de los mejores ejemplos de esta situación es en realidad la base de la relatividad general. La suposición "Estoy en un campo gravitatorio" y la suposición "Estoy en un marco de referencia acelerado" hacen predicciones idénticas.
@probably_someone Sin embargo, parece que esas suposiciones son trivialmente diferentes. Por ejemplo, hacen las mismas predicciones, pero no es porque el 'campo gravitacional' es solo la etiqueta para el marco de referencia acelerado al que nos referimos. O, mejor aún, los 'campos gravitatorios' son un subconjunto de marcos de referencia acelerados. Entonces, ¿la suposición de que "estoy en un campo gravitatorio" implica el hecho de que "estoy en un marco de referencia acelerado"?
@probably_someone También la suposición de que el espacio está doblado o curvado
@probably_someone Wow, Joe Lee-Doktor te ganó en esto;) Tus dos suposiciones no son dos teorías diferentes para comparar como se menciona en la pregunta, sino que representan una y la misma teoría de la relatividad general.
@GoodQuestions Parece que estás confundido sobre qué es una teoría física. No es una ensalada de palabras como en sus ejemplos, sino un modelo predictivo matemático que coincide muy bien con las mediciones observacionales. Por ejemplo, QED compara los datos experimentales con más de una parte en un billón. Para comparar dos teorías, debe tener dos modelos matemáticos diferentes que predigan las mismas medidas experimentales. Un ejemplo es la gravedad newtoniana y la relatividad general que predicen resultados muy cercanos para campos gravitatorios débiles.
Tu respuesta mala número uno anterior muestra más promesa que una bola de boliche en una analogía de trampolín