Base de conocimiento léxico/ontológico/semántico para la física

  1. ¿Existen bases de conocimiento léxico/semántico para la física que se puedan usar para el razonamiento automatizado y la IA (como Wordnet de Princeton y Conceptnet del MIT para el uso del sentido común en inglés)?

  2. Si no existen, ¿hay problemas específicos de física que se deban tener en cuenta al desarrollar dicha base de conocimientos? Por ejemplo, ¿puede desarrollarse utilizando cláusulas de relación semántica existentes en Conceptnet? Los consejos para revisar artículos, libros, etc. también serán buenos.

Entiendo que tal base de conocimientos no estará completa sin las matemáticas relacionadas con el léxico. Pero, al navegar por las preguntas y respuestas aquí, muchas de ellas no parecen involucrar matemáticas en absoluto (solo palabras puras en inglés). En cualquier caso, no debería ser imposible agregar las matemáticas una vez que haya un léxico/red semántica no matemática (y parece haber algunas iniciativas para incluir matemáticas en la web semántica, como OpenMath, Content-MathML, OMDoc, etc.)

PD: Esto no es una divagación chiflada. Soy estudiante de doctorado en física teórica de altas energías. Llegué a esta pregunta mientras pensaba en cuánto de la física actual se puede automatizar a través de la IA.

edición 1: algo relacionado: http://www.cs.utexas.edu/users/novak/physics.html

edición 2: creó un hilo de chat (actualización 2a: aparentemente, el hilo de chat se cerró)

edición 3: se incluyeron pocos recursos para las matemáticas incluidas en los datos de gráficos semánticos

edición 4: ontología astrofísica de Ed Shaya, que también incluye un poco de otras áreas de la física: http://www.astro.umd.edu/~eshaya/astro-onto/

Esta parece ser una pregunta sobre filosofía de la ciencia o sobre inteligencia artificial, más que sobre física.
¡La ciencia de la representación del conocimiento ciertamente no es filosófica! Mi pregunta podría pertenecer tanto a la IA como a la física. Por cierto, AI.SE está cerrado.
Me temo que no entiendo exactamente lo que está buscando: ¿Está buscando algo así como la base para un verificador de prueba automatizado como existen para ciertas matemáticas, pero para la física? ¿O desea una compilación de los términos que usan los físicos, donde difieren del uso común en inglés? ¿O una explicación formal (en EBNF o lo que sea) del "lenguaje físico"?
Lo que busco es un hipergráfico semántico de términos físicos y sus relaciones . He editado mi pregunta para agregar una aplicación básica.
Dudo que tal cosa exista o incluso pueda existir (en el sentido de tener éxito). La física es en gran medida una interacción de ideas humanas acopladas a datos experimentales. Las ideas en sí mismas carecen por completo de significado sin una comprensión profunda de cómo se relacionan con los datos. Entonces, a menos que un gráfico de conocimiento de la física sepa cómo construir un acelerador o cuál es un buen diseño para un experimento de Stern-Gerlach...
@CuriousOne No realmente. Si lee la mayoría de los artículos sobre cuerdas (incluso la fenomenología de cuerdas), se dará cuenta de que casi no hay nada que esté remotamente conectado a un experimento. Diablos, incluso una serie de artículos SUSY sin cadenas no necesitan una comprensión profunda de los experimentos; solo un conocimiento rudimentario, que se puede codificar fácilmente, es suficiente. Es un asunto diferente si estos deberían llamarse física, pero actualmente lo son (y resulta que estoy en uno de estos).
@crackjack: La teoría de cuerdas ni siquiera es física, todavía, y ningún físico serio pretende que lo sea. Son bellas matemáticas que buscan desesperadamente una aplicación. Como dije, la dificultad es que, a menos que uno pueda relacionar los símbolos con una medida, no tienen ningún significado.
@CuriousOne No quiero ser absorbido por la política/opinión. Hay muchos teóricos de SUSY (los no fenomenólogos) cuyo trabajo, estará de acuerdo, se enmarca dentro de la física y, sin embargo, no necesita una comprensión profunda de los experimentos. Incluso hay muchos artículos de teoría de la materia condensada (especialmente en el dominio topológico) que hacen lo mismo. De hecho, incluso lo que constituye un electrón (es a la vez un campo continuo con cierto lagrangiano y una partícula con ciertas propiedades discretas) es pura tautología sin ninguna verdad más profunda/superior.
@crackjack: No hay nada que discutir. Citaré simplemente la definición de ciencia, que resuelve este asunto instantáneamente.
@CuriousOne Estoy confundido. ¿Cuál es el desacuerdo aquí (además de la teoría de cuerdas, de la que optaré por no participar)? He citado ejemplos de CMT y teorías SUSY sin cuerdas que no necesitan una intuición profunda del mundo físico que no se puede codificar programáticamente. ¡Cualquier semántica/intuición del mundo físico necesaria en estos campos es mucho más fácil de codificar que escribir algoritmos de aprendizaje automático para detectar sentimientos o emociones humanas (un esfuerzo que está en marcha) a partir de tweets o comentarios de revisión escritos en lenguajes naturales!
No tengo tiempo para escribir esto como una respuesta adecuada, así que un comentario. Benjamin Kuipers estuvo activo durante mucho tiempo en el campo del razonamiento cualitativo. Sus obras abarcan desde mediados de la década de 1980 hasta principios de la década de 2000. Su artículo seminal Kuipers, B. (1984). Razonamiento de sentido común sobre la causalidad: derivar el comportamiento de la estructura. Artificial Intelligence , 24(1), 169-203 es un buen lugar para comenzar. Desde entonces, varios otros investigadores han asumido la causa.
Las salas de chat sin actividad se bloquean automáticamente y luego se eliminan después de un tiempo. No puedo recordar los umbrales en este momento.

Respuestas (3)

Soy el autor de la ontología de astronomía y física mencionada en la pregunta original. El propósito original de esa ontología era mejorar la búsqueda de datos y artículos en astronomía. La idea era tener tablas de conjuntos de datos y columnas individuales en tablas marcadas con palabras clave relevantes.

Las filas de datos en astronomía suelen ser diferentes objetos astronómicos de diferentes tipos. Entonces se podría hacer una búsqueda de un rango de valores en una propiedad para algún tipo de objeto y el retorno sería todos los datos relevantes en todos los archivos astronómicos.

Pero a medida que avanzábamos, pensamos en muchas más formas de utilizar dicha ontología. Un novato podría aprender rápidamente por sí mismo de la ontología todas las diferentes especies y subespecies astronómicas, sus propiedades y sus ejemplos más brillantes o cercanos. Uno podría pedir los artículos más recientes que traten específicamente sobre un tipo particular de observación de un tipo particular de objeto dentro de un rango de distancias o direcciones en el cielo.

Creo que la mayor parte de esto también puede trasladarse a la física. Uno podría solicitar experimentos o documentos específicos sobre un tema y luego, dependiendo de los resultados, solicitar resultados en términos más amplios o más específicos. Los novatos pueden aprender qué términos significan casi lo mismo y en qué se diferencian, si es que difieren.

Una cosa que analizamos es si un artículo largo y complejo puede reducirse a unas pocas declaraciones ontológicas simples. Ayuda que una máquina de razonamiento pueda decirle qué declaraciones son repeticiones de cosas ya conocidas y cuáles son nuevas. Luego, con entrenamiento, uno podría leer los resultados de una revista completa de Physics Review en unos pocos minutos. La lista sigue y sigue.

Sin embargo, los fondos necesarios para hacer esto son grandes y, en este momento, los únicos grupos que veo haciendo este tipo de cosas son Microsoft, Google y Apple, y todo eso está a puertas cerradas.

¡Gracias por responder a mi solicitud y compartir sus pensamientos aquí! ¿Podría también compartir sus pensamientos sobre (1) una iniciativa de este tipo entre la comunidad de física (como lo hicieron Freebase o OMCS/ConceptNet para la ontología de conocimiento general) (2) Incorporar la semántica del conocimiento matemático en la ontología (cf mi 9 de septiembre comentario a Ben, comenzando "También, eche un vistazo a las opciones de Content-MathML y ​​OpenMath...").
Además, ¿conoces otros proyectos que hayan construido (o construido) ontología en física? En cuanto a la financiación, podríamos explorar la creación de un consorcio de miembros de la comunidad de física creíble y bien representado en cuanto a temas, y buscar financiación colectiva del público (a través de KickStarter, Experiment/Microryza, etc.). El financiamiento podría ser suficiente para cubrir los costos del hardware y, si los medios lo recogen, puede captar la atención de posibles voluntarios (estudiantes, posdoctorados, etc.) de la comunidad.
No creo que el crowdsourcing funcione bien porque solo los físicos tienen el conocimiento del tema requerido y simplemente no hay suficientes. Sin embargo, creo que se podrían usar lectores automáticos. Hay programas que leen periódicos y recopilan información de inteligencia para los militares. A uno especializado en física tal vez se le podría enseñar a leer artículos de física y crear rápidamente una inmensa base de datos de conocimientos de física. Tal vez la financiación colectiva funcione para esto si nos alineamos con una pequeña rama de la física (como la cosmología) y los ingenieros semánticos apropiados.
La minería automática es una gran idea. Ahora que lo pienso, incluso Yago y v5 de ConceptNet usan aprendices de ontología automatizados como ReVerb para completar su base de conocimiento general. ¡Tal vez podamos hacer una pequeña demostración de prueba de concepto (para un campo limitado, como sugirió) y usarla para reunir un equipo más grande y buscar financiamiento inicial!
El procesamiento del discurso nltk también parece interesante.
Puede encontrar estos interesantes: busque tres artículos (1998, 2000, 2001) de Kocabas, S. y Langley, P. en Langley's Computational Scientific Discovery
También: Capítulo 2 de la tesis de maestría de Deyan Ginev para el estado actual del arte.

Soy el desarrollador de un proyecto llamado Physics Derivation Graph , véalo también en GitHub .

Mi intención es desarrollar un conjunto de derivaciones en un gráfico que capture el estado actual del conocimiento en Física. Aunque considero que el razonamiento automatizado está fuera del alcance de mi proyecto, le invitamos a mirar las bases de datos y pensar en lo que puede usar.

Estoy evitando intencionalmente la dependencia del inglés para construir el gráfico. El gráfico debe poder ser analizado por un sistema de álgebra computacional. Esto significa que podría estar disponible para sus intereses en el razonamiento automatizado si lo está abordando matemáticamente.

PD: yo también creo que no soy un chiflado ya que tengo un doctorado en física computacional


Editar 20150708: enlace al sitio y al código fuente en GitHub.

Dado que su sala de chat original parece haberse ido, avíseme si está interesado en crear una nueva sala. Me gustaría discutir.
¡Ese es un proyecto interesante! Sin duda, sería útil en el razonamiento automatizado. ¿Tiene un foro de discusión nativo del sitio de su proyecto? De esa manera, puede mantener juntas las conversaciones entre colaboradores.
Además, eche un vistazo a las opciones de Content-MathML y ​​OpenMath. LaTeX está bien desarrollado para la presentación, pero no está tan bien desarrollado para la creación de contenido semántico ( sTeX es una de esas raras extensiones, pero no está en desarrollo activo). NIST escribió una herramienta LaTeX-to-MathML para permitir el procesamiento web semántico (por ejemplo, mathwebsearch ) de su biblioteca digital de funciones matemáticas.
Consideré tanto Content MathML como OpenMath. Estoy de acuerdo con usted en que Latex tampoco está diseñado para contenido semántico, pero lo hace bien. Conozco los proyectos Latex-to-MathML; mi enfoque actual es representar un gráfico visual.
Escribí mis observaciones en este informe: github.com/allofphysicsgraph/proofofconcept/blob/gh-pages/doc/…

Usted puede encontrar este documento interesante:

Predicción de tendencias de investigación con redes semánticas y neuronales con una aplicación en física cuántica. Mario Krenn y Anton Zeilinger. arXiv:1906.06843 (2019).

En sus propias palabras,

Aquí demostramos un método para construir una red semántica a partir de literatura científica publicada, que llamamos SemNet

donde usan Wikipedia como fuente de conceptos que forman nodos en la red de conocimiento, y la literatura publicada como fuente de enlaces que vinculan esos nodos con la fuerza de esos bordes.

No sé qué tan útil terminará siendo esto, pero vale la pena echarle un vistazo si estás interesado en ese género.