¿Cuáles son las habilidades informáticas utilizadas (si las hay) en los programas de cosmología observacional o experimental de HEP?

Actualmente soy un estudiante de tercer año con especialización en física y matemáticas y probablemente solicitaré un experimento de alta energía o un programa de doctorado en cosmología observacional después de graduarme. He escuchado bastantes veces que muchas personas que estudiaron física y matemáticas en la licenciatura desearían haber estudiado más informática; especialmente si su investigación de posgrado está relacionada con experimentos de alta energía. Dado que las habilidades de informática se necesitan en todas partes, incluso si dejara la academia, estoy tratando de tomar algunos cursos de informática antes de graduarme.

Pregunta: ¿Cuánto análisis de datos y qué tipo de análisis realiza en los programas de cosmología experimental/observacional de alta energía?

En este momento planeo tomar algunos cursos sobre programación básica (estructuras de datos, etc.), un curso sobre análisis estadístico para ciencia de datos y un curso sobre aprendizaje automático.

Aprenda conceptos y prácticas de control de fuente, cómo desarrollar e interactuar con componentes centrales como bases de datos relacionales y noSQL, integración continua en la práctica, arquitecturas basadas en servicios, etc., aunque todo esto se puede hacer de manera efectiva fuera del aula. Si se presenta la oportunidad de tomar un curso de análisis numérico, probablemente valga la pena. Similar para algoritmos y estructuras de datos.

Respuestas (2)

Responderé desde la perspectiva de la cosmología, aunque probablemente mucho de esto también se aplique a hep-ex.

Debe aspirar a tener un buen conocimiento práctico de Python, ya que es la lingua franca en cosmología. Además, es útil estar familiarizado con Fortran o C, ya que algunos de los códigos de cosmología numérica más grandes, como CAMB y CLASS, están escritos en ellos.

Específicamente para la cosmología observacional, debe aprender a manejar grandes conjuntos de datos y archivos de imágenes, especialmente archivos FITS. Si va a utilizar bases de datos existentes de imágenes, espectros, etc., aprender SQL también será útil.

Finalmente, la gran mayoría del análisis estadístico en cosmología sigue un marco bayesiano en lugar de frecuentista, por lo que será útil comprender los conceptos básicos de eso, así como métodos como la inferencia de parámetros MCMC.

Los métodos de aprendizaje automático se están volviendo cada vez más populares, aunque hay poca experiencia real en el campo. Cualquier conocimiento y experiencia que tenga sobre el uso del aprendizaje automático, especialmente los métodos de clasificación y regresión, serán una bonificación.

Si yo fuera usted, echaría un vistazo a algunos artículos recientes en su campo de interés específico para tener una idea de los métodos de cálculo y análisis de datos específicos utilizados, ya que diferirá bastante de un proyecto a otro, incluso dentro de la cosmología. Puede encontrar documentos relevantes en la sección astro-ph.co de arXiv.

Gracias por la respuesta clara! Deduzco que C y python son muy importantes y los cursos de ciencia de datos que se ocupan del análisis bayesiano son una buena idea. Pero, ¿será útil un curso de aprendizaje automático? Me gustaría tomar si es posible sólo porque es interesante.
@Chandrahas sí, el aprendizaje automático sería una ventaja si pudieras tomar un buen curso al respecto. También olvidé mencionar que deberías aprender el control de versiones con git. Eso es bastante simple y probablemente puedas aprenderlo por tu cuenta en uno o dos días (lo básico, de todos modos).

Dependerá en gran medida de las tareas específicas en las que esté involucrado. En la mayoría de los laboratorios, habrá un gurú local que puede ayudarlo a comenzar si es amable con él. Y en la mayoría de los grandes proyectos habrá varios de esos gurús.

HEP experimental va a tener, naturalmente, un gran componente de hardware. Si puede reparar, diagnosticar, construir o instalar algún tipo de hardware electrónico o informático, entonces puede ir al laboratorio. Pero considere cuánto tiempo usará eso que podría haber usado haciendo su tesis. Si puede codificar los circuitos del controlador para el hardware, eso puede ser útil, con la misma advertencia. Y en todos esos casos, puede estar compitiendo con el personal técnico de laboratorio.

Pero una tesis doctoral en la que inventas algo nuevo que ayudó en un gran laboratorio probablemente tendría mucho atractivo.

Habrá toneladas de análisis numérico. Procesamiento de señales para comprender y "decodificar" la salida de un detector. Por ejemplo, algunos experimentos implican registrar un gran volumen de eventos candidatos y luego filtrarlos para encontrar la categoría específica de eventos que está buscando. Base de datos, filtrado de IA y simple procesamiento de números. Diga de un libro como Recetas Numéricas . Tenga en cuenta que hay versiones de este libro para varios lenguajes informáticos diferentes, incluidos C, C++, FORTRAN, tal vez otros. Y debe tratar este libro como una "primera introducción" a los temas que contiene, buscando métodos más avanzados y poderosos si comienza a trabajar en el campo. Pero le brinda muchas cosas en una forma en la que puede "subir la curva".

Otro tema completo son los métodos Monte Carlo. Este es un método para hacer experimentos numéricos para tratar de predecir la frecuencia de varios eventos arrojándole un montón de números aleatorios. Esto vendría a los datos del otro extremo al intentar predecir lo que vería el detector en el caso de un evento en particular. Tal vez pueda calcular la "huella digital" para un evento determinado. Busque este combo y sabrá que ha encontrado el escurridizo anti-schmadron.

Otra área es la visualización de datos. Cuando estás haciendo un gran conjunto de datos horrendo que sale de algún experimento, quieres alguna forma de presentar la información para que las personas puedan comprenderla. A menudo tú primero. (Sonrisa.) Tal vez quiera aprender aplicaciones que se ocupen de cosas como MATLAB y otras relacionadas. O tal vez quiera aprender a hacer visualización en 3D. Hay varias aplicaciones populares que se ocupan de eso, pero no he estado involucrado en ellas.

Si está diseñando un detector (o algún tipo de hardware), es posible que desee aprender el software CAD/CAM 3-D. Una vez más, hay varios populares, pero no los conozco.

"... si eres amable con él o ella"
"HEP experimental va a tener, naturalmente, un gran componente de hardware". Esto está mal. Muchos experimentadores de partículas trabajan exclusivamente en el análisis de datos.
El libro Recetas numéricas está obsoleto.
@AnonymousPhysicist Entonces, ¿los sentimentales no hacen hardware? DE ACUERDO.