Cómo iniciarse en la bioinformática [cerrado]

Soy estudiante de segundo año de ingeniería eléctrica y programador autodidacta. Siempre me ha interesado la biología, pero nunca me metí en ella (además de dos años de biología en la escuela secundaria y algo de bioquímica básica en la clase de química).

Estoy especialmente fascinado por la interacción entre la informática y la biología, tanto la informática utilizada para la biología como los conceptos informáticos inspirados en la biología. Piense en cosas como el proyecto del genoma humano, los algoritmos genéticos, el aprendizaje profundo, la predicción de la estructura de las proteínas, etc. Creo que muchas de estas cosas (la informática utilizada para la biología) son, hasta donde yo sé, parte de la bioinformática.

Hice desafíos con Rosalind y, aunque son agradables, se siente más como entrenar/reinventar la rueda. Aunque puede ser demasiado pedir, quiero hacer algo "real" que realmente pueda usarse. No es que quiera comenzar de inmediato sin aprender, pero no tengo una imagen en mente de lo que puedo hacer después de aprender algo de teoría.

Estoy buscando una descripción general del campo de la bioinformática y alguna guía sobre cómo comenzar. Algunos ejemplos de lo que puedo trabajar. Tal vez haya algún algoritmo de uso intensivo de energía para el que pueda comenzar a diseñar chips (ASIC) para acelerar el proceso. Este es solo un ejemplo.

Espero que me puedan ayudar, gracias de antemano.

¡Bienvenido a Bilogy.SE! No estoy seguro si está más interesado en Bioinformática , Biología Computacional o Computación Biológica . La distinción entre estos campos a veces no está clara y puede diferir dependiendo de a quién le pregunte, pero creo que vale la pena tomarse un tiempo para leer sus definiciones.
Un primer paso para la bioinformática o la biología computacional probablemente sea comprender los conceptos básicos de la biología molecular ( aquí hay un enlace de la academia khan que puede ayudar)
Gracias. :) Que yo sepa, la bioinformática y la biología computacional están muy cerca la una de la otra. La bioinformática se centra un poco más en la informática (teórica), mientras que la biología computacional se centra un poco más en las matemáticas. (Nuevamente, esta es mi idea al respecto). Para el cálculo biológico, veo una diferencia mayor, porque es al revés (computadoras que usan biología en lugar de biología que usa computadoras). Tengo algunos conocimientos básicos de biología molecular (o bioquímica, creo que es más o menos lo mismo). (continuar...)
Sé, por ejemplo, cómo se puede traducir una cadena de ADN en ARN en aminoácidos o identificar (algunas simples) mutaciones. Pero (por supuesto) realmente no sé cómo predeciría la estructura 3D de una proteína. Así que es un poco difícil para mí saber por dónde debo empezar. Si miro cómo me metí en la codificación, quería crear un sitio web, así que busqué un tutorial. Cuando quería algo nuevo, buscaba cómo hacerlo y lo aprendí en el camino. Para la bioinformática es más difícil para mí. Realmente no tengo un objetivo en mente como hacer ese sitio web, si entiendes lo que quiero decir. (continuar...)
Y eso es porque realmente no sé qué voy a hacer con él (conocimiento de bioinformática). De todos modos, realmente agradezco su ayuda.
Que bueno que tienes estas bases. Recomendaría reducir la publicación entonces. Por el momento, no creo que sea posible abordar completamente su pregunta, ya que es demasiado amplia. Como ejemplo, soy biólogo computacional (genetista computacional de poblaciones para ser más exactos; estudio varios procesos evolutivos usando simulaciones basadas en individuos y trato de desarrollar métodos estadísticos) pero no tengo idea de cómo predecir el plegamiento de una proteína.
Si puedo hacer la pregunta: ¿Por qué estás en ingeniería eléctrica si te interesa la bioinformática? No veo mucha conexión. Por supuesto que no hay vergüenza (en realidad es todo lo contrario) al trabajar en un tema diferente al que recibes a través de tu formación universitaria, pero solo tengo curiosidad.
Me interesan las computadoras y la electrónica, por eso lo elegí. Siento que la ingeniería eléctrica realmente te enseña cómo funcionan. Además, la biología (y la bioinformática) siempre me han interesado, por lo que algo que combine estos dos debería ser genial.
@ Remi.b También newscientist.com/article/… muestra un ejemplo agradable (y para mí realmente interesante).
Estoy votando para cerrar como demasiado amplio. Sin embargo, estoy de acuerdo, como @David dijo que si no puede reducir su interés, probablemente lo mejor para usted sea contactar a alguien en su propia universidad cuya investigación le interese.
Voy a votar para cerrar porque esto se basa en opiniones. Conozco bioinformáticos que comenzaron como físicos, bioquímicos, biólogos, científicos computacionales, matemáticos, médicos, etc. y trabajan en proyectos muy diferentes. No existe un "mejor" camino de una sola vía, o un nicho correcto al que ingresar. Solicite algunos proyectos/puestos/pasantías de bioinformática y vea si los obtiene. Buena suerte.
@ Remi.b Además, EEE tendrá muchos módulos de ingeniería de sistemas e incluirá módulos de programación adecuados (la mayoría de los cursos de bio tienen, en el mejor de los casos, un solo módulo en R o Perl que apenas le presenta la idea de una variable), y una tonelada de matemáticas Este título lo pondría en una buena posición para un proyecto de construcción de herramientas: ¡La biología que puede aprender más tarde!

Respuestas (4)

Mi consejo es que te pongas en contacto con biólogos de tu propia universidad.

Dices que quieres problemas reales, y lo aplaudo porque abordar problemas reales es la mejor manera de evitar perder el tiempo (que es un destino muy común en incursiones de este tipo). ¿Cómo hacer contacto? Presumiblemente, las redes sociales son el camino a seguir. A tu edad debes saber usarlo. Sin embargo, debe apuntar a los estudiantes de doctorado y al personal, no a los estudiantes universitarios.

Leer libros está muy bien, pero hasta que sepas cuál es el problema que estás abordando, no sabrás en qué concentrarte. Y la biología es demasiado amplia y desestructurada para dominarla mediante la lectura.

Prefiero recomendar contactar a un PI directamente que usar las redes sociales. Muchos IP están felices de contratar a un estudiante que muestre interés.
@Remi.b — Claro, lo que sea que funcione. ¿Sabría un estudiante a qué IP contactar? De todos modos, mi punto es que un joven estudiante experto en Internet debería usar ese conocimiento en su propio entorno para anunciar su disposición a involucrarse en un proyecto. Él debería saberlo mejor que yo.
Gracias por tu respuesta. ¿Creéis que es mejor contactar con alguien del departamento de bioinformática de mi universidad, o contactar directamente con biólogos?
@Kevin Definitivamente iría al departamento de bioinformática. Es de suponer que ya tienen proyectos con los biólogos, pero si les dices cuáles son tus habilidades, es posible que tengan algo que puedas hacer. Por lo menos pueden apartarte.

Encontrará varios tutoriales de bioinformática en: https://www.biostars.org/t/Tutorials/

Sin embargo, como biólogo computacional, recomendaría encarecidamente asistir a conferencias de biología y leer muchos libros de texto que cubran temas fuera de los temas favoritos de la bioinformática actual (la "Biología molecular de la célula" de Bruce Albert sería un buen comienzo):

Los aspectos técnicos son fáciles de resolver y aprender (y también de subcontratar). La parte difícil es encontrar problemas inteligentes y comprender cómo puede resolver algunas cosas más rápido que sus competidores al combinar la bioinformática con otros enfoques.

Por cierto: me gusta mucho su idea de abordar la bioinformática desde el lado del hardware (vea también hardware evolutivo ).

Sí, leí sobre hardware evolutivo, suena increíble. Desafortunadamente, tengo la sensación de que ya no se investiga mucho, por la razón que sea. (Tal vez una razón más para entrar en él.) Y gracias por su consejo, voy a buscar ese libro.

Además de lo que se sugirió en otras respuestas, también debe tratar de conocer el estado del arte en bioinformática , es decir, leer sobre lo que se hizo en los últimos años, tener un ojo abierto para nuevas publicaciones en el campo y dejarte inspirar por lo que otras personas están/han estado trabajando.

Esta publicación de Stephen Turner resume muy bien una serie de publicaciones/fuentes RSS, blogs, listas de correo, alertas por correo electrónico/suscripciones y cuentas de Twitter relacionadas con la bioinformática que debe asignar o consultar regularmente para mantenerse actualizado.

Yo mismo soy ingeniero informático y nunca tomé biología ni siquiera en mi escuela secundaria. ( Tal vez la gente aquí comenzaría a golpearme, pero confieso que solía odiar la biología en pedazos, tal vez bytes o megabytes )

En el otoño de 2013/14, fueron los mismos Pavel Pavenzer y Philip Compeau de Rosalind quienes me introdujeron en Bioinformática ( me inscribí en ese curso por casualidad ) y Bioinformática sonaba muy bien. En primer lugar, dado que la programación era genial, ya que todo lo que tenía que hacer era aplicar algoritmos de cadenas y, más tarde, me fascinó el hermoso diseño de Genome por Almighty Allah.

Bueno, aquí hay un resumen de mi experiencia para compartir con ustedes:

  • Compre un buen libro sobre genómica ( PS. Verma y VK Agarwal es bastante bueno, lo he encontrado lo suficientemente bueno )
  • Domina los algoritmos básicos de bioinformática (los que encontrarás en Rosalind)
  • Consulte sitios como TCGA, ICGC para obtener datos de expresión génica. Está en forma numérica y disfrutará aplicando algoritmos estadísticos como PCA, Regresión, etc.
  • Si está interesado en la clasificación de datos de secuencia, le sugiero que lea String Kernels de CS Leslie et al. ( Puedo proporcionarle su implementación usando SVM en C++ si lo desea )
  • La mayoría de los cursos de bioinformática te enseñan algoritmos de alineación de secuencias o HMM. Te harán perder el tiempo. No los tome demasiado en serio. Encontrará la razón para rechazar los HMM en el documento de String Kernel (los HMM usan un enfoque heurístico y son muy lentos e ineficientes en comparación con los SVM)
  • Todavía queda mucho trabajo por hacer sobre los datos epigenéticos. Con poco esfuerzo, puede contribuir a la comunidad publicando su investigación. Te recomiendo que revises ese aspecto también. Pero nuevamente, tome una cosa a la vez y comenzará desde Nature Scitable ( use solo este sitio web durante las primeras dos semanas; mantenga su mente clara y tome una tarea a la vez. He perdido mi tiempo siendo codicioso por ¡Aprendí demasiado hasta que llegué a Nature Scitable y hombre! Era exactamente lo que estaba buscando. )
Si bien la bioinformática actualmente es un poco pesada en problemas bastante estandarizados que involucran secuencias, también podría considerar temas como la visión por computadora (y hasta cierto punto la teoría del control), que actualmente se ven en muchas publicaciones líderes de biología computacional.