Entonces, estoy sentado aquí, reescribiendo el resumen de un artículo que espero presentar en breve. El resumen que tenía era viejo y no muy bueno.
Sé de buena fuente que un resumen es una parte importante de un artículo, porque a menudo es lo que hace que el lector mire más de cerca el artículo.
Entonces, ¿cómo se escribe un buen resumen que hará que la gente lo mire más de cerca? ¿Cuáles son las cosas que se deben incluir y las que no se deben incluir? ¿Cuáles son los errores comunes, si los hay, a tener en cuenta?
A modo de ejemplo, aquí el resumen que estoy reescribiendo, en su forma actual. Esto es para un trabajo de estadística aplicada. Siéntete libre de criticar.
Describimos e implementamos un método para seleccionar un modelo bayesiano para una colección de secuencias de ADN. Este método supone que las secuencias de ADN se generan a partir de uno de una clase particular de modelos de distribución. Estos modelos capturan la estructura de correlación de largo alcance entre los sitios de las secuencias de ADN. Elegimos un modelo de la clase utilizando un algoritmo de búsqueda de recocido simulado con una función de puntuación basada en la distribución predictiva previa correspondiente al modelo. Aplicamos este método para modelar secuencias de señales de recombinación (RSS) humanas y de ratón. Usamos la distribución predictiva posterior correspondiente al modelo para predecir cuál de un grupo más grande de secuencias son RSS en el contexto de una configuración de validación cruzada.
ANEXO: Comente si existe un límite estándar de longitud de resúmenes en su campo, a menos que sea específico de una revista.
EDITAR: Aquí hay un segundo intento de resumen. Esto se basa en parte en la discusión en Cómo escribir un resumen , que es una buena discusión de los puntos principales en los que pensar. El adelanto de resultados al final es un poco poco ortodoxo, pero pretende ser un incentivo para que las personas busquen más en el documento. @F'x, ¿tiene algún comentario?
Dado un conjunto especializado de secuencias de ADN, es un
problema biológicamente interesante predecir qué miembros de un conjunto más grande de
secuencias de ADN pertenecen a ese conjunto. En este artículo consideramos los
ejemplos particulares de conjuntos de secuencias de señales de recombinación (RSS).Los problemas de este tipo se abordan comúnmente en la
literatura biológica. Sin embargo, abordamos este problema seleccionando un
modelo bayesiano para este conjunto especializado. Este es un enfoque que
rara vez se usa en este contexto, pero como mostramos, puede dar buenos resultados.Seleccionamos nuestro modelo de una clase particular de modelos de distribución. Estos modelos capturan la estructura de correlación de largo alcance entre los sitios de las secuencias. Elegimos un modelo de la clase mediante el uso de un algoritmo de búsqueda de recocido simulado con una función de puntuación basada en la distribución predictiva previa del modelo. Aplicamos este método para modelar secuencias de señales de recombinación
(RSS) humanas y de ratón. Usamos la distribución predictiva posterior del modelo para
predecir cuál de un grupo más grande de secuencias son RSS en el contexto
de una configuración de validación cruzada. Resumimos los resultados de la
predicción en forma de figura y tabla, mostrando buenos resultados. Estadística de ejemplo
: de 700 000 secuencias candidatas, de 30 a 50 son en realidad
RSS. El algoritmo los clasifica, en orden descendente, según la probabilidad
de que sean RSS. Clasifica casi todos los RSS (90\%+) entre los 100 primeros.
Una de las cosas que se pasa por alto demasiado es que un resumen es leído por una multitud más diversa de personas que el resto de su trabajo. Entonces, tienes tres objetivos diferentes:
Hoy en día, el número 3 no es una restricción: Google y otros motores de búsqueda permiten la búsqueda de texto completo. Por lo tanto, concéntrese en el n. ° 1 y el n. ° 2: sea conciso, claro como el cristal, atractivo .
Basta de generalidades. Me encanta criticar, así que lo intentaré: no estoy en su campo, lo que creo que me convierte en un buen lector de prueba para su resumen, pero también me dificulta sugerir cambios reales. De todos modos…
Creo que es decente: no es una catástrofe, pero está lejos de ser entusiasta. Mi comentario principal sería que carece de una declaración clara del problema más amplio que está tratando de abordar. Podrías empezar con eso, algo como:
En los últimos años se han producido grandes avances en el modelado estadístico de secuencias de ADN, en su mayoría basados en algoritmos genéticos. En este trabajo, exploramos la eficiencia de una ruta alternativa y más simple, y mostramos cómo elegir eficientemente dentro de una clase de modelos de distribución.
He completado con palabras clave semi-aleatorias/palabras de moda, solo para darle una idea de cómo lograrlo. La idea es poner sus hallazgos en perspectiva:
Luego recorta el resto del texto:
Mostramos un método para seleccionar un modelo bayesiano para una colección de secuencias de ADN, generadas a partir de una estructura de correlación de largo alcance de captura de modelo de distribución elegido específicamente. Elegimos el modelo en base a su distribución predictiva previa. Al aplicar este método para modelar secuencias de señales de recombinación (RSS) humanas y de ratón, predecimos cuáles de un grupo más grande de secuencias son RSS en el contexto de una configuración de validación cruzada.
(Espero no haber perdido o traicionado algo del significado, es difícil cuando no entiendes los puntos más finos del texto... ¡pero entiendes la idea de todos modos!)
Pedro Jansson
Faheem Mitha
JRN