Ensamble y Anotación de Genomas y Metagenomas
Datos generales
Código: ENSAMBLE
Duración: 40 horas
Nivel: intermedio
Idioma: español
Fecha: del 01 al 05 de agosto de 2022
Horario: lunes a jueves 9:00 -17:00, viernes 9:00-14:00 (hora del Centro de México)
Modalidad: en línea
¿Qué aprenderás?
Al final del curso los participantes:
- Tendrán conocimientos teóricos sobre las principales tecnologías de secuenciación de DNA.
- Adquirirán conocimientos teóricos y prácticos sobre:
- las metodologías para realizar análisis de calidad y de limpieza de lecturas de secuenciación (archivos fastq),
- el ensamble y anotación de genomas y metagenomas,
- análisis de clasificación taxonómica de lecturas y contigs (regiones genómicas ensambladas) de origen metagenómico (no se considera análisis de datos de 16S).
Pre-requisitos*
Requisitos de conocimientos previos
- Unix a nivel intermedio. Todas las demostraciones de software se harán en este sistema operativo.
Los participantes necesitan tener conocimientos de nivel intermedio en la línea de comandos de UNIX/Linux, entre los cuales se encuentran los comandos de manejo de archivos y directorios (rm, mkdir, cd, less, cut, sort,uniq, etc), formateo de datos (awk o perl command line, sed). - Estadística básica.
Se requieren conocimientos básicos de estadística (conceptos básicos: media, mediana, desviación estándar, distribuciones estadísticas, pruebas de hipótesis, logaritmos).
Requisitos técnicos
- El alumno deberá usar su computadora personal. Ésta deberá tener instalado MobaXterm (Windows), o alguna otra herramienta que nos permita realizar conexión SSH al servidor.
- Aplicación Zoom instalada en la computadora que será utilizada durante el curso. Se puede descargar de la página de descargas del cliente de reuniones Zoom (requisitos del sistema).
- Conexión a Internet
Descripción
El taller presenta las tecnologías de NGS y las metodologías para el ensamblado de genomas y metagenomas, de novo, así como su anotación. Así mismo, se abordará la clasificación taxonómica de lecturas y contigs de origen metagenómico (no se considera análisis de datos de 16S). Este curso está enfocado primordialmente en el manejo práctico de las herramientas computacionales y la correcta interpretación de los resultados.
Para alcanzar el objetivo del taller, se requiere que los participantes cuenten con los requisitos de conocimientos previos.
Contenido
El contenido del curso consiste en los siguientes temas:
- Unidad 1
- Bienvenida
- Conexión al servidor, creación de directorios, y archivos de trabajo.
- Unidad 2
- Análisis de Calidad: FastQC
- Limpieza de secuencias: Trimmomatic
- Limpieza de secuencias: Trim Galore
- Unidad 3
- Ensamble de genomas: Lecturas cortas (Velvet)
- Ensamble de genomas: Lecturas cortas (SPAdes)
- Ensamble de genomas: Lecturas largas (Canu)
- Ensamble de genomas: Lecturas largas y cortas (SPAdes)
- Unidad 4
- Comparación y validación de ensambles: QUAST
- Mapeo y visualización: Bowtie 2
- Mapeo y visualización: SAMtools y Artemis
- Unidad 5
- Anotación funcional: Glimmer3
- Anotación funcional: BLAST
- Anotación funcional: Prokka
- Unidad 6
- Ensamble de metagenomas: metaSPAdes
- Ensamble de metagenomas: MEGAHIT
- Ensamble de metagenomas: IDBA_UD
- Anotación de ensambles metagenómicos: Prokka
- Comparación de ensambles metagenómicos: QUAST
- Unidad 7
- Clasificación taxonómica: MetaPhlAn2
- Clasificación taxonómica: KRAKEN
- Clasificación taxonómica: Kaiju
- Comparación de clasificaciones taxonómicas
- Unidad 8
- Conclusiones y despedida
Software usado
- Velvet
- IDBA_UD
- Spades
- Megahit
- MUMMER
- BOWTIE
- Quast
- SMALT
- Artemis
- FastQC
- IGV
- AUGUSTUS
- Glimmer3
- Artemis
- Kraken2
- Metaphlan2
- Kaiju
- MaxBin
¿Quién es nuestra audiencia?
El curso va dirigido a estudiantes e investigadores en genómica, genética, bioinformática o ciencias computacionales, con especial interés en el manejo de datos genómicos y ensamblado de genomas, y/o que sus proyectos de investigación se vean beneficiados con este conocimiento.
Formato del curso: en línea
Este es un curso digital. Las sesiones y material del curso serán presentados en línea. Esta modalidad incluirá grabaciones de video o audio del material, intercambio de archivos y sesiones de discusión temáticos, ejercicios de auto-evaluación y acceso a los instructores para comentarios durante el curso.
Profesor
Dr. Luis Lozano
Centro de Ciencias Genómicas UNAM