Minería genómica Bacteriana

R

Datos generales

Duración: 40 horas
Nivel: intermedio
Idioma: español
Fecha: del 22 al 26 de enero de 2024
Horario: lunes a jueves 9:00 -17:00, viernes 9:00-14:00 (hora del Centro de México)
Modalidad: EN LÍNEA

A

¿Qué aprenderás?

En este taller se introducirá la línea de comandos, buenas prácticas de programación y un poco de R, se explicará cómo buscar ayuda buscando proveer de independencia a los asistentes, así como llevarlos rápidamente a entender la bioinformática en general.

Se aprenderá a identificar clústeres de genes de metabolismo especializado, dedicados a la síntesis de productos naturales por ejemplo colorantes y antibióticos. Se aprenderá a comparar la variación del metabolismo especializado con organismos del mismo linaje taxonómico. Se identificarán los principales recursos de metabolismo especializado.

@

Pre-requisitos*

Requisitos de conocimientos previos

    • Linux a nivel básico-intermedio. Todas las demostraciones de software se harán en este sistema operativo. Los participantes necesitan tener conocimientos de nivel básico en la línea de comandos de UNIX/Linux, entre los cuales se encuentran los comandos de manejo de archivos y directorios (rm, mkdir, cd, less, cut, sort,uniq, etc).
    • Los participantes que no sepan Unix se les recomienda previo al taller revisar el siguiente material: https://swcarpentry.github.io/shell-novice-es/

Requisitos técnicos

    • Los participantes requieren una laptop, Zoom y una buena conexión a internet.
    • No se requiere instalación de Software.

* Al inscribirte al taller está bajo tu responsabilidad contar con los conocimientos previos requeridos.

h

Descripción

En este taller se aprenderá a identificar clústeres de genes de metabolismo especializado en un linaje bacteriano. Para ello se hablará un poco sobre el pangenoma y se entenderán las diferencias entre genes conservados y genes variables. Para ello, se explorarán los ocho genomas de Streptococcus con los que originalmente Tettelin definió el pangenoma. Finalmente, se mostrarán los principales recursos y bases de datos de metabolismo especializado.

i

Contenido

El contenido del curso consiste en los siguientes temas:

UNIDAD 1 Genómica Comparada
1. Introducción a la genómica comparada ¿Qué es la genómica comparada?                                                                                        ¿Cómo obtener genomas de organismos similares a mi organismo de interés?
2. Anotación genómica ¿Cómo anoto características genéticas de mis genomas?
3. Identificación de familias conservadas en el Pangenoma ¿Cómo puedo obtener familias conservadas en un linaje genómico?
UNIDAD 2 Minería genómica
1. Introducción a la minería genómica ¿Qué es la minería genómica?
2. Identificación de clústeres biosintéticos de metabolismo especializado ¿Cómo puedo anotar un clúster biosintético?
¿Qué análisis puede realizar antiSMASH? ¿Qué formato de archivos acepta antiSMASH?
3. Explorar bases de datos de minería genómica ¿Dónde encuentro BGCs validados experimentalmente?
¿Dónde encuentro información de BGCs predichos?
4. Redes de similaridad de clústeres biosintéticos ¿Cómo puedo calcular la similitud entre BGCs?
5. Clusterización de BGCs homólogos en Familias de BGCs ¿Cómo identificar familias de clusters biosintéticos?                                                      ¿Cómo se pueden predecir metabolitos similares?
¿Cómo comparar la capacidad metabólica en bacterias de diferentes linajes?
6. Encontrando variación en vecindades genómicas ¿Cómo estudiar la variación en la vecindad genómica de un BGC de interés?
¿Cuáles son las familias génicas conservadas en un BGC?
7. Evolución para la minería genómica ¿Cómo puedo utilizar Evolución para identificar genes divergentes de familias conservadas siendo reclutados a metabolismos especializados?
UNIDAD 3 Analizando mis datos
1. ¿Cómo puedo planear y qué Software puedo utilizar para analizar mis datos? Día de preguntas y consulta de datos propios

     

    I

    Software usado

    No se requiere instalación porque todo será corrido en un servidor remoto. El software que se utilizará comprende Proka, antiSMASH, BigSCAPE, EvoMining y CORASON. Además de algunas librerías y herramientas de GitHub. https://czirion.github.io/pangenomics-workshop/setup.html

    l

    ¿Quién es nuestra audiencia?

    El curso va dirigido a estudiantes e investigadores en genómica, genética, bioinformática o ciencias computacionales, con especial interés en explorar el contenido variable de genomas bacterianos y/o que sus proyectos de investigación se vean beneficiados con este conocimiento.

    Formato del curso: en línea

    Este es un curso digital. Las sesiones y material del curso serán presentados en línea. Esta modalidad incluirá grabaciones de video o audio del material, intercambio de archivos y sesiones de discusión temáticos, ejercicios de auto-evaluación y acceso a los instructores para comentarios durante el curso.

    Profesora

    Dra. Nelly Sélem Mojica

    Centro de Ciencias Matemáticas UNAM