MAC0351  Algoritmos em Bioinformática

Por | Em

OBJETIVOS:  O dia a dia do bioinformata na genômica envolve o uso de uma grande gama de diferentes softwares para tarefas como busca em banco de dados, alinhamento de sequências, caracterização de famílias de proteínas, busca estrutural de RNAs, predição de estrutura secundária de RNA, alinhamentos múltiplos, construção de filogenia, e montagem de sequências. Nestes processos utilizam aplicativos como BLAST, SIM-4, Exonerate, HMMER, Infernal, CLUSTAL, T-COFEE entre outros. Uma compreensão dos algoritmos utilizados por estes aplicativos é essencial para entender os limites, as simplificações os pontos fortes das diversas abordagens. O objetivo desta disciplina é fornecer uma visão geral das principais técnicas e algoritmos utilizados para o estudo de genômica em Bionformática.

PROGRAMA:  Alinhamento de pares sequências Avaliação de alinhamentos (significado biológico dos alinhamentos, matrizes de substituição, e-values), Algoritmos de alinhamento (alinhamento local, global e semi-global, alinhamento com modelos mais complexos) Alinhamento de mRNAs contra sequências genômicas, Sim-4, Exonerate. Cadeias de Markov e Modelos ocultos de Markov Cadeias de Markov Modelos Ocultos de Markov (HMM) Estimação de Parâmetros para HMMs Modelos markovianos mais complexos, predição de genes Alinhamento local e global de pares de sequencia utilizando HMMs Profile-HMMs para caracterização de famílias de sequências. HMMER e PFAM Alinhamento de genomas, MUMMER; Alinhamentos múltiplos Programação dinâmica multidimensional Avaliação de alinhamentos múltiplos por soma de pares Métodos de alinhamento progressivo Alinhamento múltiplo com profile HMMs Uso de alinhamentos múltiplos para construir filogenias moleculares Análise de RNAs Predição de estrutura secundária Modelos de Covariâcia RFAM e Infernal HMMs sensíveis ao contexto Busca de motivos em sequências Gramáticas Hierarquia de Chomski Gramáticas Regulares e seu uso no PROSITE Gramáticas Livres de Contexto e caracterização de estruturas de RNA Gramáticas probabilísticas

RESPONSÁVEIS:  Alan Mitchell Durham, João Carlos Setubal.

PRÉ-REQUISITOS:  Não há.

CARGA HORÁRIA SEMANAL E NÚMERO DE CRÉDITOS:  4 horas, 4 créditos-aula.

CRITÉRIO DE AVALIAÇÃO DA APRENDIZAGEM:  Média ponderada de provas, exercícios e projetos.

BIBLIOGRAFIA BÁSICA: 

  • D. Mount, Bioinformatics, Second edition, Cold Spring Harbor, 2004.
  • N.C. Jones, P.A. Pevzner, An Introduction to Bioinformatics Algorithms, MIT Press, 2004.
  • R. Durbin, S. Eddy, A. Krogh, G. Mitchison, Biological Sequence Analysis: probabilistic models of proteins and nucleic acids, Cambridge Press, 1998.
  • W.-K. Sung,, Algorithms in Bionformatics: A practical introduction, CRC Press, 2009.
  • J. Setubal, J. Meidanis, Introduction to Computational Molecular Biology, PWS press, 1997.

OBSERVAÇÃO:  Disciplina optativa nos currículos do BCC.

 

[Veja dados da disciplina no JúpiterWeb]