
Projeto de Formatura
Alunos» Andre de Melo Folli
» Bruno Henrique Yoshimura
» Gustavo Andrade Nery
Supervisor: Roberto Hirata
Curso: Bacharelado em Ciência da Computação
Tema: Adequabilidade do Kepler para pacotes de Bioinformática do R
Resumo
Na medida que o estudos na área de Biologia Molecular avaçam, surge a necessidade de novas ferramentas de análise. Esse contexto requer a interação entre pesquisadores da área de biologia com estudiosos da área de computação, a fim de desenvolver essas ferramentas em conjunto.
Uma nova e importante área de biologia que interage com a computação é a análise de microarray. Uma tecnologia capaz de medir a expressão de milhares genes simultaneamente. Esta área envolve a computação em diversas etapas: escaneamento e análise de lâminas de microarray, normalização de dados, análise exploratória e estatística.
Uma característica deste tipo de análise que é importante para o nosso estudo, é a sua heterogeneidade. Não existe uma única sequência de passos a serem seguidos em uma análise para todos os tipos de dados. Análises podem utilizar diferentes métodos estatísticos que devem ser escolhido antes do processo.
Isso abre a oportunidade para utilizarmos um sistemas de programação visual que facilitariam o processo e ofereceriam uma interface mais amigável para cientistas.
Iremos apresentar um estudo sobre a adequabilidade do software Kepler para integração com o R na execução do pacote de análise de microarray Maiges. Esse estudo está separado em duas partes, sendo a primeira um embasamento teórico necessário para o entendimento da segunda parte - um breve estudo de caso que complementa e justifica a parte teórica.
A primeira parte se inicia mostrando toda a complexidade para se obter dados de lâminas de microarray em diversos tipos de processo. Este passo envolve o escaneamento, reconhecimento de imagem, correção automatizada de problemas de leitura. Neste ponto fica clara a necessidade de um tratamento computacional.
Do mesmo modo, ilustramos a dificuldade encontrada pelos usuários na utilização dessas ferramentas computacionais. A partir disso, exibimos o conceito de programação visual e exploramos as facilidades e dificuldades que ela pode nos trazer.
Já a segunda parte apresentamos o pacote do R próprio para realizar análises de dados obtidos em microarray (Pacote Maiges) e mostramos como seria a execução dos primeiros passos de uma análise utilizando esse pacote. Fazemos isso com o intuito de exemplificar para o leitor as dificuldades encontradas pelos usuários do R.
Como solução, apresentamos uma ferramenta de programação visual (Kepler) que pode ser integrada ao R para tornar a sua execução mais simples para os usuários. Mostramos como poderia ser feita essa integração e terminamos com os problemas e facilidades encontrados com o Kepler.