Alunos:

- Fábio Yoshio Sato
- Emerson Takeshi Hassegawa
- Ricardo Issao Shimanuki

Supervisor do projeto:

- Eduardo Jordão Neves



Introdução

O R é um ambiente de análise estatística de código aberto que confere um grande poder de análise de dados genômicos. é nesse contexto que a iniciativa do BioConductor se insere, isto é, a organização de pacotes e iniciativas para a análise de dados de biotecnologia.

O maigesPack, assim como outros pacotes, implementou métodos computacionais para a análise de dados de microarray. Para tanto, o pacote maigesPack representa conceitualmente os dados de microarray, por estruturas de dados. Ele é constituído por um pacote base, chamado de maigesPack e possui como dependência outros pacotes contribuintes, sendo que tais dependências podem ser obtidas em dois repositórios: CRAN e Bioconductor.

O CRAN (Comprehensive R Archive Network) é uma rede de servidores web no mundo que armazenam versões atualizadas de códigos e documentação para R, e o Bioconductor é um projeto de desenvolvimento de software de código aberto para análise e compreensão de dados genômicos.

Assim, tem-se que os dados genômicos passam por um pré-processamento, onde estes são lidos e analisados e depois passam por uma normalização e por fim, passam por diferentes métodos de análise de dados de acordo com o problema.

A implementação de métodos/ferramentas para a análise de dados de microarray faz-se necessária uma vez que as plataformas de análise de dados de gênomica são, hoje em dia, de larga escala, isto é, em um mesmo experimento, milhares de genes são analisados simultaneamente. Logo, medidas de robustez e rastreamento da análise são cruciais para que se possa obter resultados relevantes.

Objetivo Anterior

O objetivo é refatorar o maigesPack, que é um ambiente de análise estatística, com as seguintes metas: redesenhar o processo de análise para que as dependências mostrem a realidade, melhorar a flexibilidade do sistema para que os usuários consigam ter maior domínio sobre o processo analítico realizado sobre os dados, aumentar a visibilidade para que o usuário consiga saber cada etapa do processo e entender a sua funcionalidade.

Para que isso seja realizado será necessário conhecermos a aplicação computacional dessa ferramenta na área biológica, estudar e conhecer as práticas de refatoração

Novo Objetivo

Não se difere muito da proposta anterior nos objetivos e sim no método. Depois de estudar o código do sistema, percebemos que ele já estava bem modularizado e não havia muitos espaços para mudança sem modificar o código dos métodos. Como para os usuários do sistema objetivos do projeto seriam de grande utilidade, procuramos outra maneira de realizá-los. Trabalharemos com as funções envolvidas na construção de redes de relevância,criando novos métodos que quebrem o processo antes feito por apenas um método, para dar mais flexibilidade e transparência ao processo.

Cronograma de atividades para o segundo semestre

Julho: Consolidar os conhecimentos do ambiente maigesPack, R, BioConductor e no universo de aplicação das análises.
Agosto: Começar o projeto das modificações a serem feitas no ambiente.
Setembro: Concluir o projeto e começar a implementação de um protótipo.
Outubro-Novembro: Terminar a implementação do protótipo e escrever a monografia.
Dezembro-Janeiro: Implementação da nova proposta de projeto baseado no aumento da visibilidade e usabilidade do pacote MaigesPack.

Estrutura da monografia:


  • Introdução

    Introdução de conceitos da área da Biologia para que o leitor consiga entender a importância do estudo. Exposição do nosso objetivo com esse trabalho.

  • Descrição do sistema antes do nosso trabalho

    Descreveremos o Sistema como ele é hoje, listando os problemas encontrados e o que será necessário alterar para se adequar as novas necessidades de uso.

  • Descrição do sistema depois do nosso trabalho

    Explicaremos as soluções encontradas, as tarefas executadas e como essas soluções agregaram funcionalidades ao projeto

  • O Projeto

    Descreveremos o projeto.

  • Implementação

    Apresentaremos como é a implementação atual das funcionalidades e a implementação nova. Apresentando as diferenças entre elas e mostrando os benefícios dos novos recursos. Além de expor o código fonte em R das funcionalidades com suas respectivas explicações.

  • Resultados

    Um resumo do que foi feito comparado com o que era desejado pelo usuário.

  • Bibliografia

    Exposição das fontes que usamos como base para escrever essa monografia.