MAC0459 Ciência e Engenharia de Dados
Por | EmOBJETIVOS: Ao final da disciplina o aluno deverá saber os fundamentos e as técnicas para manipulação, análise, representação, validação e processamento de grandes volumes de dados.
PROGRAMA RESUMIDO: Importância da área e de suas aplicações. Processo de descoberta do conhecimento (KDD). Tratamento, representação e qualificação de grande volumes de dados. Armazém de dados e modelos multidimensionais. Noções de Redes de Petri e Álgebra de Processos. Modelagem e implementação de workflows científicos e processos de negócio. Indexação e recuperação de grandes volumes de dados. Análise exploratória de dados. Redes complexas e bancos de dados orientado a grafos. Exercícios com utilização de dados simulados e reais.
PROGRAMA: Importância da área e de suas aplicações. Processo de descoberta do conhecimento (KDD). Tratamento, representação e qualificação de grande volumes de dados. Armazém de dados e modelos multidimensionais. Noções de Redes de Petri e Álgebra de Processos. Modelagem e implementação de workflows científicos e processos de negócio. Indexação e recuperação de grandes volumes de dados. Análise exploratória de dados. Redes complexas e bancos de dados orientado a grafos. Exercícios com utilização de dados simulados e reais.
RESPONSÁVEIS: João Eduardo Ferreira, Kelly Rosa Braghetto, Roberto Hirata Jr., Roberto M. Cesar Jr.
PRÉ-REQUISITO: MAC0121.
CARGA HORÁRIA SEMANAL E NÚMERO DE CRÉDITOS: 4 horas, 4 créditos-aula.
CRITÉRIO DE AVALIAÇÃO DA APRENDIZAGEM:
Método: aulas expositivas e laboratório de programação.
Critério: média ponderada de provas e exercícios.
Norma de recuperação: Aplicação de prova e/ou tarefas de recuperação.
BIBLIOGRAFIA:
- W. H. Inmon, Building the Data Warehouse, Wiley, 2005.
- M. Kantardzic, Data Mining: Concepts, Models, Methods, and Algorithms, Wiley-Interscience, 2003.
- R. Kimball, Data Warehouse Toolkit, Makron Books, 1997.
- R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval: The Concepts and Technology behind Search, 2nd ed., ACM Press Books, 2011.
- W. Fokkink, Introduction to Process Algebra, Springer, 2000.
- W. van der Aalst, C. Stahl, Modeling Business Processes: A Petri Net-Oriented Approach, The MIT Press, 2011.
- W. van der Aalst, K. van Hees, Workflow Management: Models, Methods, and Systems, The MIT Press, 2004.
- I.J. Taylor, E. Deelman, D.B. Gannon, M. Shields (Eds.), Workflows for e-Science: Scientific Workflows for Grids, Springer, 2006.
- P.-N. Tan, M. Steinbach, V. Kumar, Introdução ao Data Mining, Ciência Moderna, 2009.
- S. Dominich, The Modern Algebra of Information Retrieval (The Information Retrieval Series), Springer, 2010.
- J. Leskovec, A. Rajaraman, J.D. Ullman. Mining of Massive Datasets, Stanford University, 2010.
- C.D. Manning, P. Raghavan, H. Schütze, An Introduction to Information Retrieval, Online edition, Cambridge, 2009.
- I. Robinson, J. Webber, E. Eifrem, Graph Databases, O’Reilly Media, 2013.
OBSERVAÇÃO: Disciplina optativa eletiva no currículo do BCC.
[Veja dados da disciplina no JúpiterWeb]