MAC0459 Ciência e Engenharia de Dados
OBJETIVOS: Ao final da disciplina o aluno deverá saber os fundamentos e as técnicas para manipulação, análise, representação e validação de grandes conjuntos de dados.
PROGRAMA: Importância da área e de suas aplicações. Processo de descoberta do conhecimento (KDD) em conjuntos de dados. Tratamento, representação equalificação de grande volumes de dados. Armazém de dados e modelos multidimensionais. Indexação de grande volumes de dados. Análise exploratória de dados (estimação, análise gráfica, análise de agrupamentos, análise de associação). Modelagem de conhecimento (classificadores, regras de classificação, exemplos). Validação da descoberta e posterior modelagem. Desenvolvimento e uso de software para KDD. Exercícios com utilização de dados simulados e reais.
RESPONSÁVEIS: João Eduardo Ferreira, Nina Hirata, Roberto Hirata, Roberto Marcondes Cesar-Jr.
PRÉ-REQUISITO: MAE0212 Introdução à Probabilidade e à Estatística II e MAC0426 Introdução a Banco de Dados.
CARGA HORÁRIA SEMANAL E NÚMERO DE CRÉDITOS: 4 horas, 4 créditos-aula.
CRITÉRIO DE AVALIAÇÃO DA APRENDIZAGEM: Método: Aplicação de provas e/ou trabalhos.
Critério: Média ponderada de provas e/ou trabalhos.
Norma de recuperação: Aplicação de prova e/ou trabalho de recuperação.
BIBLIOGRAFIA BÁSICA:
- W.H. Inmon, Building the Data Warehouse, Wiley, 2005.
- M. Kantardzic, Data Mining: Concepts, Models, Methods, and Algorithms, Wiley-Interscience, 2003.
- R. Kimball, Data Warehouse Toolkit, Makron Books, 1997.
- R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval: The Concepts and Technology behind Search, 2nd Edition, ACM Press Books, 2011.
- R.T. Snodgrass, Developing time-oriented database applications in SQL, Morgan Kaufmann Publishers Inc.
- P.-N. Tan, M. Steinbach, V. Kumar, Introdução ao Data Mining, Ciência Moderna, 2009.
- L. Torgo, Data Mining with R: Learning with Case Studies, CRC Data Mining and Knowledge Discovery Series, Chapman & Hall,2010.
- I. Witten, E. Frank, Data Mining: practical machine learning tools and techniques with java implementations, The Morgan Kaufmann Series in Data Management Systems, Morgan Kaufmann Publishers Inc, 2006.
- S. Dominich, The Modern Algebra of Information Retrieval, The Information Retrieval Series, Springer, 2010.
OBSERVAÇÃO: Disciplina optativa eletiva no currículo do BCC.
[Veja dados da disciplina no JúpiterWeb]