Preservando a privacidade individual na análise de dados de domínio públicos

Projeto em desenvolvimento para o trabalho de conclusão de curso do Bacharelado em Ciência da Computação
Instituto de Matemática e Estatística da Universidade de São Paulo
2017

Pedro Ivo Siqueira Nepomuceno
Orientador: Prof. Dr. Vladmir Belitsky

Privacidade em Bancos Públicos - Isto é Possível?

Impulsionada por dados, a ciência pode auxiliar a extrair diversas informações acerca de uma população, podendo inclusive prever tendências e indicar o melhor caminho a se seguir. Seu avanço, entretanto, acaba esbarrando em um problema legal: a privacidade individual. Muitos dos dados que poderiam ser usados por cientistas (ou até corporações privadas) são protegidos por força de lei.

É neste contexto que surgiram os bancos de dados estatísticos: bancos que respondem somente a consultas que revelem dados agregados, sem distinção individual dos registros. A simples retirada dos dados de identificação individual, entretanto, não garante o anonimato. Utilizando técnicas de programação linear ou de força bruta, é possível identificar cada registro do banco por meio de sucessivas consultas de agregação. Para impedir essa identificação, os bancos passaram a responder as consultas aliadas a uma perturbação aleatória que visa impedir a aplicação de tais técnicas.

O presente projeto tem por objetivo o estudo sobre estes bancos, as técnicas que são utilizadas para garantir a privacidade, e principalmente, um limite inferior que precisam ter as perturbações aleatórias para não serem completamente inúteis. O trabalho apresenta justificativas de um limite inferior de o(√n) para as perturbações.

Além disso, inclui a criação de um simulador para verificar os tempos de execução das decriptações, a sua assertividade e mais dados que auxiliem na compreensão do leitor aos bancos estatísticos.

Entre em contato

Quaisquer dúvidas ou comentários, não exite em entrar em contato!