Contagem distinta é o problema de se encontrar o número de elementos distintos em um fluxo de dados com repetições de elementos. A solução trivial, que insere os dados em uma tabela, tem um consumo de espaço linear e é inviável para aplicações com alto volume de dados. Algoritmos probabilísticos resolvem esse problema trocando a exatidão da contagem por uma grande redução do consumo de espaço. Então, este trabalho apresentará soluções probabilísticas para a contagem distinta.
William Hideki Kondo