Os maiores bancos de dados do mundo

O site Business Intelligence Lowdown (BIL) publicou uma matéria em que lista os 10 maiores bancos de dados do mundo. Segue a lista, na ordem em que aparece no artigo original, ou seja, do décimo colocado para o primeiro:

10 – Biblioteca do Congresso dos EUA: armazena milhões de documentos, imagens e catálogos. Só de arquivos de texto, há 20 TB (terabytes), lembrando que 1 terabyte equivale a 1024 gigabytes;

9 – CIA (Central Intelligence Agency): A CIA armazena informações sobre pessoas, empresas e localidades do mundo todo. Como é de se esperar, a maioria dos dados não está disponível ao público, mas algumas informações podem ser acessadas no CIA FOIA;

8 – Amazon: a Amazon é a maior loja de comércio eletrônico do mundo e, atualmente, conta com quase 60 milhões de clientes ativos. Sua base de dados é estimada em 42 TB, mas certamente é muito maior que isso. Esse valor é o que foi informado pela empresa;

7 – YouTube: o YouTube é o maior (e melhor) site de vídeos on-line que existe. Cerca de 65 mil vídeos são enviados ao serviço mensalmente e, se cada um tiver 10 MB, o site fecha cada mês com crescimento de 18,6 TB em sua base de dados. Todavia, a matéria diz que, atualmente, o YouTube conta com 45 TB de dados. Acredito que esse valor esteja muito desatualizado;

6 – ChoicePoint:
não conheço esse site, mas de acordo com sua descrição, trata-se de um serviço que coleta e disponibiliza (com níveis de acesso) informações sobre cidadãos americanos. A matéria da BIL afirma que o ChoicePoint ajudou a identificar várias vítimas do atentado ao World Trade Center através do cruzamento de informações de DNA. Sua base de dados ultrapassa 250 TB (fiquei com medo desse site…);

5 – Sprint: a Sprint é uma das maiores empresas de telecomunicações do mundo (para não dizer a maior) e conta, atualmente, com cerca de 53 milhões de clientes. O tamanho de seu banco de dados não foi divulgado, mas de acordo com a BIL, a empresa recebe 70 mil informações de chamadas telefônicas por segundo nos horários de pico;

4 – Google: pensei que o Google seria o primeiro. Basta considerar que a empresa mantém em cache quase todas as páginas da internet, tem mais de 51 milhões de usuários no Gmail, armazena imagens do mundo todo para o Google Earth e para o Google Maps, tem milhões de cadastrados no Orkut, entre outros. Isso tudo sem contar que o YouTube faz parte de seu leque de serviços. Não se sabe o quanto de informações o Google armazena, mas estima-se que a empresa ultrapassa tranqüilamente a casa dos petabytes (1 petabyte = 1024 terabytes);

3 – AT&T: essa é outra gigante das telecomunicações. Assim como a Sprint, a AT&T também armazena os dados telefônicos de milhões de clientes, com o diferencial de manter informações de várias décadas, já que é uma companhia antiga;

2 – National Energy Research Scientific Computing Center (NERSC):
o NERSC trabalha com pesquisas sobre fontes de energia e mantém dados de estudos sobre diversas tecnologias referentes. Sua base de dados é estimada em 2,8 PB (petabytes) e tem capacidade para atingir 22 PB;

1 – World Data Centre for Climate (WDCC): eis o campeão. Como o nome indica, o WDCC é um entidade que faz pesquisas climáticas no mundo todo. Essa é uma das áreas que mais exigem processamento e capacidade de armazenamento de dados. De acordo com a BIL, o WDCC disponibiliza 220 TB de dados na Web e possui um base interna que ultrapassa 6 PB.

Quando o assunto é armazenamento de dados, o Brasil não faz feio. Não tive tempo de confirmar essa informação, mas se não estou enganado, a Receita Federal também conta com um banco de dados gigantesco e respeitável, o que não me surpreende, afinal, quando é para tirar dinheiro da gente, os investimentos são altos, não é mesmo? 😀

Referência: Business Intelligence Lowdown.

Emerson Alecrim