Os maiores bancos de dados do mundo

O site Business Intelligence Lowdown (BIL) publicou uma matéria em que lista os 10 maiores bancos de dados do mundo. Segue a lista, na ordem em que aparece no artigo original, ou seja, do décimo colocado para o primeiro:

10 – Biblioteca do Congresso dos EUA: armazena milhões de documentos, imagens e catálogos. Só de arquivos de texto, há 20 TB (terabytes), lembrando que 1 terabyte equivale a 1024 gigabytes;

9 – CIA (Central Intelligence Agency): A CIA armazena informações sobre pessoas, empresas e localidades do mundo todo. Como é de se esperar, a maioria dos dados não está disponível ao público, mas algumas informações podem ser acessadas no CIA FOIA;

8 – Amazon: a Amazon é a maior loja de comércio eletrônico do mundo e, atualmente, conta com quase 60 milhões de clientes ativos. Sua base de dados é estimada em 42 TB, mas certamente é muito maior que isso. Esse valor é o que foi informado pela empresa;

7 – YouTube: o YouTube é o maior (e melhor) site de vídeos on-line que existe. Cerca de 65 mil vídeos são enviados ao serviço mensalmente e, se cada um tiver 10 MB, o site fecha cada mês com crescimento de 18,6 TB em sua base de dados. Todavia, a matéria diz que, atualmente, o YouTube conta com 45 TB de dados. Acredito que esse valor esteja muito desatualizado;

6 – ChoicePoint:
não conheço esse site, mas de acordo com sua descrição, trata-se de um serviço que coleta e disponibiliza (com níveis de acesso) informações sobre cidadãos americanos. A matéria da BIL afirma que o ChoicePoint ajudou a identificar várias vítimas do atentado ao World Trade Center através do cruzamento de informações de DNA. Sua base de dados ultrapassa 250 TB (fiquei com medo desse site…);

5 – Sprint: a Sprint é uma das maiores empresas de telecomunicações do mundo (para não dizer a maior) e conta, atualmente, com cerca de 53 milhões de clientes. O tamanho de seu banco de dados não foi divulgado, mas de acordo com a BIL, a empresa recebe 70 mil informações de chamadas telefônicas por segundo nos horários de pico;

4 – Google: pensei que o Google seria o primeiro. Basta considerar que a empresa mantém em cache quase todas as páginas da internet, tem mais de 51 milhões de usuários no Gmail, armazena imagens do mundo todo para o Google Earth e para o Google Maps, tem milhões de cadastrados no Orkut, entre outros. Isso tudo sem contar que o YouTube faz parte de seu leque de serviços. Não se sabe o quanto de informações o Google armazena, mas estima-se que a empresa ultrapassa tranqüilamente a casa dos petabytes (1 petabyte = 1024 terabytes);

3 – AT&T: essa é outra gigante das telecomunicações. Assim como a Sprint, a AT&T também armazena os dados telefônicos de milhões de clientes, com o diferencial de manter informações de várias décadas, já que é uma companhia antiga;

2 – National Energy Research Scientific Computing Center (NERSC):
o NERSC trabalha com pesquisas sobre fontes de energia e mantém dados de estudos sobre diversas tecnologias referentes. Sua base de dados é estimada em 2,8 PB (petabytes) e tem capacidade para atingir 22 PB;

1 – World Data Centre for Climate (WDCC): eis o campeão. Como o nome indica, o WDCC é um entidade que faz pesquisas climáticas no mundo todo. Essa é uma das áreas que mais exigem processamento e capacidade de armazenamento de dados. De acordo com a BIL, o WDCC disponibiliza 220 TB de dados na Web e possui um base interna que ultrapassa 6 PB.

Quando o assunto é armazenamento de dados, o Brasil não faz feio. Não tive tempo de confirmar essa informação, mas se não estou enganado, a Receita Federal também conta com um banco de dados gigantesco e respeitável, o que não me surpreende, afinal, quando é para tirar dinheiro da gente, os investimentos são altos, não é mesmo? 😀

Referência: Business Intelligence Lowdown.

Emerson Alecrim





  • ThiiH

    Petabyte?
    Não sabia dessa…

  • Daniel

    Boa a informação, mas de muito mau gosto o comentário final sobre a Receita Federal. Típico brasileiro que só dá valor as coisas de fora.

  • Emerson Alecrim

    Sim, ThiiH. E depois de petabyte vem exabyte. Não sei o que vem depois.

    Daniel, a mensagem sobre a Receita Federal está em tom de brincadeira. Percebeu a “carinha” rindo ali? Mas como toda brincadeira tem um pouco de verdade, a Receita Federal leva uma boa parcela do que eu ganho todo ano. Eu ficaria mais satisfeito se esse dinheiro fosse investido corretamente. Eu não sou TROUXA de valorizar quem me rouba. Você é?

  • Sub-Zero

    hahaha…

    Você acabo de valorizar falando do seu respeitável bando de dados, faze o que né? Mudar pro Japão ou pro EUA? O pior que nem isso da porque os vôos são todos cancelados.

    Acho que o maior é o Zetabity mais não sei a lista toda.

  • Emerson Alecrim

    O maior, segundo a Wikipedia, é yottabyte. Vou até fazer um tópico sobre isso. O assunto é interessante, né?

  • Sub-Zero

    É mais uma das curiosidades do mundo da informática igual ao ScrollLock hehehe…

    (Que merd* de teste é esse?)

  • Tirou as palavras da minha boca: “pensei que o Google seria o primeiro”.

    1 petabyte (PB? o termo também é novo para mim) é algo inimaginável… eu mal consigo imaginar 1 TB direito.

  • Emerson,

    O que chama atenção é que são todas empresas com muito tempo de mercado, menos…

    … o YouTube ! O cara “chegou agora” e já é um dos Top10 !

    Interessante, não ? 🙂

    []’s

    Rafael Arcanjo
    Arcanjo.org
    Imperador.org

  • Pingback: Blog InfoWester » Blog Archive » Kilobyte, megabyte, gigabyte, terabyte… e depois?()

  • Emerson Alecrim

    Pois é, Rafael! É indiscutível: o YouTube é um dos maiores fenômenos da internet, não resta dúvidas!

  • Pingback: Blog InfoWester » Blog Archive » IDC: em 2006 geramos 161 exabytes de dados()

  • Interessante isto… Me fez até pesquisar sobre Seymour Cray quando olhei o site da NERSC e ver que o maior computador deles é um cray XT 4. Eu descobri que foi ele quem criou o UNIVAC, o primeiro supercomputador comercial na década de 50 ! Eu acho que nada segura o youtube, em alguna anos ele vira o primeiro !

  • Pingback: O maior banco de dados do mundo()