@profissaoweb no Twitter

Ir direto para o conteúdo

Profissão Web

Sexta-feira, 15 de agosto de 2008 às 12:02  

Blog do Google: Sabíamos que a Web era grande!

Publicado por: Thiago Melo

Excelente artigo publicado por Jesse Alpert e Nissan Hajaj, Engenheiros de Software da Equipe de Infra-estrutura de Busca na Web do Google:

Há muito tempo que sabemos que a Web é grande! O primeiro índice do Google em 1998 já tinha 26 milhões de páginas, em 2002 o índice do Google atingiu a marca de um bilhão. Nos últimos oito anos temos visto números bastante grandes em relação ao conteúdo real por aí afora. Recentemente, até mesmo os nossos engenheiros de busca se espantaram ao ver o quão grande é a Web hoje em dia – quando os nossos sistemas, encarregados de processar os vínculos na Web para descobrir qualquer novo conteúdo, chegaram à surpreendente marca de: 1 trilhão (1.000.000.000.000) de URLs na Web ao mesmo tempo!

Então, quantas páginas tem a web realmente? Nós não sabemos; não temos tempo para ver todas elas! Falando estritamente, o número de páginas lá fora é infinito – por exemplo, os calendários web podem ter um link “dia seguinte”, e nós poderíamos seguir esse link eternamente, encontrando uma nova página a cada vez que o fizermos. Não estamos fazendo isso, obviamente, pois não haveria nenhum benefício para os usuários nisso. Mas este exemplo demonstra que o tamanho da web depende realmente da sua definição do que é uma página útil, e para isso não existe uma resposta exata.

Nós não indexamos cada uma desse trilhão de páginas – muitas delas são similares umas às outras, ou representam um conteúdo similar ao do exemplo do calendário, que não trazem muitos benefícios para os usuários de busca. Mas nós estamos orgulhosos de ter o índice mais completo de todos as ferramentas de busca, e nosso objetivo sempre foi relacionar toda a informação do mundo.

Para estar em dia com este volume de informação nossos sistemas passaram por um longo progresso desde o primeiro conjunto de dados da web que a Google processou para dar resultaods às buscas. Naquela época fazíamos tudo rodadas: uma estação de trabalho podia computar o diagrama de 26 milhões de páginas em um espaço de poucas horas, e aquele conjunto de páginas seria utilizado como o índice da Google por um determinado periodo de tempo. Hoje em dia, Google download da web constantemente, colhendo informação atualizada das páginas e processando novamente um diagrama inteiro de links da Web várias vezes por dia. Esse diagrama de um trilhão de URLs é semelhante a um mapa composto por um trilhão de cruzamentos. Assim, fazemos múltiplas vezes por dia o equivalente computacional de explorar totalmente cada cruzamento de cada estrada nos Estados Unidos. Com a diferença de que esse mapa seria mais ou menos 50.000 vezes maior que o dos Estados Unidos, com 50.000 vezes mais estradas e cruzamentos.

Como você pode ver, a nossa infra-estrutura distribuída permite que as aplicações atravessem eficientemente um diagrama de links com vários trilhões de conexões, ou rapidamente classifica petabytes de dados, simplesmente para nos preparar para responder a pergunta mais importante: sua próxima busca no Google.

Artigo do Blog do Google Brasil.

Categorias:

Compartilhe:

Comentários

  1. anabolics online às 08/03/2012 às 19:28:16

    Acho que outro site proprietários devem tomar este website como um modelo, o estilo de usuário muito limpa e amigável e excelente design, muito menos o conteúdo. Você é um especialista neste tópico!

  2. buy anabolics às 13/02/2012 às 19:21:09

    Eu, sem dúvida, ansiava por a subir um reconhecimento a ser o meio de apreciar para todos nós uma contribuição gloriosa fomos exibição na www.profissaoweb.com. Meu puxão internet alargada de imediato sido famoso com grandes estratégias para passar por cima com meus amigos, bem como da família. que demonstraria que a maioria de nós visitantes, essencialmente, foram santificados, sem dúvida, a existir em uma aldeia conspícua com pessoas realmente mais diluído com dicas rentável. nos sentimos realmente em dívida com detectaram suas páginas web, bem como comportamento de bronze para a maioria de modo celebração minutos alguns, mais extraordinário de uma massa aqui. Obrigado novamente para todos nós um detalhes.

  3. website promotions às 11/02/2012 às 14:33:17

    bien évidemment, comme www.profissaoweb.com cependant vous avez besoin de tester l'orthographe sur plusieurs de vos messages. Un certain nombre d'entre eux sont en proie à des problèmes d'orthographe et j'ai trouver qu'il est très difficile de raconter la réalité pourtant je vais certainement revenir.

  4. comprar proviron às 22/12/2011 às 08:27:54

    pós local excepcional. Vou marcar www.profissaoweb.com e confira muito mais vezes. Eu realmente gosto do modelo de site

Publique no seu blog

Clique aqui para publicar este artigo no seu blog.

Profissão Web nas redes sociais

  • Twitter
  • Flickr
  • YouTube
  • Facebook
  • E-mail

Galeria de fotos

Fotos oficiais do sétimo dia da Campus Party 2011 em São Paulo

Ver galeria de fotos

Especiais do Profissão Web

Ver galeria de especiais

Publicidade

Enquete do blog

O que você achou da nova versão do Profissão Web?

Ver resultados

Assine nossa newsletter

Cadastre o seu e-mail no campo abaixo para receber diariamente os artigos do Profissão Web:


Um e-mail de confirmação do FeedBurner será enviado para você! Confirme no link que será enviado para o seu e-mail para receber os últimos artigos do Profissão Web.