Profissão Web - Mentes criativas transformando o mundo!

Profissão Web

Para conhecer mais sobre o blog clique aqui. Se você quiser conhecer mais sobre o autor, clique aqui.

Feeds

1535 assinantes

Para assinar os meus feeds clique em uma opção abaixo:

Não sabe o que são feeds?

Por e-mail

Para receber os artigos do Profissão Web, preencha o campo abaixo com o seu e-mail:

Publicidade

Ago

15

Por: Thiago Melo

Excelente artigo publicado por Jesse Alpert e Nissan Hajaj, Engenheiros de Software da Equipe de Infra-estrutura de Busca na Web do Google:

Há muito tempo que sabemos que a Web é grande! O primeiro índice do Google em 1998 já tinha 26 milhões de páginas, em 2002 o índice do Google atingiu a marca de um bilhão. Nos últimos oito anos temos visto números bastante grandes em relação ao conteúdo real por aí afora. Recentemente, até mesmo os nossos engenheiros de busca se espantaram ao ver o quão grande é a Web hoje em dia - quando os nossos sistemas, encarregados de processar os vínculos na Web para descobrir qualquer novo conteúdo, chegaram à surpreendente marca de: 1 trilhão (1.000.000.000.000) de URLs na Web ao mesmo tempo!

Então, quantas páginas tem a web realmente? Nós não sabemos; não temos tempo para ver todas elas! Falando estritamente, o número de páginas lá fora é infinito - por exemplo, os calendários web podem ter um link “dia seguinte”, e nós poderíamos seguir esse link eternamente, encontrando uma nova página a cada vez que o fizermos. Não estamos fazendo isso, obviamente, pois não haveria nenhum benefício para os usuários nisso. Mas este exemplo demonstra que o tamanho da web depende realmente da sua definição do que é uma página útil, e para isso não existe uma resposta exata.

Nós não indexamos cada uma desse trilhão de páginas – muitas delas são similares umas às outras, ou representam um conteúdo similar ao do exemplo do calendário, que não trazem muitos benefícios para os usuários de busca. Mas nós estamos orgulhosos de ter o índice mais completo de todos as ferramentas de busca, e nosso objetivo sempre foi relacionar toda a informação do mundo.

Para estar em dia com este volume de informação nossos sistemas passaram por um longo progresso desde o primeiro conjunto de dados da web que a Google processou para dar resultaods às buscas. Naquela época fazíamos tudo rodadas: uma estação de trabalho podia computar o diagrama de 26 milhões de páginas em um espaço de poucas horas, e aquele conjunto de páginas seria utilizado como o índice da Google por um determinado periodo de tempo. Hoje em dia, Google download da web constantemente, colhendo informação atualizada das páginas e processando novamente um diagrama inteiro de links da Web várias vezes por dia. Esse diagrama de um trilhão de URLs é semelhante a um mapa composto por um trilhão de cruzamentos. Assim, fazemos múltiplas vezes por dia o equivalente computacional de explorar totalmente cada cruzamento de cada estrada nos Estados Unidos. Com a diferença de que esse mapa seria mais ou menos 50.000 vezes maior que o dos Estados Unidos, com 50.000 vezes mais estradas e cruzamentos.

Como você pode ver, a nossa infra-estrutura distribuída permite que as aplicações atravessem eficientemente um diagrama de links com vários trilhões de conexões, ou rapidamente classifica petabytes de dados, simplesmente para nos preparar para responder a pergunta mais importante: sua próxima busca no Google.

Artigo do Blog do Google Brasil.

Procure por: Livros, Geladeira, Multifuncionais, Kingston 4Gb, Óculos escuros, Walk Talkies, Micro System, Lost 3ª Temporada (DVD)

Tags:

Artigos relacionados:

Deixe seu comentário: * ** *

(*) Campos obrigatórios.

(**) O campo de e-mail é obrigatório, mas não será mostrado no blog.

Promoções

Selo Promoção

Clique aqui para saber mais

Isto também pode te interessar

  • Banner Experimente Design

Agências Brasileiras

Clique aqui e conheça as maiores e principais agências digitais (Produtoras de Internet e Netmarketing) do Brasil.

Sobre o blog e o autor

O Profissão Web é o blog de Thiago Melo, designer e desenvolvedor de interfaces de Brasília. Aborda assuntos como internet, profissões, métricas, market share, mercado, sites inspiradores, direitos do trabalhador, legislação do trabalho, salários, tecnologia, eventos e diversos outros assuntos. Para saber mais sobre o Profissão Web, clique aqui.

Métricas e Market Share

Clique aqui e confira os gráficos com o market share de browsers, ferramentas de buscas, sistemas operacionais e resoluções de tela.

Calendário de Eventos sobre Internet

Se você conhece um evento bacana, um congresso, fórum, seminário ou está sabendo de um encontro legal de blogueiros mande pra gente.
Clique aqui e acesse o nosso calendário.

Enquetes

Em breve você poderá responder à enquetes sobre temas como internet, métricas, salário, mercado entre outros. Você poderá participar também de pesquisas de mercado no novo canal "Profissão Web Pesquisa".