Feeds:
Posts
Comentários

Posts Tagged ‘hotbot’

Como faço habitualmente ao acordar, neste domingo tava zapeando entre as 5 estações de rádio que costumo ouvir aqui em Porto Alegre, quando dei de cara com um programa interessante na CBN, conduzido pelo Heródoto Barbeiro. Infelizmente peguei o bonde andando, e tive que saltar antes do fim da linha. Felizmente eles disponibilizam o áudio, em duas partes:

No meio da segunda parte, o Heródoto fez uma pergunta bastante pertinente e importante: como é que as pessoas podem selecionar as informações adequadas, entre as milhares disponíveis na internet?

Embora tivesse a companhia de três especialistas no assunto, na minha opinião eles tangenciaram a questão. Um dos participantes mencionou a possibilidade de assinatura de feeds de blogs e portais importantes. Mas o problema proposto por Heródoto exige uma providência anterior à assinatura do feed, ou mesmo inscrição em malas diretas, hoje uma ferramenta disponível, por exemplo, no Zookoda e no FeedBlitz, que considero bem melhor do que o primeiro.

Antes de assinar feed, você deve identificar o endereço para fazer a assinatura. Essa é a questão: como localizar o endereço nesse cipoal digital? A figura abaixo ilustra o processo.

distribuir_informar

Tudo começa como sempre, desde o primeiro Heródoto, o pai da História. Alguém produz o conteúdo e o coloca em algum lugar. Em papiros, fichas, livros e revistas, arquivos html em algum servidor conectado na internet. O problema é achar esse conteúdo, disseminado no espaço virtual da internet, que atenda nossa necessidade. Antes de 1998, existiam os diretórios, Yahoo, AltaVista, HotBot, e outros. Cada produtor de conteúdo registrava seu material. O diretório tinha um sistema de indexação que era orientado pelo próprio produtor, que informava em que área do conhecimento seu material devia ser classificado.

O pobre do usuário tinha que ficar circulando entre os diretórios, e depois dentro de cada diretório para achar os materiais que lhe interessava. Uma coisa chata e ineficiente. Foi quando o pessoal do Google inventou a tecnologia das ferramentas de busca. Seus robôs digitais ficam por aí, circulando em tudo que é servidor, verificando as informações e colocando-as em um index. Depois, por intermédio de palavras-chaves ou sentenças de busca, o usuário pode recuperar essas informações. O problema é que esse processo de indexação é muito complexo.

Embora estejam no bom caminho, o pessoal do pessoal do Google ainda está longe de obter pleno sucesso na análise textual que produza uma indexação perfeita. Há mais de cinco, fiz uma busca no Google sobre física nuclear. Uma das primeiras páginas era de uma turma de um colégio em João Pessoa. Você acha confiável um conteúdo sobre física nuclear preparado por uma turma de colegiais? De lá para cá, o Google melhorou muito, mas ainda hoje o sistema recupera conteúdo duvidoso. Por exemplo, repetindo a pesquisa com a sentença “física nuclear”, com aspas para aumentar a restrição, encontramos endereços de estudantes na frente de endereços de conceituados institutos e departamentos de física, como da USP, da UFSM, da UFRGS, entre outros.

Claro que parte dessa dificuldade deve-se à inabilidade dos produtores de conteúdo formatarem seus materiais de modo a facilitar o trabalho dos robôs digitais, mas também temos que considerar a inabilidade das ferramentas de busca para a realização de uma análise textual apropriada.

Depois de todo esse lero-lero, a questão do Heródoto continua sem resposta. É, não é fácil respondê-la. Teremos que cair nas mãos das fontes confiáveis, das autoridades no assunto.

riso_frouxoPor exemplo, se você deseja informações sobre a ciência que está por trás das inovações tecnológicas, tem que colocar o Blog do Prof. Carlos entre seus favoritos.

Anúncios

Read Full Post »

Conheci o Google em 1998, por recomendação do meu estudante de doutorado Gabriel Simon. Era evidente que se tratava de algo impressionante. Tratei logo de colocá-lo nas minhas páginas e deixei de usar os antigos mecanismos de buscas, que não passavam de simples diretórios. Lembra? Aonde, AltaVista, Busca, Guia Web, HotBot, Open Directory, Prokura, Radar Uol, Yahoo, entre muitos outros. A idéia de ferramenta de busca, como hoje a conhecemos foi introduzida pelo pessoal do Google.

Para dar visibilidade à página, éramos obrigados a registrá-la na infinidade de diretórios. E colocá-los em algum lugar da página como estratégia de realimentação. O Google veio para acabar com isso.

Para dar visibilidade à página, éramos obrigados a registrá-la na infinidade de diretórios. E colocá-los em algum lugar da página como estratégia de realimentação. O Google veio para acabar com isso.

Naquela época, a página da Sociedade Brasileira de Física (SBF) também adotava o mesmo procedimento; uma lista de diretórios. Escrevi para o administrador da página, falando sobre o Google, que não havia mais necessidade de colocar os diretórios; que bastava colocar um link para o Google que o visitante da página tinha à disposição uma bela ferramenta de busca.

Fui solenemente desconsiderado pelo administrador, que na sua santa ignorância deve ter imaginado que aquela sugestão vinha de algum estúpido visitante. O que não deve ele hoje pensar, ao ver no que deu o Google!

Post Scriptum: a propósito, muitas empresas de comunicação, aquilo que em inglês se conhece como media company, estão com os cabelos em pé com o http://knol.google.com/, a mais nova invenção do Google.

Read Full Post »