Boa noite, São Luis-MA Quarta-feira, 8 de Setembro de 2010
  Comage
   
 
Formas de uso do computador no ensino: Como fazer pesquisas na internet
28/09/2009 - 17:02:44
Visualização: 92 | Impressões: 1 | Comentários: 0  

INTRODUÇÃO

Sem sombra de dúvidas, a internet representa uma grande revolução para a sociedade contemporânea. Para afirmar isso, basta que pensemos na quantidade de pessoas que, neste momento, estão mandando e-mails, comunicando-se por programas de mensagens instantâneas, fazendo compras, pagando contas, lendo seu jornal ou revistas preferidos, enfim, fazendo uso da rede com os mais diversos objetivos. E as expectativas é que a web se torne o mais poderoso meio de comunicação do futuro, considerando que as aplicações e o número de usuários irão aumentar.
Como forma de melhor compreender este poderoso meio de comunicação, diversos estudos sobre o número de páginas existentes e outros dados gerais da internet vêm sendo empreendidos. Até o momento, o que é possível dizer de concreto é que a internet é o maior repositório de informação que existe. Segundo a FAPESP, em 31 de dezembro de 2000, havia 359.630 domínios registrados. Hoje, 23 de agosto de 2009, há 1.797.944 . Isso representa um aumento de 500% em menos de 9 anos. Só no Brasil.
Estima-se que, em média, cada site tenha 85 páginas. Ora, isso significa 151.027.296 páginas! Como achar exatamente a página que nos interessa, considerando que elas não estão organizadas sob nenhum critério específico? Isso torna a pesquisa na internet uma tarefa quase tão difícil quanto procurar uma agulha no palheiro, um palheiro gigante.
É possível dizer, então, que a internet é uma enorme coleção de obras, que não estão organizadas por conteúdo, por autor e por nenhum outro critério intuitivo. Opa! Coleção de obras é uma biblioteca. E quem organiza uma biblioteca? A bibliotecária. Nesta analogia, podemos dizer que a bibliotecária da internet é um sistema de busca. Os sistemas de busca da Internet nos ajudam a conseguir melhores resultados na busca por qualquer tipo de conteúdo. Mas, para isso, é preciso entender como eles funcionam. Nas páginas seguintes, será feita uma abordagem sobre como os sistemas de busca podem nos ajudar a resolver qualquer tipo de dúvida sobre os conteúdos da web.


SISTEMAS DE BUSCA

Quando foi a sua primeira busca na internet? A experiência foi satisfatória? Os resultados atenderam sua expectativa? Provavelmente, esta primeira tentativa foi motivada pela afirmação de muitos ao nosso redor de que, na internet, encontramos tudo. E mais provável ainda é que não se encontre nada realmente interessante neste “contato” inicial.
Quando fazemos uma pesquisa na internet através de um site de busca, vários resultados são apresentados em questão de segundos. Esta rapidez já nos dá indícios que a busca não está acontecendo exatamente naquele momento, ou seja, a informação que buscamos já foi previamente organizada em bancos de dados. Esta organização pode ser fruto de trabalho humano ou automatizado.
O que está por trás desta organização é um poderoso sistema de busca, constituído de computadores, índices, algoritmos e bases de dados, para analisar e indexar as páginas da internet e armazenar estes resultados.
De forma geral, então, podemos chamar de sistema de busca os mecanismos de busca (bases de dados indexadas automaticamente) e os diretórios (bases de dados indexadas manualmente). Os sistemas automatizados lidam com um volume maior de informação e aqueles baseados no trabalho humano, embora tenham um volume menor, a qualidade das informações armazenadas é melhor.
Assim, quando fazemos uma consulta, é esta base de dados já previamente indexada (pela ação humana ou automatizada) que é acessada para a emissão dos resultados. Perceba aí que os resultados não vêem diretamente da web, e são, isso sim, uma cópia das páginas existentes na web. E um sistema de busca pode ter em sua base dados cópias de todas as páginas da web? Na prática, nem metade das páginas são copiadas para a base de um sistema de busca. Estima-se que o maior deles, por exemplo, www.alltheweb.com, indexe somente 38% das páginas da web.

Mecanismos de busca

Podemos descrever o funcionamento de um mecanismo de busca da seguinte forma:

  • Um programa de computador, conhecido como robô, visita cada página da web e guarda uma cópia dela na base de dados do mecanismo de busca. A cada página visitada, os links para outras páginas ali referenciadas entram na fila para também serem visitados.
  • As páginas copiadas na base de dados são indexadas de acordo com um ou mais critérios. Ter uma página da web copiada na base de dados de um mecanismo de busca não é uma ação exclusiva de um programa robô. A maioria dos mecanismos oferece a opção do próprio usuário inscrever sua página.
  • Quando um internauta faz uma consulta, um programa de busca varre a base de dados a procura das palavras, expressões ou frases, especificadas pelo internauta, e monta uma lista de resultados que atendam estas especificações.

As URLs dos mecanismos de busca mais conhecidos são: alltheweb.com, altavista.com, excite.com, google.com, infoseek.com, hotbot.com, lycos.com, nothernlight.com, radaruol.com.br, radix.com.br, search.aol.com, search.yahoo.com, snap.com e webcrawler.com.

Diretórios

Os diretórios diferem dos mecanismos de busca no que diz respeito à montagem de sua base de dados. Aqui, não existe um programa robô que varre a internet através de páginas para serem copiadas para a base de dados de um sistema de busca. É através da ação humana que esta base é montada. A partir de uma análise das páginas, seres humanos as classificam e indexam de acordo com vários critérios.
Montada a base e feita a sua indexação, o restante do funcionamento do sistema de busca é igual, ou seja, quando é feita uma consulta por um usuário, um programa de busca consulta a base de dados e retorna para os usuários aquelas páginas que atendem às especificações dadas.
Também nos diretórios, os usuários podem sugerir suas páginas para integrar a base de dados. Mas, além de informar a URL, será necessário classificá-la de acordo com o assunto delas. Dependendo do diretório, pode haver editores (também seres humanos) que irão aprovar ou não a inscrição de sua página. Isso é um rigor que visa garantir que as páginas armazenadas na base de dados sejam de qualidade e estejam de acordo com o assunto indicado.
Outra diferença existente entre mecanismos de busca e diretórios está relacionada ao conteúdo da base de dados. No primeiro caso, como vimos antes, é feita uma cópia da página da web; no segundo caso, é possível que apenas o título de página e mais algumas frase relevantes sejam copiados à base
As URLs dos diretórios com editores mais conhecidos são: aeiou.pt, aonde.com, bookmarks.com.br, cade.com.br, dir.google.com, sapo.pt e yahoo.com.br.


FAZENDO PESQUISAS

Já deu para imaginar o quanto é difícil encontrar, num universo tão grande de páginas, exatamente aquilo que pesquisamos, com a qualidade que desejamos. No momento, um dos assuntos mais comentados no Brasil e no mundo é a gripe suína. Se queremos saber mais sobre este assunto, normalmente, acessamos um site de busca, digitamos o assunto que nos interessa e esperamos o resultado.

No Google, por exemplo, esta pesquisa traria aproximadamente 10.300.000 páginas. Isso hoje! Se você tentar repetir esta pesquisa quando estiver lendo este texto, certamente, o número de resultados será muito maior.
O problema é que, por mais interessados que estejamos neste assunto, jamais teremos tempo e disposição para ler esta quantidade de páginas. Sem contar que o número tende aumentar e algumas destas páginas ficarão desatualizadas rapidamente. Ou seja, é preciso usar algum recurso para reduzir o universo da busca.
São duas as formas de buscar informação nos sistemas de busca: por palavra-chave ou por diretório.

Palavras-chave

Palavras-chave são um grupo de palavras que digitamos no sistema de busca para fazer uma pesquisa. Ao fazer uma consulta utilizando palavra-chave, o pesquisador a digita no quadro de pesquisa e aciona o programa de busca clicando em um botão. Este programa irá consultar toda a base de dados em busca de páginas que correspondam à palavra, à expressão e/ou ao termo digitados. Se encontrar algo, os resultados são apresentados; caso contrário, é dada a informação de que não há páginas correspondentes àquela consulta.
Na pesquisa exemplificada acima (gripe suína), de forma geral, pode-se dizer que o programa de busca irá encontrar todas as páginas que contenham estas duas palavras. Pode ser encontrada, por exemplo, uma página que tenha o texto “A criação suína na fazenda X foi reduzida devido à grande quantidade de empregados acometidos por gripe”.
Esta página, embora nada tenha a ver com a gripe suína que nos interessada, atende aos critérios da consulta porque tem as duas palavras especificadas. É claro que a maioria dos sistemas de busca vai priorizar entre os primeiros resultados aquelas páginas que têm as duas palavras uma após a outra. Isso é um critério de relevância. Existem outros sobre os quais trataremos mais à frente.
Fato é que a qualidade dos resultados depende das palavras-chave que usamos. A forma de combiná-las é que nos garantirá a melhor qualidade das respostas, que são organizadas numa lista de endereços. Portanto:

  • Evite frases longas;
  • Seja específico;
  • Consulte um assunto por vez;
  • Elimine palavras desnecessárias;
  • Experimente sinônimos.

A digitação das palavras-chave também merece atenção.

  • Maiúsculas e minúsculas. Para a maioria dos sites de buscas, é indiferente usar uma ou outra.
  • Acentos gráficos. Na maioria dos sites de busca, não é necessário digitar acentos.
  • Cedilha. Faz diferença no resultado da busca.
  • Artigos e preposições. São desnecessários. Mesmo quando digitados, a maioria dos sites de busca os ignora.
  • Truncagem. É a forma de pesquisar uma parte de uma palavra. Ex: *ação para obter respostas como informação, comunicação, aviação, fecundação; bras* para obter respostas como brasa, brasão, Brasil, brasílio, brássica, etc.

Em alguns casos, as dicas acima não são suficientes. É preciso refinar a busca. Abaixo, são apresentados alguns recursos oferecidos pelo Google.
OR: Uma coisa ou outra. A utilizar o operador OR (ou |) entre duas palavras, o programa de busca procurar por páginas que contenham a primeira palavra ou a segunda. Exemplo: dinheiro OR investimento, amor | paixão.
Citação entre aspas. Tudo que estiver entre aspas é procurado exatamente como foi digitado. Exemplo: “Fernando Collor de Melo. Páginas que contenham o texto “Fernando Collor” sem o “de Melo” não são apresentadas como resultados desta busca.
NOT: Negação. Busca páginas que contenham um determinado conteúdo e não contenham outro(s). NOT também pode ser representado pelo sinal -. Exemplo: modelos celulares - motorola. Mostra páginas com modelos de celulares, excetuando-se os Motorola.
Termos Similares (~). Busca páginas com conteúdo semelhante à expressão ou termo especificado. Exemplo: ~gripe.
Definições. Serve para busca páginas com o conceito do termo especificado. Exemplo: define: mulheres.
Calculadora. Ao especificar os termos de uma operação de adição, subtração, multiplicação e divisão na caixa de pesquisa, utilizando os operadores +, -, * e / entre eles, será efetuada a operação matemática e o resultado será exibido. Exemplo: 4/2.
Número intermediário. Retorna páginas com conteúdo entre os valores especificados como inicial e final. Exemplo: Ivete 2007..2009. Esta pesquisa apresentará páginas sobre a Ivete entre os anos 2007 e 2009.
Site específico. Busca um termo em determinado site. Exemplo: gripe site:saude.gov.br.
Referências. Busca páginas que fazem referência para outra. Exemplo: link:educacional.com.br.
Filmes e músicas. Realiza busca por filmes e músicas. Exemplo: movie:nenhum a menos, music:viva la vida.
Tipos específicos. Busca determinados tipos de arquivo. Exemplo: educação filetype:ppt.
Local da busca. Permite que a consulta aconteça na área determinada: intitle - busca no título; inurl - busca no endereço da página; intext - busca no corpo texto; inachor - busca nos marcadores do corpo do texto. Exemplo: intitle:congresso, inurl:foto.
Imagem de pessoa. Busca somente imagens de pessoas. Para isso, é preciso adicionar o código &imgtype=face no final da URL de uma página que exibe os resultados de uma pesquisa no Google Imagens.

Embora os exemplos apresentados aqui se refiram ao Google, existem formas semelhantes para proceder em outros sites de busca.

Diretório

O diretório é uma espécie de catálogo de conteúdos organizados hierarquicamente por assunto. Abaixo, seguem os diretórios do Google.

Selecionando a categoria “Notícias e Mídia”, são abertas novas categorias: Clipping, Jornais, Rádio, Revistas, Televisão, etc. Ao clicar em uma destas subcategorias, são abertas outras, e assim por diante até se chegar ao nível de especialização desejado, com uma determinada quantidade de páginas classificadas neste nível.

Relevância

Os resultados de uma consulta são organizados em várias páginas. Alguns sites de busca apresentam vinte resultados em cada página. Pesquisas apontam que a maioria dos internautas que fazem consultas na web não chegam a visitar a segunda página de resultados. Ou seja, apenas os primeiros vinte resultados são visitados.
Essas primeiras páginas são as melhores? Afinal, o que define quais páginas serão apresentadas primeiro?
Isso depende da lógica usada por cada sistema de busca. Dadas as páginas que atendem aos critérios especificados, o sistema de busca define a ordenação delas de acordo com:

  • Número de páginas que referenciam àquela página encontrada. Se muitas outras páginas apresentam link para ela, isso indica que, provavelmente, é uma página de qualidade.
  • Número de ocorrências das palavras-chaves na página. Alguns sistemas de busca determinam um limite para estas ocorrências para evitar que os autores das páginas repitam as palavras-chaves na página apenas para lhe atribuir maior relevância.
  • Proximidade entre as palavras pesquisadas.
  • Número de ocorrências das palavras-chave no título, subtítulo e nas primeiras linhas da página.
  • Parcerias comerciais.

A maioria dos sistemas de busca não revela qual critério usa para que possa garantir a imparcialidade da classificação dos resultados.

CONSIDERAÇÕES FINAIS

Já ouvi vários professores e outros profissionais da Educação criticarem a pesquisa na Internet. Segundo eles, os alunos simples copiam o que encontram e entregam o trabalho como se o professor não fosse perceber o plágio. Não sejamos esquecidos. Independentemente da época em que estudamos, provavelmente, nós ou nossos colegas fizeram algo semelhante. Afinal de contas, quem não ouviu a professora reclamar, sorrindo: “O Joãozinho copiou tanto que escreveu assim ‘não vamos nos aprofundar nas características do caule porque elas já foram abordadas na página 102’”.
A diferença está no trabalho que isso deu. Tínhamos que ir a uma biblioteca, encontrar um pesado volume de uma enciclopédia com o assunto em questão e passar a tarde inteira copiando. Nada de televisão, nada de bola, nada de conversa com os amigos naquele dia. Realmente frustrante!
Prefiro atribuir a reclamação dos professores a uma certa inveja por não terem vivido nesta época de “facilidades” a atribuir à falta de criatividade na elaboração dos trabalhos e ao comodismo na sua correção.
Os sistemas de busca, disponíveis na internet, modernizaram o acesso às informações, mas tornaram o plágio ainda mais fácil. Alguns alunos não se dão ao trabalho de dispor de maneira diferente as informações encontradas e as imprimem do próprio site onde as encontraram.
É preciso rever a forma de solicitar pesquisas. O primeiro passo é selecionar e indicar os sites que devem ser pesquisados. Dois motivos para isso:

  • Vamos lembrar que nem todo conteúdo da internet é correto. Imagine se o aluno baseia sua pesquisa em um site com conteúdo incorreto. Mesmo que tenha procurado fazer o trabalho de forma correta, sem plágio, ele talvez ainda não tenha conhecimento suficiente para discernir se o conteúdo é coerente ou não.
  • Indicando sites, pressupõe-se que o professor conheça o conteúdo deles. Isso inibe o aluno a copiar literalmente o que leu.

O segundo passo é solicitar que o aluno analise as informações consultadas. É sempre bom incluir pedidos como: "Faça uma análise...", "Procure descobrir os motivos..." ou "A que conclusão podemos chegar...".
Terceiro e definitivo passo. Lembre-se: aluno é aluno. Se você mudar de lado, talvez, tenha as mesmas tentações de copiar informações que estão ali tão facilmente disponíveis. É obrigação do professor criar motivações para que o aluno tenha prazer na pesquisa. Não espere que ele abandone o comodismo se o professor não fez isso ainda.

REFERÊNCIAS BIBLIOGRÁFICAS

BARRETO, Juliano. Google. Em Info Exame, n. 271, set/2008.
MOURA, Gevilacio Aguiar Coêlho de. Sistemas de busca da web. Disponível em http://www.quatrocantos.com/tec_web/sist_busca/, acessado em 20 de maio de 2009.
PORTAL EDUCACIONAL. Manual da pesquisa eficiente. Disponível em http://www.educacional.com.br/pesquisa/swf/manualPesquisa.htm, acessado em 20 de maio de 2009.
TUGA. Dicas para pesquisa no Google. Disponível em http://www.mundodastribos.com/dicas-para-pesquisa-no-google.html, acessado em 20 de maio de 2009.

Basta acessar http://registro.br/estatisticas.html para verificar o valor atualizado.

Uniform Resource Locator - Localizador Universal de Recursos.

Autor: Amanda Pereira Cunha
Mestra em Informática (UFAM) e consultora em Tecnologia Educacional (Positivo Informática).