sábado, junho 11

Construir um bot

Muita gente descobriu a existência dos blogues através do Abrupto. O blogue de Pacheco Pereira transformou-se rapidamente na porta de entrada da blogosfera portuguesa. A forma mais simples de descobrir blogues era entrar no Abrupto e olhar para as Referring Web Pages que se encontram nas ultimas linhas do blogue. O Prozacland também tem este sistema de intercambio entre blogues. Sempre que um blogue tem um link para o Prozacland e alguem o usa, esse blogue é aqui anunciado. É uma forma de pagar anuncios com anuncios e estimular os outros blogues a colocarem links para o nosso. Como as referring web pages do Abrupto tinham centenas de referencias só os blogues que apareciam nos primeiros lugares da lista tinham uma possibilidade séria de chamar a atenção dos blogonautas. Blogues com tráfico médio de trinta pessoas por dia "enviavam" em algumas horas cem visitantes para o Abrupto... Havia portanto que clicar umas centenas de vezes no link do nosso blogue para o Abrupto. Algums bloggers faziam-no sistematicamente todas as semanas. Não sei se o faziam à mão ou não. Uma forma menos trabalhosa de o fazer é construir um bot que o faça por nós. Pacheco Pereira desligou as suas referring web pages no segundo aniversário do seu blogue.

Nos tempos aureos da bolsa um amigo meu construiu um bot com meia dúzia de linhas de código que ia buscar todos os dias os gráficos da cotações de cinquenta acções em alguns segundos. Fazer esses downloads à mão levava cerca de uma hora.

Estas são algumas das muitas tarefas que um bot pode desempenhar. Como não podemos "comprá-lo feito", temos de o construir. Para construir um bot, temos de aprender uma linguagem de programação. As mais conhecidas são REBOL, PHP & PERL.

A REBOL é a mais fácil de aprender, pois apresenta uma linguagem unificada para vários protocolos da internet: HTTP (navegação na net), FTP (envio de ficheiros), e os muitos protocolos para o envio de mensagens, escondendo do programador os detalhes destes protocolos (inconveniente quando se quer ganhar controle sobre esses mesmos detalhes); permite escrever programas interessantes com poucas linhas de código; possui uma linguagem de parsing poderosa. Só a versão completa, bastante cara, permite interacção total com o computador e com bases de dados.

Já agora, quando quiser compreender algum termo mais tecnico ligado à internet, tipo http, ftp e nntp, consulte a Webopedia.

PHP & PERL são linguagens livres que funcionam em diversas plataformas (windows, o unix, o mac, etc), com uma grande base de utilizadores. É bastante mais facil encontrar programas em PERL que possamos adaptar às nossas necessidades. Estas linguagens são mais dificeis de aprender.

Convém aprender alguns detalhes sobre a escrita de documentos em HTML (ver o b-a-ba na secção HTML and XML tutorials) assim como alguns detalhes sobre o protocolo HTTP, (ver o livro OReilly - HTTP Pocket Reference.chm). Ver detalhes tecnicos nos comentários.

AD

11 comentários:

on disse...

Inconvenientes do Rebol, de um ponto de vista mais tecnico:
Não suporta expressões regulares, nem matrizes relacionais (i.e. matrizes em que as entradas sejam strings).
Não suporta a linguagem DOM 2 API. Esta linguagem é uma forma de interagir com um documento HTML, em que este é visto como uma árvore; o grande valor acrescentado é que esta permite contruir scripts resistentes a pequenas alterações do código HTML, permitindo mesmo emular, de uma forma relativamente fácil, a forma como os humanos comparam documentos semelhantes.

AD

sara monteiro disse...

As coisas incríveis que se escrevem neste blogue! Muitas vezes não percebo nada, como agora, mas isso é problema meu, claro.

on disse...

O que é que não percebeu?
Para ler este post convem ler primeiro o post sobre
bots.
Um bot é um programa que executa tarefas na net. O post sobre bots é menos especializado. Todos os frequentadores da net deviam saber algo sobre os robots que percorrem a net. Este dá uma dicas sobre o que é preciso fazer para construir um bot.

sara monteiro disse...

Acha então que todos os frequentadores deviam saber algo sobre os robots que percorrem a net? Só isto me espanta. Há então robots que percorrem a net? Sabe, é que eu estou no grau zero disto tudo. A maneira como eu consigo comentar é um mistério para mim. Mas também é verdade que há blogues onde os meus comentários não entram e nem isso eu consigo resolver. No entanto, acho o seu blogue extraordinário. Li um post seu fascinante sobre as supercordas e fico maravilhada com os seus conhecimentos sobre zen. Estudou no Japão? Invejo-o.
Tenho comentado aqui com vários nomes. :)

wind disse...

coisas incríveis!lololol

on disse...

Cara Sara,
muitas das pessoas que passam por aqui escrevem num blog. Por exemplo, a Wind, mais virada para a poesia do que para a ciência, tem um blogue com referring web pages. Pelo menos para essas pessoas a primeira parte do post do AD deve fazer sentido.
J´s experimentou ir ao fundo da página e clicar numa palavra e ver onde vai parar?

sara monteiro disse...

On,

Por favor! Não se preocupe com o que eu percebo ou deixo de perceber. O meu comentário era uma brincadeira COMPLETAMENTE AMIGÀVEL e despreocupada. Não desejo desvender a internet mais do que o básico. Pelo menos por agora. Se um dia estiver interessada logo perguntarei. :)

Anónimo disse...

Olá ON,

quanto às linguagens, esqueceste-te de referir o Python (as in Monty) entre as principais para estas brincadeiras. Ao menos não é tão feio como o PERL :)

A.

PS: O tal script da bolsa ainda hoje funciona! :)

Anónimo disse...

best regards, nice info
Toyota car care

Anónimo disse...

I have been looking for sites like this for a long time. Thank you! » » »

Anónimo disse...

Enjoyed a lot! »