Quem ainda se lembra da primeira versão do Sapo? Tudo era diferente e mais rudimentar, desde o logótipo, aos links disponíveis, passando pela quantidade de destaques em página. Graças ao Arquivo da Web Portuguesa é possível consultar novamente a primeira versão deste motor de pesquisa, datada de 1996.
O primeiro site do jornal Público e do Diário de Notícias, o site da Expo 98 e do Euro 2004 são apenas algumas das outras páginas desaparecidas do ciberespaço que se podem reviver neste arquivo que funciona como um museu da web portuguesa, à semelhança do que acontece com o Internet Archive.
O Arquivo da Web portuguesa é composto por todos os conteúdos alojados sob o domínio .PT e outros classificados como de manifesto interesse para a comunidade portuguesa. Qualquer pessoa pode sugerir o arquivo de sites com conteúdo relevante, através da página http://arquivo.pt/sugerir.
O projeto contém, neste momento, quase de 1.600 milhões de ficheiros arquivados da Web, desde 1996 (45 TeraByte). Este sistema é composto por 61 servidores, somando um total de 1,8 TeraByte de memória, 122 processadores (488 cores) e 340 discos (370 TeraByte). Todo o software utilizado e desenvolvido é livre e baseia-se em código-aberto.
A plataforma armazena diariamente um conjunto de publicações online, selecionadas em colaboração com a Biblioteca Nacional. Trimestralmente, é ainda feito um arquivo exaustivo de toda a Web portuguesa.
Em comunicado de imprensa, Pedro Veiga, presidente da Fundação para a Computação Científica Nacional, explica que na internet “muitos conteúdos têm uma existência efémera e isso pode ser um problema, sendo que, cerca de 50 por cento dos conteúdos disponíveis hoje, passam a estar indisponíveis passados apenas dois meses e 80 por cento dos conteúdos são alterados ou desaparecem passado um ano”, revela o responsável.
Com a disponibilização de mais este serviço, a FCCN “pretende contribuir para o progresso da Internet portuguesa, dando acesso a conteúdos, muitos deles com qualidade e interesse histórico e que só desta forma poderão estar acessíveis a estudantes, investigadores jornalistas e ao público em geral”, salienta o professor.
[Notícia sugerida por Alexandra Maciel]