# Saca-sapos Projecto de arquivar o videos.sapo.pt antes que desapareça (17 de setembro) Endereço do site com informação de como ajudar: ## Componentes ### Crawler scripts Um bando de scripts para descobrir o máximo de video-ids possível. É composto pelos ficheiros `.sh`. ### Servidor de coordenação Um servidor que mantém e distribui video-ids para quem quiser ajudar a preservar a coisa descarregando os vídeos. Escolhe N vídeos aleatórios, e vai mantendo um registo dos file sizes + sha256 dos vídeos descarregados. ### Programa de descarregamento O programa que pede ao servidor um bando de video-ids e os descarrega. É só ficheiro `saca-sapos`. ### Base de dados de video-ids e metadados Antes estava aqui neste repositório um videos.csv e um videos.jsonl, mas isso empatou o servidor de git por completo. Vou mandar isso para outro lado _soon™_.