30 lines
911 B
Markdown
30 lines
911 B
Markdown
|
# Saca-sapos
|
||
|
|
||
|
Projecto de arquivar o videos.sapo.pt antes que desapareça (17 de setembro)
|
||
|
|
||
|
Endereço do site com informação de como ajudar: <https://sapo.pxto.pt>
|
||
|
|
||
|
|
||
|
## Componentes
|
||
|
|
||
|
### Crawler scripts
|
||
|
|
||
|
Um bando de scripts para descobrir o máximo de video-ids possível. É composto pelos ficheiros `.sh`.
|
||
|
|
||
|
|
||
|
### Servidor de coordenação
|
||
|
|
||
|
Um servidor que mantém e distribui video-ids para quem quiser ajudar a preservar a coisa descarregando os vídeos.
|
||
|
Escolhe N vídeos aleatórios, e vai mantendo um registo dos file sizes + sha256 dos vídeos descarregados.
|
||
|
|
||
|
|
||
|
### Programa de descarregamento
|
||
|
|
||
|
O programa que pede ao servidor um bando de video-ids e os descarrega. É só ficheiro `saca-sapos`.
|
||
|
|
||
|
|
||
|
### Base de dados de video-ids e metadados
|
||
|
|
||
|
Antes estava aqui neste repositório um videos.csv e um videos.jsonl, mas isso empatou o servidor de git por completo. Vou mandar isso para outro lado _soon™_.
|
||
|
|