From 30adfc52f7f004cc5b253b689870149d0e29ec74 Mon Sep 17 00:00:00 2001 From: Tiago Carreira Date: Fri, 18 Oct 2024 19:55:06 +0100 Subject: [PATCH] incumprimento www.sg.pcm.gov.pt --- README.md | 1 + scripts/53-sg-pcm-gov.sh | 24 ++++++++++++++++++++++++ 2 files changed, 25 insertions(+) create mode 100755 scripts/53-sg-pcm-gov.sh diff --git a/README.md b/README.md index 8380793..d563988 100644 --- a/README.md +++ b/README.md @@ -38,6 +38,7 @@ Esta tabela mostra casos de incumprimento do regulamento: | https://bud.gov.pt/ | Documento em .doc | [página com formulário em .doc, sem outra alternativa](https://bud.gov.pt/ddn/dispensa/requerer.html) | 2024/10/17 | | | https://www.dgeg.gov.pt/ | Documentos em .xlsx | [página com documentos em formato XLSX, sem outra alternativa](https://www.dgeg.gov.pt/pt/estatistica/energia/petroleo-e-derivados/vendas-mensais/) | 2024/10/17 | | | https://covid19.min-saude.pt | Documentos em .xlsx | [página com documentos em formato XLSX, sem outra alternativa](https://covid19.min-saude.pt/numero-de-novos-casos-e-obitos-por-dia/) | 2024/10/13 | | +| https://www.sg.pcm.gov.pt/ | Documentos em .docx | [Todos os documentos necessários ao pedido de Estatuto de Utilidade Pública estão em .docx](https://www.sg.pcm.gov.pt/servicos/fundacoes-e-entidades-de-utilidade-publica/) | 2024/10/18 | | Este [template](template.txt) é utilizado pela ANSOL e pela Comunidade LibreOffice Portugal para enviar um pedido de resolução do problema. diff --git a/scripts/53-sg-pcm-gov.sh b/scripts/53-sg-pcm-gov.sh new file mode 100755 index 0000000..efac6c0 --- /dev/null +++ b/scripts/53-sg-pcm-gov.sh @@ -0,0 +1,24 @@ +#!/bin/bash + +urls=$(for item in $(wget https://www.sg.pcm.gov.pt/servicos/fundacoes-e-entidades-de-utilidade-publica/ -o /dev/null -O - | hxnormalize -x -l 1000 | hxselect .file | hxselect a -s'\n'); do echo "$item" | grep href ; done | cut -d\" -f2); + +nurls=$(echo "$urls" | grep -v '^$' | wc -l); +ndocx=$(echo "$urls" | grep -v '^$' |grep -c -v docx); + +if [ "$nurls" -eq "0" ]; then + echo "sg.pcm.gov.pt: não foram encontrados urls, script não deve estar a funcionar correctamente."; + echo "DEBUG:" + wget https://www.sg.pcm.gov.pt/servicos/fundacoes-e-entidades-de-utilidade-publica/ && cat index.html && rm index.html +elif ! [ "${nurls}/${ndocx}" = "8/4" ]; then + echo "sg.pcm.gov.pt: existiam 4/8 endereços em .docx, e agora são ($ndocx/$nurls). Verificar se incumprimentose mantem"; + echo "NOTA: tentaste isto vindo dos IPs do github? Se sim, provavelmente bateste num 405 Method Not Allowed..."; +else + echo "sg.pcm.gov.pt: Incumprimento mantém-se, há ($ndocx/$nurls) endereços em .docx" + echo "a actualizar o README (faça um git diff, valide, e commit!)"; + while IFS='' read -r line || [[ -n "$line" ]]; do + test "$(echo "$line"|grep -v -c "sg.pcm.gov.pt")" -eq "1" \ + && echo "$line" \ + || (h=$(echo "$line"|cut -d\| -f1-4); t=$(echo "$line"|cut -d\| -f6-); nc=$(echo "$line"|cut -d\| -f5 | wc -m); printf "%s| %-$((nc-2))s|%s\n" "$h" "$(date +%Y/%m/%d)" "$t"); + done < README.md > new + mv new README.md +fi