web-ansol.org/2016-05-13-date-with-data-8.md at d5845652f5f8ab3e03b37acd5f523c0e159f5b12

ansol/web-ansol.org

Fork 0

mirror of https://gitlab.com/ansol/web-ansol.org.git synced 2024-11-22 14:21:31 +00:00

Hugo Peixoto e6c9190dde Add imported content

2021-09-23 23:46:28 +01:00

1.6 KiB

Raw Blame History

categories

metadata

layout

title

created

date

event_site

event_start

slide

node_id

event_site_url	event_site_title	event_site_attributes
http://datewithdata.pt/		a:0:{}

event_start_value	event_start_value2
2016-05-13 23:00:00.000000000 +01:00	2016-05-13 23:00:00.000000000 +01:00

slide_value
0

422

evento

Date With Data #8

1463154274

2016-05-13

Um ano depois do Puré de Notícias, voltamos a dedicar a nossa atenção ao texto. Os debates do Parlamento, um dataset que recolhemos e compilámos (usado no Demo.cratica), constituem uma base riquíssima para explorações semânticas da língua portuguesa. A curiosidade científica e precisa não é a nossa maior preocupação: gostamos de experiências e projetos alternativos como o gerador de haikus a partir dos debates do parlamento canadiano.

A transcrição que começámos do guia de conversação português/inglês English as She is Spoke, vem também encaixar nesta linha de experimentação textual que temos trilhado e que vamos continuar a explorar.

O Diário da República é outra fonte enorme de texto burocrático que queremos tomar como plasticina para moldar em formatos curiosos, usando ferramentas e recursos como NLP, machine learning, correntes de Markov e outras maquinações. Se estes termos são alienígenas para ti, porque não aparecer para ficares a saber os usos criativos e interessantes que se podem dar a corpos de texto de todo o género?

1.6 KiB Raw Blame History

1.6 KiB

Raw Blame History