Palavras de Sócrates: as vantagens das análises do Público e da minha
Ontem passaram três anos sobre a eleição da maioria absoluta em que se baseia o actual Governo e eu assinalei a efeméride com novo serviço, aplicado aos discursos oficiais do Primeiro Ministro José Sócrates ao longo deste período.
Ontem também sucederam diversos episódios on e offline que me roubaram o tempo para acompanhar o lançamento — há sempre retoques de última hora, ajustes, e também responder às críticas e dúvidas.
Ontem, ainda, o diário Público publicou uma peça jornalisticamente magistral, um regalo para a vista, aquilo que faz um jornalista ficar orgulhoso do seu jornal ou até, como foi o meu caso, de um jornal que não é o meu, mas dá gosto ver.
Duas páginas com uma nuvem de palavras!
É simplesmente notável, ficam os parabéns na pessoa do António Granado, que as poderá transmitir ao Miguel Gaspar.
Na edição online figura a menção ao serviço, ou ferramenta, de análise semântica que desenvolvi nas últimas semanas e para o qual tenho recolhido material e indicadores há dois anos. Elaborar uma nuvem de palavras é muito mais complicado do que parece. Esse é, talvez, um dos pontos do seu fascínio. É que simplifica em sinais de fácil assimilação pelo cérebro uma realidade bastante complexa e que de outra forma não se consegue descrever sem sinais igualmente complexos. A agravar a tarefa estão os caracteres especiais do português. Uma das aproximações consiste precisamente em eliminá-los do objecto de estudo antes de iniciar o estudo…
Pouco elegante, diria eu – e sei que o meu amigo Miguel Vitorino concorda: ele está, até, mais adiantado que eu nesta matéria.
Os dois trabalhos não concorrem um com o outro. Partem da mesma base teórica — eliminar as common words e os tempos verbais, agrupar logicamente palavras (português, portuguesa, portugueses e portuguesas agrupam-se debaixo de um só conceito, Portugal) — mas daí para a frente distiguem-se. Não são comparáveis nem nos meios de reprodução (papel / online), nem no âmbito de publicação (fixa / evolutiva). Mas a benefício do inventário, porque esta é uma nova ferramenta de perspectivar o real e o público e os jornalistas portugueses ainda estão num estádio inicial de relação com ela, aqui deixo um quadro que permite, espero, compreendê-las melhor.
Diferenças e vantagens
- o levantamento do Público é one stand, está publicado no papel, o meu persegue o objectivo de se actualizar sempre que haja um novo discurso
- o trabalho do Público está melhor alicerçado teoricamente, o meu está atrasado ao nível da identificação das palavras comuns (mas lá chegará
) - o levantamento do Público prospecciona os discursos de três anos como um único objecto, o modelo que eu estou a construir adapta-se a analisar diacronicamente e/ou sectorialmente cada um dos discursos, isolados ou agrupados conforme a necessidade
- no levantamento fixo, publicado em papel, as palavras diferenciam-se pelo tamanho, que denota a frequência, enquanto no levantamento online, dinâmico, é acrescentado o factor tempo e introduzida uma nuance de cor; isto permite aos olhos identificarem num instante os padrões que Sócrates foi adoptando e abandonando ao longo destes três anos
- e a maior e mais decisiva diferença e simultaneamente vantagem: publicado em papel e em PDF, a nuvem de palavras do Público é de uma espectacularidade não reproduzível no monitor — mas é fixa, enquanto a minha, menos espectacular, ao ser programada num webservice permite “navegar” no tempo, para a frente e para trás nos discursos e respectivas nuvens, analisando as tendências
Acções
Guardar/partilhar:
Facebook
Twitter
delicious.com
DoMelhor
Assinar publicação:
feed RSS
e-mail diário
Debate
Ainda sem opiniões no artigo “Palavras de Sócrates: as vantagens das análises do Público e da minha”
Deixe a sua opinião
Textos mais recentes
- The last laugh – If self-published writers owned the midlist #LerComCalma (mais 2 links) em 3 de Setembro de 2010
- Top 10 – Richest Men (of All Time) (mais 1 link) em 1 de Setembro de 2010
- Regras de análise económica para a oposição (segundo João Miranda) em 31 de Agosto de 2010
- As (importantes) mudanças no USA Today, segundo maior diário americano em 30 de Agosto de 2010
- We Dont Hate You – Dear America… (mais 1 link) em 30 de Agosto de 2010



Olá, o meu nome é Paulo Querido e Certamente! é o meu webzine pessoal. Sou consultor de new media, jornalista e escrevo livros e artigos (e também algum código) sobre a net e na net desde 1989. (
Siga o feed RSS
Receba a edição diária por e-mail
Os discursos de Socrates: 2 abordagens diferentes…
3 anos aps a eleio de Socrates duas iniciativas surgiram para analisar as palavras dos primeiro-ministro em nuvem de tags: os discursos do primeiro-ministro http://tubaraoesquilo.pt/jose-socrates-discurso-directo/ e um trabalho do publico
http://jorna...
Parabéns.
Fico extasiado quando projectos destes saem cá para fora.
Eu tenho dois projectos “semânticos”. Um, mais profissional, de publicação (uma espécie de cms extrovertido) e o outro, mais experimental, de social-bookmarking/agregação com um engine semântico.
Caro André, obrigado. Engines semânticos, com ou sem aspas, interessam-me, tem um link? Não encontrei no seu blogue.
Parabéns pelo projecto. Excelente!
Acho apenas que o termo “semântico” não é bem aplicado. É “apenas” uma análise estatística dos termos mais usados
Caro Pedro, obrigado.
Eu tive dúvidas no emprego do termo semântico, que me parecia um pouco excessivo. Recorri aos dicionários antes de me atrever ao seu emprego num projecto desta natureza.
Na linguística moderna a semântica é a disciplina que estuda as palavras e os enunciados como sendo objectos abstractos com um conjunto de propriedades e entre os quais se estabelecem relações que se definem nos termos predicação, tempo, aspecto, modalidade, valores de verdade, etc. (cito do Priberam, bem sei que não é um grande dicionário, mas nisto está correcto e concordante com outras fontes).
Também o Ciberdúvidas me ajudou: http://www.ciberduvidas.com/montra.php?id=71
Não sei se é bem ou mal aplicado, caberá aos linguistas afirmarem-no — mas sei que a ferramenta tem valor (crescente à medida que for melhorando os algoritmos) para o estudo semântico de um conjunto de textos.
Quanto a mim (que não sou linguístico) o termo é muito bem aplicado. Mesmo no sentido da linguística moderna estes algoritmos já evidenciam (e valorizam!) uma série de relações relevantes, ficando outras implícitas.
Este pequeno artigo: http://en.wikipedia.org/wiki/Semantics#Computer_science abre outas portas para o conceito e este mais ainda: http://en.wikipedia.org/wiki/Semantic_Web
Não acredito na web-semântica como uma realidade a curto prazo, mas começam a aparecer projectos que “materializam” esse potencial.
Quanto aos meus projectos, pois… chamemos-lhe sketches, que até terão pernas para andar mas que por enquanto não têm braços para trabalhar.
Antes de mais, Parabéns pela ideia e pela Coragem!
Meteu-se num campo que os psicólogos (sociais ou das organizações) designam por “Análise de Conteúdo”… que é bastante mais que a linguística; “é um conjunto de técnicas de análise das comunicações”.
Eu estou agora a iniciar esse caminho pelo que de pouca ajuda lhe posso servir. De qualquer modo gostaria de referir que, este seu post , parece pretender ir além da referida análise de conteúdo, na medida em que se pretende a tal “nuvem” diacrónica mas, além disso, o Paulo terá ojectivos críticos e assim envereda pela “análise crítica do discurso” que, julgo, será a forma mais adequada (no seu caso) de análise de conteúdo. Talvez (também) por essa razão se depare com tantas dificuldades de categorização, embora essa seja, de facto, a etapa mais delicada e difícil de qualquer análise de conteúdo, parece-me.
No livro “Análise de Conteúdo” de Laurence Bardin (a edição original francesa data de 1977,mas as Edições 70 publicaram uma tradução em 1995), encontrará explicações que o ajudarão, caso ainda não conheça.
Mais uma vez parabéns e muita força para essa “Empreitada”…rsrs
Caro arl, obrigado.
Uma correcção: com aquela ferramenta quis apenas disponibilizar um serviço, que tenciono manter e fazer evoluir por o achar importante, sobretudo num meio com excesso de carga informativa e com uma velocidade de publicação de informação incomportável para as nossas antigas medidas.
É, como disse, uma ferramenta que pretende ajudar à análise de conteúdo, não apenas semântica. Não tenho objectivos críticos à priori, para já concentro-me nos aspectos básicos da medição e comparação e no que ressalta das diferenças.
A categorização…. isso é tema para teses. No meio online não podemos ficar espartilhados no tipo de categorização que se apurou para o meio papel e que já tinha falhado para arrumar o audiovisual. Há lições e a experiência (dos bibliotecários, nomeadamente) é fundamental, mas sem espírito aberto a, entre outros, a categorização espontânea (o tagging do social bookmarking, etc), nem vale a pena começar.
A empreitada continuará, obrigado.
Obrigada pela sua resposta. Percebi esse objectivo de serviço, ainda que tenha sido omissa , mas agradeço a sua correcção.
De facto ainda funciono muito “em papel”, daí algumas (bastantes!) omissões.
Apesar de profissionalmente não poder desviar-me de uma categorização tão rigorosa quanto possível, nada tenho contra a categorização espontãnea como compreenderá, apenas me solidarizei e congratulei com tamanho risco/aventura, porque é disso que se trata. Sobretudo em discurso político,onde as palavras podem ter tantos sentidos quantos os ouvidos/olhos que as codificam e as descodificam.
Se a categorização “formal” é difícil e delicada, parece-me ainda mais “arrojada” , se quizer, Corajosa (!), a espontânea .
Óbvio que tem objectivos críticos! só lhe ficam bem…!!! (ainda não nos prendem por termos opinião..que eu saiba…rsrsrs)
Aguardo novos discursos.