Palavras de Sócrates: as vantagens das análises do Público e da minha

Ontem passaram três anos sobre a eleição da maioria absoluta em que se baseia o actual Governo e eu assinalei a efeméride com novo serviço, aplicado aos discursos oficiais do Primeiro Ministro José Sócrates ao longo deste período.
Ontem também sucederam diversos episódios on e offline que me roubaram o tempo para acompanhar o lançamento — há sempre retoques de última hora, ajustes, e também responder às críticas e dúvidas.
Ontem, ainda, o diário Público publicou uma peça jornalisticamente magistral, um regalo para a vista, aquilo que faz um jornalista ficar orgulhoso do seu jornal ou até, como foi o meu caso, de um jornal que não é o meu, mas dá gosto ver.
Duas páginas com uma nuvem de palavras!
É simplesmente notável, ficam os parabéns na pessoa do António Granado, que as poderá transmitir ao Miguel Gaspar.

palavrasjosesocratespublico.jpg

Na edição online figura a menção ao serviço, ou ferramenta, de análise semântica que desenvolvi nas últimas semanas e para o qual tenho recolhido material e indicadores há dois anos. Elaborar uma nuvem de palavras é muito mais complicado do que parece. Esse é, talvez, um dos pontos do seu fascínio. É que simplifica em sinais de fácil assimilação pelo cérebro uma realidade bastante complexa e que de outra forma não se consegue descrever sem sinais igualmente complexos. A agravar a tarefa estão os caracteres especiais do português. Uma das aproximações consiste precisamente em eliminá-los do objecto de estudo antes de iniciar o estudo…
Pouco elegante, diria eu – e sei que o meu amigo Miguel Vitorino concorda: ele está, até, mais adiantado que eu nesta matéria.

Os dois trabalhos não concorrem um com o outro. Partem da mesma base teórica — eliminar as common words e os tempos verbais, agrupar logicamente palavras (português, portuguesa, portugueses e portuguesas agrupam-se debaixo de um só conceito, Portugal) — mas daí para a frente distiguem-se. Não são comparáveis nem nos meios de reprodução (papel / online), nem no âmbito de publicação (fixa / evolutiva). Mas a benefício do inventário, porque esta é uma nova ferramenta de perspectivar o real e o público e os jornalistas portugueses ainda estão num estádio inicial de relação com ela, aqui deixo um quadro que permite, espero, compreendê-las melhor.

meu quadro das palavras de jose socrates

Diferenças e vantagens

Tweets

Debate

This website uses IntenseDebate comments, but they are not currently loaded because either your browser doesn't support JavaScript, or they didn't load fast enough.

9 opiniões no artigo “Palavras de Sócrates: as vantagens das análises do Público e da minha”

    1 domelhor.net em 21 Fev 08 10:08

    Os discursos de Socrates: 2 abordagens diferentes…

    3 anos aps a eleio de Socrates duas iniciativas surgiram para analisar as palavras dos primeiro-ministro em nuvem de tags: os discursos do primeiro-ministro http://tubaraoesquilo.pt/jose-socrates-discurso-directo/ e um trabalho do publico
    http://jorna...

    2 Andrezero em 21 Fev 08 13:53

    Parabéns.

    Fico extasiado quando projectos destes saem cá para fora.

    Eu tenho dois projectos “semânticos”. Um, mais profissional, de publicação (uma espécie de cms extrovertido) e o outro, mais experimental, de social-bookmarking/agregação com um engine semântico.

    3 Paulo Querido em 21 Fev 08 14:40

    Caro André, obrigado. Engines semânticos, com ou sem aspas, interessam-me, tem um link? Não encontrei no seu blogue.

    4 Pedro em 21 Fev 08 15:11

    Parabéns pelo projecto. Excelente!
    Acho apenas que o termo “semântico” não é bem aplicado. É “apenas” uma análise estatística dos termos mais usados ;)

    5 Paulo Querido em 21 Fev 08 15:22

    Caro Pedro, obrigado.
    Eu tive dúvidas no emprego do termo semântico, que me parecia um pouco excessivo. Recorri aos dicionários antes de me atrever ao seu emprego num projecto desta natureza.

    Na linguística moderna a semântica é a disciplina que estuda as palavras e os enunciados como sendo objectos abstractos com um conjunto de propriedades e entre os quais se estabelecem relações que se definem nos termos predicação, tempo, aspecto, modalidade, valores de verdade, etc. (cito do Priberam, bem sei que não é um grande dicionário, mas nisto está correcto e concordante com outras fontes).
    Também o Ciberdúvidas me ajudou: http://www.ciberduvidas.com/montra.php?id=71

    Não sei se é bem ou mal aplicado, caberá aos linguistas afirmarem-no — mas sei que a ferramenta tem valor (crescente à medida que for melhorando os algoritmos) para o estudo semântico de um conjunto de textos.

    6 Andrezero em 21 Fev 08 17:20

    Quanto a mim (que não sou linguístico) o termo é muito bem aplicado. Mesmo no sentido da linguística moderna estes algoritmos já evidenciam (e valorizam!) uma série de relações relevantes, ficando outras implícitas.

    Este pequeno artigo: http://en.wikipedia.org/wiki/Semantics#Computer_science abre outas portas para o conceito e este mais ainda: http://en.wikipedia.org/wiki/Semantic_Web

    Não acredito na web-semântica como uma realidade a curto prazo, mas começam a aparecer projectos que “materializam” esse potencial.

    Quanto aos meus projectos, pois… chamemos-lhe sketches, que até terão pernas para andar mas que por enquanto não têm braços para trabalhar.

    7 arl em 22 Fev 08 00:47

    Antes de mais, Parabéns pela ideia e pela Coragem!

    Meteu-se num campo que os psicólogos (sociais ou das organizações) designam por “Análise de Conteúdo”… que é bastante mais que a linguística; “é um conjunto de técnicas de análise das comunicações”.
    Eu estou agora a iniciar esse caminho pelo que de pouca ajuda lhe posso servir. De qualquer modo gostaria de referir que, este seu post , parece pretender ir além da referida análise de conteúdo, na medida em que se pretende a tal “nuvem” diacrónica mas, além disso, o Paulo terá ojectivos críticos e assim envereda pela “análise crítica do discurso” que, julgo, será a forma mais adequada (no seu caso) de análise de conteúdo. Talvez (também) por essa razão se depare com tantas dificuldades de categorização, embora essa seja, de facto, a etapa mais delicada e difícil de qualquer análise de conteúdo, parece-me.

    No livro “Análise de Conteúdo” de Laurence Bardin (a edição original francesa data de 1977,mas as Edições 70 publicaram uma tradução em 1995), encontrará explicações que o ajudarão, caso ainda não conheça.

    Mais uma vez parabéns e muita força para essa “Empreitada”…rsrs

    8 Paulo Querido em 22 Fev 08 01:04

    Caro arl, obrigado.
    Uma correcção: com aquela ferramenta quis apenas disponibilizar um serviço, que tenciono manter e fazer evoluir por o achar importante, sobretudo num meio com excesso de carga informativa e com uma velocidade de publicação de informação incomportável para as nossas antigas medidas.
    É, como disse, uma ferramenta que pretende ajudar à análise de conteúdo, não apenas semântica. Não tenho objectivos críticos à priori, para já concentro-me nos aspectos básicos da medição e comparação e no que ressalta das diferenças.
    A categorização…. isso é tema para teses. No meio online não podemos ficar espartilhados no tipo de categorização que se apurou para o meio papel e que já tinha falhado para arrumar o audiovisual. Há lições e a experiência (dos bibliotecários, nomeadamente) é fundamental, mas sem espírito aberto a, entre outros, a categorização espontânea (o tagging do social bookmarking, etc), nem vale a pena começar.
    A empreitada continuará, obrigado.

    9 arl em 22 Fev 08 01:51

    Obrigada pela sua resposta. Percebi esse objectivo de serviço, ainda que tenha sido omissa , mas agradeço a sua correcção.
    De facto ainda funciono muito “em papel”, daí algumas (bastantes!) omissões.
    Apesar de profissionalmente não poder desviar-me de uma categorização tão rigorosa quanto possível, nada tenho contra a categorização espontãnea como compreenderá, apenas me solidarizei e congratulei com tamanho risco/aventura, porque é disso que se trata. Sobretudo em discurso político,onde as palavras podem ter tantos sentidos quantos os ouvidos/olhos que as codificam e as descodificam.
    Se a categorização “formal” é difícil e delicada, parece-me ainda mais “arrojada” , se quizer, Corajosa (!), a espontânea .
    Óbvio que tem objectivos críticos! só lhe ficam bem…!!! (ainda não nos prendem por termos opinião..que eu saiba…rsrsrs)
    Aguardo novos discursos.

Textos mais recentes

ACERCA
mini fotografia paulo querido Olá, o meu nome é Paulo Querido e Certamente! é o meu webzine pessoal. Sou consultor de new media, jornalista e escrevo livros e artigos (e também algum código) sobre a net e na net desde 1989. (Mais)

Como ler

Certamente! é distribuído em vários canais.
edição diária por e-mail
Pelo Twitter
Por RSS
Google
Bloglines
no Yahoo!
no seu leitor


http://www.wikio.fr