Um dos principais temas que surgem sempre que discutimos como os dados e informações podem impactar negativamente a sociedade são as famosas fake news, ou notícias falsas publicadas com o intuito de redirecionar o discurso público ou a atenção da população. Já falamos algumas vezes aqui no blog sobre esse assunto, e de porque esse tipo de notícia chama tanto a atenção das pessoas. Esse tipo de conteúdo é caracterizado principalmente pela sua falsidade: o texto é comprovadamente falso, com fatos mentirosos ou inventados, independente da razão pela qual tenha sido construído.

As fake news, no entanto, são só uma pequena parte do espectro da chamada “poluição informacional”. Em linhas gerais, podemos pensar na poluição informacional como a desinformação levada ao extremo. Uma combinação de conteúdos falsos, redundantes, sem sentido, distorcidos ou apresentados fora de contexto, gerada e divulgada para contaminar as fontes de informação utilizadas pelas pessoas em seu dia-a-dia. O objetivo final da geração dessa poluição é, como sempre, de reduzir a confiança das pessoas nas fontes de informação fidedignas, permitindo assim o direcionamento de opiniões e a distorção de narrativas para atender à interesses específicos.

E, do mesmo jeito que as máquinas e fábricas eram as grandes poluentes da revolução industrial original, as máquinas e fábricas informacionais – inteligências artificiais, modelos e processos de tratamento de informação automatizados – são os geradores da poluição nessa nova era.

 

Máquinas de informação 

Não é surpresa para nenhum leitor desse blog que o volume de informações produzido pela humanidade cresce exponencialmente a cada dia que passa. O crescimento do volume de dados sozinho já cria um grande problema de análise de dados. Quanto maior é a quantidade de informações que temos que analisar, menor a probabilidade de encontrarmos elementos relevantes – sinais – dentro do mar de dados disponível – o “barulho”. Essa relação entre sinais e barulho é conhecida como o “signal-to-noise ratio”, e é um tema central em discussões de teoria da informação, criptografia e assuntos relacionados, além da sua aplicação óbvia no contexto de análise de dados.

Nesse contexto, as plataformas de comunicação digital que utilizamos hoje – mídias sociais, aplicativos de mensagens, fóruns e outras ferramentas – atuam não só como geradoras de conteúdo adicional, mas também, por causa da natureza da internet, como amplificadoras de conteúdo publicado em outros lugares. Se a primeira função (publicação), sozinha, já é capaz de piorar significativamente a qualidade dos dados, a segunda (amplificação) transforma essas plataformas nas maiores poluentes do mundo do ponto de vista da informação.

O poder dessas plataformas não passa desapercebido. Não é à toa que quase todo mês vemos notícias de sites como o Facebook e o Twitter bloqueando centenas ou milhares de contas falsas, operadas com o simples propósito de espalhar desinformação. A capacidade de amplificação de mensagens e de tornar o barulho de fundo mais potente do que os sinais verdadeiros para grande parte da população faz com que essas plataformas sejam os vetores selecionados para a disseminação de poluição informacional por praticamente todos os atores interessados em manipular o discurso público e as narrativas que aparecem na mídia.

E, como se esse mero poder de amplificação da desinformação não fosse o suficiente, temos agora algoritmos de geração de linguagem natural, como o GPT-3, capazes de automatizar até a produção de conteúdo. Mesmo que o conteúdo sendo gerado não seja falso, a automação do processo completo de produção até a postagem do conteúdo online pode ser utilizada para manipular não só a opinião das pessoas, mas o processo democrático em si. Pense, por exemplo, em uma consulta pública sobre uma legislação: com as ferramentas disponíveis hoje, seria trivial para um programador desenvolver um processo automatizado para emitir diversas opiniões contrárias (ou favoráveis) à lei, e postar as mesmas dezenas de milhões de vezes nos sites do governo.

A mesma estratégia pode ser utilizada para inundar qualquer ambiente aonde o conteúdo gerado pelos usuários é um sinal relevante na tomada de decisão dos outros: reviews tendenciosos de produtos e de vendedores, comentários e postagens direcionadas em mídias sociais, postagens defendendo ou atacando um ponto de vista em blogs e fóruns, reclamações falsas sobre empresas. As possibilidades são ilimitadas, e a nossa capacidade de lutar contras as mesmas, praticamente inexistente.

 

Conclusão

A poluição informacional muitas vezes acaba sendo aceita e replicada pelo público em geral, especialmente quando contém um pequeno grão de verdade misturado ou distorcido. Ao ganhar espaço, esses conteúdos acabam reduzindo a confiança das pessoas nas instituições  e fontes de informação tradicionais, e, assim, erodindo a base da sociedade. Seu risco vai muito além das fake news, e é fundamental para todas as pessoas que trabalham com dados e informações entender como esse fenômeno funciona e se espalha, bem como seus impactos.

BigDataCorp