Olá leitor, o Dia News utiliza cookies. Ao navegar no nosso site você aceita os termos de utilização.
Plataforma web detecta fake news em português de forma automática
Resultados preliminares indicam que o sistema, criado por pesquisadores ligados ao Centro de Ciências Matemáticas Aplicadas à Indústria da USP, é capaz de identificar notícias falsas com 96% de precisão,
Na atual era de fake news tem sido cada vez mais desafiador distinguir notícias falsas ou falsificadas das reais. Uma plataforma web criada por pesquisadores ligados ao Centro de Ciências Matemáticas Aplicadas à Indústria (CeMEAI) pode facilitar essa tarefa.
Por meio de uma combinação de modelos estatísticos e técnicas de aprendizado de máquina, a plataforma é capaz de predizer a probabilidade de um texto ser fake. Resultados preliminares indicaram que o sistema foi capaz de detectar notícias falsas com 96% de precisão.
“A ideia da plataforma é oferecer à sociedade uma ferramenta adicional para identificar de forma não somente subjetiva se uma notícia é ou não falsa”, diz à Agência FAPESP Francisco Louzada Neto, diretor de transferência tecnológica do CeMEAI e coordenador do projeto.
Sediado no Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC-USP), em São Carlos, o CeMEAI é um dos Centros de Pesquisa, Inovação e Difusão (CEPIDs) financiados pela FAPESP.
Características das fake news
Ao receber um texto, que deve conter a notícia completa, o sistema aplica métodos estatísticos para avaliar características de escrita, como palavras usadas ou classes gramaticais mais frequentes.
Essas caraterísticas são utilizadas por um classificador baseado em um modelo de aprendizado de máquina que é capaz de distinguir padrões de linguagem, vocabulário e semântica de notícias falsas e de verdadeiras e, dessa forma, inferir automaticamente se um texto submetido à plataforma é ou não uma fake news.
“As fake news apresentam padrões na redação do texto, uso e frequência de palavras que podem ser identificáveis pelo classificador”, afirma Louzada.
Para treinar os modelos foi usado um banco de dados construído por pesquisadores da USP, composto por uma grande quantidade de notícias verdadeiras e falsas escritas em português. Além disso, os modelos foram expostos ao vocabulário usado em mais de 100 mil notícias publicadas nos últimos cinco anos.
A base de notícias serviu de entrada para os modelos estatísticos computacionais empregados na plataforma buscarem automaticamente padrões na redação do texto, como o uso e a frequência das palavras.
“Precisamos sempre atualizar e dar mais subsídios para os modelos usados pela plataforma, de modo a melhorar a acurácia e aumentar a capacidade de predição de fake news”, avalia Louzada.
Os pesquisadores pretendem usar as fake news que circularão nas eleições brasileiras deste ano e as relacionadas à pandemia de COVID-19 para calibrar os modelos.
“O combate às fake news é uma corrida de gato e rato porque, ao mesmo tempo que tem surgido plataformas como a que desenvolvemos para detectá-las, os métodos para produzir essas notícias falsas também têm sido aprimorados”, avalia Louzada.
Uma das preocupações é que o sistema também possa ser usado por criadores de fake news para avaliar o potencial de uma notícia falsa passar por verdadeira antes de ser difundida.
“Esse é um risco com o qual teremos que lidar”, afirma.
Plataformas para outras aplicações
A plataforma para detecção de fake news começou a ser desenvolvida por participantes da última edição do Mestrado Profissional em Matemática, Estatística e Computação Aplicadas à Indústria (Mecai), oferecido pelo ICMC-USP e em um dos cursos da área de educação corporativa oferecidos pelo CeMEAI.
Outras soluções desenvolvidas por participantes do curso foram uma plataforma web para antecipação do valor de mercado de criptomoedas e um sistema para acompanhamento de óbitos por COVID-19 em nível municipal.
“Percebemos a dificuldade de acesso aos dados referentes à evolução dos casos e óbitos e de previsão dos números de infectados e mortos em nível municipal em diferentes períodos da pandemia. Com base nessa constatação, a ideia é criar um website que disponibilizará esses dados para cada município do Brasil”, diz Louzada.
*Elton Alisson | Agência FAPESP