Seja bem-vindo
Brasil,21/06/2025

  • A +
  • A -
Publicidade

Ajudante Digital #19: raspadores de IA viram "praga" na Wikipédia

agenciabrasil.ebc.com.br
Ajudante Digital #19: raspadores de IA viram "praga" na Wikipédia



Baixar


Criada em 2001, a Wikipédia se tornou uma das principais fontes de conhecimento da internet. Mas, com o avanço da inteligência artificial, essa enciclopédia on-line passou a enfrentar um problema crescente: programas automáticos que copiam conteúdos de forma massiva estão comprometendo a estabilidade da plataforma. 



Leyberson Pedrosa e suas vozes digitais destacam o alerta do executivo da Fundação Wikimedia, Lane Becker, e deixam uma pergunta no ar: como garantir a sobrevivência de uma enciclopédia colaborativa diante do apetite das IAs?



Confira os destaques deste episódio:





  • 📚 Wikipédia, com 24 anos, é uma enciclopédia colaborativa e multilíngue.




  • 🤖 Bots chamados raspadores copiam conteúdo e sobrecarregam os servidores.




  • 📈 Em 2024, o tráfego desses bots cresceu 50%, especialmente no Wikimedia Commons.




  • 💸 65% do tráfego mais custoso vem desses sistemas automatizados.




  • 🛶 Parábola da balsa ilustra a disputa por espaço entre humanos e máquinas.




  • 🧠 Equipe da Wikipédia enfrenta conteúdos gerados por IA com erros e fontes falsas.




  • ⚠️ Lane Becker alerta para aumento contínuo do tráfego automatizado.




  • 🧾 Uso sem crédito e sem remuneração põe em risco a sustentabilidade do projeto.




  • 🔗 Episódio, inspirado em reportagem do Núcleo, destaca a importância de respeitar fontes.




  • 💡 Uso de IA depende de dados e pessoas que mantêm o conhecimento acessível.





Você também pode sugerir temas ou tirar dúvidas. Entre em contato pelo WhatsApp (11) 97469-0138 ou deixe seu comentário no canal do Ajudante Digital no Spotify.






AJUDANTE DIGITAL #19: IA “PEGA PESADO” COM A WIKIPÉDIA



NO AR EM 09/06/2025



[Voz IA humanizada]: Ajudante Digital, como a inteligência artificial tem tanta informação sobre as coisas?

[Voz IA Robozito]: Ih, tô sentindo que vai sobrar pra mim.

[Vinheta Ajudante Digital] 🎶

[Trilha sonora principal – som de fundo] 🎶



[Leyberson]: Olá, saudosos leitores de enciclopédia destas ondas sonoras e digitais! Hoje, o Ajudante Digital chega com a Wikipédia debaixo do braço para testemunhar a importância dessa enciclopédia on-line e também para falar sobre um novo dilema tecnológico:

Como os raspadores de Inteligência Artificial estão sobrecarregando os servidores desta enciclopédia livre.



[Voz IA Robozita]: Me inclua fora desta. Eu não fico copiando as coisas dos outros, não.

[Voz IA Robozito]: Uai, mas a Wikipédia não é livre e colaborativa? 



[Leyberson]: Claro que sim, Robozito!

A Wikipédia é um projeto de enciclopédia on-line que existe há 24 anos com o objetivo de fornecer informação verificável e acessível a todos. Os verbetes podem ser criados por qualquer pessoa, desde que sigam regras de qualidade e controle. E tem versões em diferentes idiomas.



[Voz IA Robozito]: Então, deixa a gente pesquisar lá antes de criar as respostas.

[Leyberson]: Nada mais justo do que os softwares se alimentarem dela para nos ajudar. O problema é fazerem isso por si só e sobrecarregarem a Wikipédia como se fosse uma praga.


[**Som de gafanhotos**]: 🎶

[“POV” das pragas do Egito – VEO GOOGLE]: 🎶 “Rapaz, tive que gravar, não tem jeito. Os gafanhotos passaram aqui ontem. Hoje nem folha tem.”

: 🎶



[Voz IA Robozito]: Pera aí... Raspadores são tipo "gafanhotos digitais"?

[Leyberson]: Quase isso! São bots que varrem sites e baixam todos os dados de forma indiscriminada. Isso tem gerado custos altíssimos e até quedas nos servidores.


[**Som de gafanhotos**]: 🎶

[“POV” das pragas do Egito – VEO GOOGLE]: 🎶 “Comeram até minha túnica, véi.”

: 🎶

[Som de engrenagens] 🎶



[Leyberson]: Deixa eu tentar explicar esse problema com uma parábola.



[Música de fundo: Medieval Story by Frank Schröter – Creative Commons] 🎶

(Link: https://commons.wikimedia.org/wiki/File:Medieval_Story_by_Frank_Schr%C3%B6ter.ogg)



[Leyberson]: Você está na beira de um rio sem ponte, com apenas uma balsa para te transportar para o outro lado. Na hora da travessia, será preciso encher a barca com coisas e pessoas. O piloto carrega o barco principalmente com uma carga de máquinas. Quando chega sua vez, o barco já está cheio e você fica de fora.



[Voz IA Robozita]: Ué, não era mais fácil ter dividido? Metade humano, metade carga?



[Leyberson]: Daria. Que tal se fosse 70% de gente e 30% carga?



[Voz IA Robozito]: Combinado!



[Leyberson]: No caso da Wikipédia, os seus servidores estão ficando cheios.

A Wikimedia Foundation, que administra a enciclopédia, revelou que 65% do tráfego mais custoso vem desses raspadores de IA. Só em 2024, esse tráfego cresceu 50%, especialmente no Wikimedia Commons, que é o repositório de fotos e vídeos da Wikipédia.



[Voz IA Robozito]: Pronto, a culpa é minha agora. Vou deixar até de buscar o significado de raspadores na Wikipédia para não onerar o servidor. Explica você aí, humano!



[Leyberson]: Sem apelar, Robozito. Raspadores são programas automáticos que copiam grandes quantidades de conteúdo — texto, imagens, tudo — para alimentar e treinar modelos de inteligência artificial.



[Som de alarme digital] 🎶



[Leyberson]: E o problema não para por aí…



[Voz IA Robozito]: Lá vem!



[Som de engrenagens] 🎶



[Leyberson]: Uma força-tarefa de editores humanos foi criada pra combater conteúdos gerados por IA na própria Wikipédia, com erros, alucinações e fontes falsas. Tá virando bagunça.



[Voz IA robotizada feminina]: Eita, nóis. Se eu fosse humano, ia criar um sindicato das IAs contra essa palhaçada. Mas o que a Fundação Wikimedia diz sobre o futuro?



[Leyberson]: Primeiro, é bom darmos o crédito da fonte primária, prática comum lá na Wikipédia. O site jornalístico Núcleo.Jor fez uma matéria bem legal explicando esse dilema dos raspadores. No texto, eles citam uma entrevista do executivo da fundação, Lane Becker. Ele diz que o problema a curto prazo é o uso de conteúdos do Wikimedia por IAs sem os devidos créditos.



[Frase memética - Futurama] 🎶 “Ah, agora eu entendi!”



[Leyberson]: Mas, vejam só a bola de neve: a médio e longo prazo, as IAs vão precisar que a Wikipédia continue gerando conteúdo para alimentar os seus próprios modelos. O uso sem créditos e sem remuneração coloca em risco a sustentabilidade do projeto. Vamos para o alerta do Becker:



[Som de alarme digital] 🎶



[Leyberson]: Abre aspas: “Claramente estamos entrando em uma era em que o nível de tráfego automatizado para nosso serviço está aumentando — e isso não vai parar.”



[Som de engrenagens sobrecarregadas] 🎶



[Música de fundo: Medieval Story by Frank Schröter – Creative Commons] 🎶



[Leyberson]: Infelizmente, a gente não tem uma solução para evitar que esse barco afunde. O que a gente pode fazer é testemunhar a importância de iniciativas como a Wikipédia e também lembrar que os verbetes que estão lá são gerados a partir de outras fontes verificáveis. Então, se você usa IA no seu dia a dia, lembre que por trás de cada resposta existe um mundo de dados — e alguém tá pagando a conta.



[Voz IA Robozita]: Respeito à fonte é o mínimo, né?



[Voz IA Robozito]: Eu me rendo. Sem vocês, humanos, eu nem existiria. Também assumo o pacto de não ficar retroalimentando conteúdo com mais do mesmo.



[Voz IA Robozita]: Afinal, uma coisa puxa a outra.



[Voz IA Robozito]: É que nem o dilema Tostines: IA consome mais conteúdo de humano ou o humano consome mais conteúdo de IA?



[Leyberson]: Hum, acho que não entendi bem a associação. Também, fica gerando dado sem fonte confiável, dá nisso.



[Trilha secundária – Identidade Visual] 🎶



[Leyberson]: Quer saber mais sobre esse mundo dos raspadores de dados ou outras questões de tecnologia que estão influenciando o nosso dia a dia?



[Voz IA Robozita]: Então, mande suas dúvidas para nosso WhatsApp: 11 97469-0138.



[Voz IA Robozito]: Este episódio usou, para efeitos meméticos, entre outros elementos, música medieval disponível em Creative Commons, trechos de vídeos sobre pragas do Egito feitos com VEO IA, e sons de estridulação, que é esse barulho característico de gafanhotos. E adivinha de onde achei a definição dessa palavra? Da Wikipédia. Vai lá. E sai pra lá, gafanhoto!



Até o próximo episódio. Tchau!



[Vinheta de encerramento] 🎶









Ajudante Digital é uma coluna semanal com dicas tecnológicas para o dia a dia de quem está conectado com a Tarde Nacional SP. A terceira temporada estreou em 02 de junho de 2026. O conteúdo completo como transcrição do episódio e links para fontes usadas, além de dicas extras ficam disponíveis no site da Radioagência Nacional. Dúvidas e sugestões para a coluna podem ser enviadas em texto ou áudio para o número (11) 97469-0138.

 

































Criação, roteiro e locuçãoLeyberson Pedrosa
Identidade sonoraJosé Maria Pardal
Montagem e desenho de somLeyberson Pedrosa
Design gráficoSilvino Carneiro e Caroline Ramos 
Revisão de roteiroBruna Athayde
Edição web:Rilton Pimentel


 



 






Brasília (DF) 21/11/2024 - artes do Ajudante Digital<br /> Arte EBC


© Arte EBC


Inovação Enciclopédia online sofre com bots que copiam dados sem controle Brasília (DF) 16/06/2025 - 16:00 Rilton Pimentel Leyberson Pedrosa - Repórter da Radioagência Nacional Ajudante Digital inteligência artificial Wikipedia segunda-feira, 16 Junho, 2025 - 16:00 6:05




COMENTÁRIOS

Buscar

Alterar Local

Anuncie Aqui

Escolha abaixo onde deseja anunciar.

Efetue o Login

Recuperar Senha

Baixe o Nosso Aplicativo!

Tenha todas as novidades na palma da sua mão.