Cloudflare bloqueia bots de IA em sites com anúncios

A Cloudflare prepara uma mudança que dará aos responsáveis por sites mais controle sobre o acesso de rastreadores utilizados por ferramentas de inteligência artificial. A partir de 15 de setembro de 2026, bots classificados como agentes ou usados para treinamento de modelos serão bloqueados por padrão em determinadas páginas monetizadas.

A medida afeta principalmente sites que exibem anúncios e dependem da visita de leitores para gerar receita. A empresa argumenta que esses conteúdos podem ser acessados por sistemas de IA sem que o usuário seja direcionado à página original, reduzindo o tráfego e as oportunidades de monetização. Para entender mais sobre o impacto dos bots nesse contexto, consulte o artigo Humanos viram minoria: bots dominam 57,5% do tráfego online.

A mudança não representa um bloqueio geral de qualquer acesso automatizado. Rastreadores destinados exclusivamente a mecanismos de busca continuarão permitidos por padrão, e os administradores poderão alterar as configurações conforme a estratégia de cada domínio.

Nova configuração entra em vigor em setembro

O bloqueio será aplicado principalmente às páginas que exibem publicidade. Nessas áreas, rastreadores classificados pela Cloudflare como ferramentas de treinamento ou agentes de IA serão barrados inicialmente.

A regra valerá para novos domínios adicionados à plataforma a partir de 15 de setembro de 2026. A Cloudflare também informou que clientes existentes do plano gratuito que nunca modificaram suas configurações de rastreamento poderão receber os novos padrões na mesma data.

Os responsáveis pelos sites continuarão com acesso aos controles disponíveis no painel. Será possível permitir ou impedir cada categoria de robô de acordo com a finalidade do domínio, a necessidade de aparecer em mecanismos de busca e a política adotada para o uso do conteúdo por empresas de inteligência artificial. Para saber mais sobre como essas mudanças podem afetar a gestão de conteúdo, veja o artigo IA na indústria criativa: da euforia ao uso consciente.

A alteração, portanto, não fecha completamente o acesso automatizado. Seu objetivo é mudar o ponto de partida: em vez de permitir todos os rastreadores e exigir que o administrador procure uma forma de bloqueá-los, a Cloudflare passará a restringir determinadas categorias automaticamente em páginas monetizadas.

Os bots usados apenas para busca continuarão autorizados por padrão. Esses rastreadores ajudam a indexar páginas e podem direcionar visitantes aos sites por meio dos resultados de pesquisa.

Cloudflare passa a separar os robôs pela finalidade

Uma das principais novidades está na forma como a plataforma classificará os rastreadores. Diferentes atividades, que antes podiam aparecer reunidas sob a mesma identificação, passarão a ser separadas conforme a finalidade declarada de cada acesso.

A Cloudflare criou três categorias principais:

Busca: rastreadores que acessam páginas para incluí-las em resultados de pesquisa;
Agente: sistemas que visitam um site para executar uma tarefa solicitada por uma pessoa;
Treinamento: robôs que coletam informações para treinar, ajustar ou aperfeiçoar modelos de inteligência artificial.

A divisão permite que um site continue disponível para mecanismos de busca sem necessariamente autorizar que seus textos, imagens ou outras informações sejam coletados para o treinamento de modelos.

Essa distinção pode ser especialmente relevante para veículos de comunicação, blogs, sites educacionais e páginas especializadas que desejam manter a visibilidade nos resultados de pesquisa, mas não querem permitir todos os tipos de uso automatizado.

O responsável pelo domínio poderá definir regras diferentes para cada uma das três categorias. Um site poderá, por exemplo, aceitar rastreadores de busca, impedir bots de treinamento e decidir separadamente se permite o acesso de agentes de IA. Para entender melhor sobre as ramificações desses usos mistos, consulte o artigo Gemini e Claude avançam nas empresas e pressionam domínio do ChatGPT.

Bots de uso misto receberão a regra mais restritiva

A situação se torna mais complexa quando um mesmo rastreador realiza mais de uma atividade. Alguns bots podem ser utilizados tanto para indexar conteúdos quanto para alimentar recursos baseados em inteligência artificial.

A Cloudflare classifica esses sistemas como rastreadores de uso misto. Quando um robô combinar duas ou mais finalidades, a plataforma pretende aplicar a configuração mais restritiva definida pelo administrador.

Caso o proprietário do domínio permita bots de busca, mas bloqueie rastreadores de treinamento, um sistema que execute as duas funções poderá ser impedido de acessar o conteúdo.

A decisão cria um incentivo para que as empresas de tecnologia utilizem identificações diferentes para cada finalidade. Dessa forma, um rastreador destinado à busca não seria confundido com outro empregado para coletar dados de treinamento.

A Cloudflare também pretende pressionar essas companhias a informar com maior clareza o motivo de cada visita automatizada. Sem essa separação, um site pode não conseguir identificar se determinado acesso contribuirá para enviar visitantes à página ou apenas para extrair informações.

Páginas com anúncios terão proteção reforçada

O foco inicial em páginas monetizadas está ligado ao modelo econômico de grande parte da web. Sites que exibem publicidade precisam atrair leitores para gerar visualizações de anúncios e financiar a produção, a atualização e a hospedagem dos conteúdos.

Uma reportagem, receita culinária, análise, tutorial ou guia pode exigir horas de trabalho. Um sistema de inteligência artificial, porém, consegue acessar esse material, extrair as informações principais e apresentar uma resposta pronta ao usuário.

Nesse cenário, a pessoa pode conseguir o que procura sem visitar a página original. O conteúdo continua sendo utilizado, mas o site deixa de receber a audiência, a visualização do anúncio e a oportunidade de transformar aquela visita em um leitor recorrente.

Para os editores, o problema não está apenas no acesso automatizado. A preocupação envolve o desequilíbrio entre o valor extraído pelos sistemas de IA e o retorno recebido por quem produziu o material. Para ilustrar esse desafio, veja o artigo IA ameaça sistema financeiro? O que o alerta do FMI significa para o seu bolso.

Ao utilizar a presença de anúncios como um dos indicadores para ativar o bloqueio, a Cloudflare parte do princípio de que essas páginas foram criadas para receber visitantes e dependem, ao menos parcialmente, dessa circulação para continuar funcionando.

Treinamento de IA representa parte expressiva dos acessos

Dados apresentados pela Cloudflare ajudam a explicar a mudança. Em junho de 2026, 52% das solicitações realizadas por rastreadores estavam relacionadas ao treinamento de sistemas de inteligência artificial.

Outros 36% dos acessos teriam sido feitos por robôs classificados como de uso misto, que combinam duas ou mais finalidades.

Os números indicam que uma parcela significativa da atividade automatizada já não está ligada apenas à indexação tradicional de páginas. Bots de treinamento e sistemas multifuncionais passaram a ocupar uma parte relevante dos acessos identificados pela infraestrutura da empresa.

Com os novos controles, os administradores poderão decidir se preferem ampliar a exposição do conteúdo, restringir usos específicos ou combinar permissões diferentes para cada tipo de rastreador.

A configuração mais adequada dependerá do modelo de negócio de cada site. Uma página pode considerar importante aparecer em respostas produzidas por ferramentas de IA, enquanto outra pode entender que esse tipo de exposição não compensa a possível perda de visitas.

Cloudflare testa formas de remunerar os editores

O bloqueio não é a única solução estudada pela Cloudflare para o conflito entre criadores de conteúdo e empresas de inteligência artificial.

Em 2025, a companhia apresentou o Pay Per Crawl, uma proposta que permitiria aos responsáveis por sites cobrar pelo acesso realizado por rastreadores. Nesse modelo, a remuneração estaria associada à visita do robô ao conteúdo.

A empresa agora desenvolve uma evolução chamada Pay Per Use. A proposta é que o pagamento não ocorra apenas quando o rastreador acessa uma página, mas quando aquele material efetivamente gera valor para uma plataforma de IA.

Isso poderia acontecer quando um conteúdo fosse utilizado para produzir uma resposta, atender a uma solicitação ou aparecer nos resultados entregues por determinada ferramenta.

A diferença entre os dois modelos está no evento que gera a cobrança. No Pay Per Crawl, o pagamento estaria relacionado ao acesso. No Pay Per Use, a remuneração dependeria da utilização posterior da informação.

Testes envolvem Ceramic.ai e You.com

A Cloudflare está experimentando esses formatos com empresas como Ceramic.ai e You.com.

No teste com a Ceramic.ai, a proposta é remunerar editores participantes quando suas páginas aparecerem nos resultados apresentados pela ferramenta. A You.com, por sua vez, avalia pagamentos sob demanda para acessar conteúdos específicos.

Os projetos ainda estão em fase experimental. Não existe garantia de que o Pay Per Crawl ou o Pay Per Use se tornem padrões adotados amplamente por sites e plataformas de inteligência artificial.

Também permanecem dúvidas sobre como o uso de cada conteúdo seria identificado, como os valores seriam calculados e quais mecanismos permitiriam aos editores acompanhar as utilizações e os pagamentos.

Ainda assim, os testes apontam para uma mudança na forma como o conteúdo disponível na internet pode ser administrado. Textos, imagens, reportagens e materiais especializados passam a ser tratados como ativos sujeitos a regras de acesso, condições de uso e possíveis formas de remuneração.

Medida não encerra disputa entre sites e empresas de IA

As novas configurações não devem resolver sozinhas o conflito entre produtores de conteúdo, mecanismos de busca e plataformas de inteligência artificial.

A eficácia da medida dependerá da identificação correta dos rastreadores e do respeito das empresas às classificações estabelecidas. Bots que ocultem sua finalidade ou utilizem formas alternativas de acesso podem continuar representando um desafio.

Também será necessário acompanhar o impacto sobre a visibilidade das páginas. O bloqueio excessivo pode limitar a presença do conteúdo em novas ferramentas de descoberta, enquanto a liberação irrestrita pode reduzir o tráfego enviado ao site original.

A atualização transfere parte dessa decisão aos administradores dos domínios. Eles poderão escolher quais tipos de acesso fazem sentido para o próprio projeto, em vez de aceitar uma configuração única para todos os rastreadores.

Para quem utiliza a Cloudflare, a recomendação é verificar o painel antes de 15 de setembro de 2026 e entender como as novas regras serão aplicadas ao domínio. Uma configuração poderá determinar se o conteúdo permanecerá acessível a bots de busca, agentes de IA e sistemas de treinamento.

A mudança reforça uma discussão que deve continuar crescendo: publicar um conteúdo na internet não significa necessariamente autorizar qualquer forma de coleta, reutilização ou exploração comercial. A Cloudflare tenta oferecer ferramentas para que essa escolha volte, ao menos em parte, às mãos de quem mantém o site.