Introdução
Depois de cuidar de SEO, sitemap, robots.txt, páginas de cursos, FAQ e conteúdo estruturado, comecei a olhar para uma nova frente: como facilitar a leitura do site por ferramentas de inteligência artificial.
Foi aí que entrou o arquivo llms.txt.
A ideia é simples: se mecanismos de busca usam sitemap.xml e robots.txt para entender melhor um site, faz sentido também oferecer um arquivo claro, organizado e direto para modelos de linguagem, assistentes de IA e ferramentas que precisam interpretar o conteúdo de uma página.
Mas eu não queria apenas publicar o arquivo e torcer para alguém acessar. Eu queria medir.
Por isso configurei o Google Analytics 4 para saber se o llms.txt estava sendo consultado.
O que é o llms.txt?
O llms.txt é uma proposta de padronização para colocar, na raiz de um site, um arquivo em Markdown com informações pensadas para ajudar modelos de linguagem a entenderem melhor aquele site no momento em que precisam responder perguntas ou buscar contexto.
Na prática, ele funciona como um resumo organizado do site.
Em vez de uma IA precisar navegar por várias páginas, menus, scripts, banners e estruturas HTML, o llms.txt oferece um caminho mais limpo: explica o que é o site, quais são as páginas mais importantes e onde encontrar informações relevantes.
Isso é importante porque modelos de linguagem têm uma limitação prática: eles não conseguem colocar um site inteiro, com todos os seus detalhes, dentro do contexto de uma resposta. O próprio site do projeto llms.txt explica que HTML complexo, navegação, anúncios e JavaScript podem dificultar a extração de conteúdo útil para LLMs.
Por que isso é importante para um site como o da My Robot Barra da Tijuca?
No caso da My Robot Barra da Tijuca, o site não é apenas um cartão de visitas.
Ele explica cursos, idades, metodologia, Robocopa, My Robot Play, Maker Store, Maker Smart, FAQ, localização e diferenciais pedagógicos.
Ou seja: existe muito contexto importante ali.
Quando uma pessoa pergunta para uma IA algo como:
“onde tem curso de robótica para crianças na Barra da Tijuca?”
ou
“qual escola ensina programação e inteligência artificial para adolescentes no Rio de Janeiro?”
Eu quero que o conteúdo da My Robot esteja o mais claro possível para ser compreendido corretamente.
O llms.txt não é garantia de ranqueamento, nem substitui SEO, Google Business Profile, conteúdo bem escrito ou anúncios. Ele é uma camada complementar de organização.
A função dele é ajudar a IA a entender melhor o site.
llms.txt não substitui sitemap nem robots.txt
Esse ponto é importante.
O sitemap.xml ajuda buscadores a encontrarem páginas indexáveis.
O robots.txt indica regras de acesso para robôs.
Já o llms.txt oferece uma visão curada do conteúdo para modelos de linguagem. O próprio projeto explica que ele foi pensado para coexistir com padrões atuais da web, complementando sitemap e robots.txt, não substituindo esses arquivos.
Então, na prática, eu vejo assim:
robots.txt = orienta acesso de robôs
sitemap.xml = lista páginas importantes
llms.txt = explica o site de forma clara para IA
Cada um tem uma função diferente.
Como deve ser a estrutura de um llms.txt?
O formato recomendado é Markdown.
O arquivo deve ficar preferencialmente na raiz do site, em /llms.txt, e precisa ter pelo menos um título principal com o nome do projeto ou site. Também pode ter um resumo, explicações adicionais e listas de links organizadas por seções.
Um exemplo simples seria:
# My Robot Barra da Tijuca
> Escola de robótica, programação e tecnologia educacional para crianças e adolescentes na Barra da Tijuca, Rio de Janeiro.
## Páginas principais
- [Cursos](https://www.exemplo.com/cursos.html): cursos de robótica, programação, IA e tecnologia.
- [FAQ](https://www.exemplo.com/faq.html): principais dúvidas de famílias e responsáveis.
- [Contato](https://www.exemplo.com/contato.html): endereço, WhatsApp e canais de atendimento.
O ideal é usar linguagem objetiva, links bem descritos e evitar termos ambíguos. O próprio projeto recomenda linguagem clara, descrições informativas nos links e testes com modelos de linguagem para verificar se eles conseguem responder bem sobre o conteúdo do site.
O problema: o Google Analytics não mede o llms.txt automaticamente
Depois que publiquei o arquivo, veio uma pergunta prática:
“Como eu sei se alguém está acessando o
llms.txt?”
A primeira tentativa foi olhar no GA4 em tempo real. Mas existe um detalhe técnico: um arquivo .txt não é uma página HTML.
Ele não carrega o script do Google Analytics.
Ele não tem <head>.
Ele não executa JavaScript.
Então, se eu simplesmente publicar o arquivo como texto puro, o GA4 provavelmente não vai medir o acesso automaticamente.
Foi por isso que precisei criar uma medição server-side.
A solução: enviar um evento para o GA4 via Measurement Protocol
Para resolver isso, usei o Measurement Protocol do Google Analytics 4.
O Measurement Protocol é uma forma de enviar eventos diretamente para os servidores do Google Analytics, por requisições HTTP. A própria documentação do Google explica que ele permite enviar dados para o Analytics de forma diferente do gtag, Google Tag Manager ou Firebase, exigindo que os eventos sejam programados manualmente.
No meu caso, a lógica ficou assim:
1. Alguém acessa /llms.txt
2. O servidor entrega o arquivo normalmente
3. Ao mesmo tempo, o servidor envia um evento para o GA4
4. O evento aparece no Analytics como llms_txt_access
O evento que criei foi:
llms_txt_access
Com isso, eu consigo saber se a URL está sendo consultada sem depender de JavaScript no navegador.
Como configurei a medição no GA4
O processo teve duas partes: uma no Google Analytics e outra no código do site.
1. Peguei o Measurement ID
No GA4, fui em:
Administrador > Coleta e modificação de dados > Fluxos de dados
Depois selecionei o fluxo web do site e copiei o ID de métricas, que tem este formato:
G-XXXXXXXXXX
Esse valor foi salvo como variável de ambiente:
GA4_MEASUREMENT_ID
2. Criei a API Secret do Measurement Protocol
Ainda no fluxo web, acessei:
Chaves secretas da API Measurement Protocol
Depois cliquei em criar uma nova chave.
Essa chave foi salva como:
GA4_API_SECRET
Aqui existe um cuidado importante: essa chave não deve ficar exposta no HTML, no JavaScript público ou no repositório do GitHub.
Como o evento é enviado
A implementação server-side envia um POST para o endpoint do Measurement Protocol do GA4.
O payload usado segue esta ideia:
{
"client_id": "id_anonimo_gerado_no_servidor",
"events": [
{
"name": "llms_txt_access",
"params": {
"file_path": "/llms.txt",
"file_url": "https://www.myrobotbarra.com.br/llms.txt",
"content_type": "text/plain",
"source_type": "server",
"page_location": "https://www.myrobotbarra.com.br/llms.txt",
"engagement_time_msec": 100,
"session_id": 1234567890
}
}
]
}
Também incluí session_id e engagement_time_msec, porque esses parâmetros ajudam o evento a aparecer corretamente em relatórios como o Tempo Real.
O que não enviar para o Google Analytics
Esse ponto é fundamental.
Eu não envio nome, telefone, e-mail, IP, WhatsApp, dados de aluno, endereço ou qualquer dado pessoal nesse evento.
O objetivo é apenas saber que o arquivo foi acessado.
Então o evento mede apenas algo técnico:
Alguém ou algum robô acessou /llms.txt
Não mede quem foi a pessoa.
Não identifica o visitante.
Não transforma isso em lead.
Como validei se funcionou
Depois da implementação, fiz o teste mais simples:
1. Acessei /llms.txt no navegador.
2. Voltei ao Google Analytics.
3. Entrei em Relatórios > Tempo real.
4. Verifiquei se /llms.txt apareceu na tabela de páginas.
E funcionou.
O GA4 passou a mostrar o acesso ao arquivo em tempo real.
Depois disso, também é possível consultar:
Relatórios > Engajamento > Eventos
E procurar pelo evento:
llms_txt_access
Esse evento deve ser conversão?
Na minha visão, não.
O acesso ao llms.txt não é lead.
Não é clique no WhatsApp.
Não é formulário preenchido.
Não é agendamento de aula experimental.
Ele é um evento técnico.
Serve para entender se ferramentas, bots, crawlers ou usuários estão consultando o arquivo. Por isso, eu não recomendo marcar llms_txt_access como conversão no Google Ads.
As conversões importantes continuam sendo outras:
clique no WhatsApp
envio de formulário
clique em telefone
agendamento de aula experimental
O que aprendi com isso
O principal aprendizado é que SEO técnico e inteligência artificial estão ficando cada vez mais próximos.
Antes, a preocupação era apenas:
O Google consegue encontrar minhas páginas?
Agora, a pergunta começa a ser também:
As ferramentas de IA conseguem entender corretamente o meu site?
O llms.txt entra justamente nesse ponto.
Ele não resolve tudo, não substitui conteúdo bom e não garante visibilidade automática. Mas ajuda a organizar a informação do site de forma mais clara para modelos de linguagem.
E medir esse acesso no GA4 ajuda a tirar a dúvida do campo da suposição.
Em vez de apenas publicar o arquivo e esperar, agora eu consigo acompanhar se ele está sendo consultado.
Conclusão
Criar um llms.txt é uma iniciativa simples, mas estratégica.
Para um site educacional como o da My Robot Barra da Tijuca, ele ajuda a explicar melhor a proposta, os cursos, a metodologia, as páginas principais e os caminhos mais importantes para quem está buscando informações sobre robótica, programação e tecnologia educacional.
Mas publicar o arquivo é só metade do trabalho.
A outra metade é medir.
Ao configurar um evento server-side no Google Analytics 4, consegui saber se o arquivo está sendo acessado e validar que a URL aparece corretamente nos relatórios em tempo real.
Na prática, esse é o tipo de ajuste técnico que não aparece para o visitante comum, mas melhora a organização digital do site e prepara melhor a presença da marca para um ambiente onde buscas, IA e conteúdo estruturado caminham cada vez mais juntos.
Próximo passo
Agora que o evento está funcionando, eu acompanharia semanalmente:
Relatórios > Engajamento > Eventos > llms_txt_access
E manteria o llms.txt atualizado sempre que novas páginas importantes forem criadas, como cursos, eventos, Robocopa, FAQ, artigos de blog e páginas de conversão.
O que isso tem a ver com aprender programação?
Por trás de uma configuração como essa existe algo maior do que “mexer em uma ferramenta”: existe lógica de programação, leitura de documentação, organização de dados, integração entre sistemas, cuidado com privacidade e capacidade de transformar uma necessidade real em uma solução funcional.
Esses são exatamente os tipos de conceitos que aproximam os jovens do mundo profissional da tecnologia. Quando um aluno entende como um evento é enviado para uma ferramenta de análise, como uma API recebe dados ou como um sistema precisa tratar informações com segurança, ele começa a perceber que programação não é apenas escrever código: é construir pontes entre problema, lógica e resultado.
APP Developer
No APP Developer, a My Robot Barra da Tijuca trabalha essa base de forma prática. O aluno aprende Python, lógica de programação, criação de interfaces, testes, ajustes e desenvolvimento de aplicações, construindo repertório para entender como soluções digitais reais são pensadas, estruturadas e colocadas em funcionamento.
É uma trilha indicada para jovens que já querem dar um passo além do consumo de tecnologia e começar a criar aplicativos, sistemas e experiências digitais com mais autonomia, raciocínio lógico e visão de futuro.
Conhecer o APP DeveloperProdutos para entender programação além da tela
Embora o artigo seja técnico, ele conversa com lógica, eventos, dados e integrações. Estes produtos ajudam jovens a perceberem como código e eletrônica podem se transformar em soluções reais.
Placa compatível com Arduino Uno R3
Uma base acessível para conectar programação, entradas, saídas e experimentos físicos.
Ver na Maker Store
Kit Arduino Maker Store
Indicado para explorar lógica, sensores, automação e primeiros projetos de computação física.
Ver na Maker Store
Kit Maker Connect 52 em 1
Ajuda a conectar programação, montagem e resolução de problemas em projetos práticos de robótica.
Ver na Maker StoreLinks de afiliado: ao comprar por estes links, você apoia a My Robot Barra da Tijuca.