Por que criei um llms.txt no meu site e como configurei o Google Analytics para medir os acessos

Entenda o que é o arquivo llms.txt, por que ele pode ajudar ferramentas de IA a entenderem melhor um site e como medir seus acessos no Google Analytics 4.

Introdução

Depois de cuidar de SEO, sitemap, robots.txt, páginas de cursos, FAQ e conteúdo estruturado, comecei a olhar para uma nova frente: como facilitar a leitura do site por ferramentas de inteligência artificial.

Foi aí que entrou o arquivo llms.txt.

A ideia é simples: se mecanismos de busca usam sitemap.xml e robots.txt para entender melhor um site, faz sentido também oferecer um arquivo claro, organizado e direto para modelos de linguagem, assistentes de IA e ferramentas que precisam interpretar o conteúdo de uma página.

Mas eu não queria apenas publicar o arquivo e torcer para alguém acessar. Eu queria medir.

Por isso configurei o Google Analytics 4 para saber se o llms.txt estava sendo consultado.

O que é o llms.txt?

O llms.txt é uma proposta de padronização para colocar, na raiz de um site, um arquivo em Markdown com informações pensadas para ajudar modelos de linguagem a entenderem melhor aquele site no momento em que precisam responder perguntas ou buscar contexto.

Na prática, ele funciona como um resumo organizado do site.

Em vez de uma IA precisar navegar por várias páginas, menus, scripts, banners e estruturas HTML, o llms.txt oferece um caminho mais limpo: explica o que é o site, quais são as páginas mais importantes e onde encontrar informações relevantes.

Isso é importante porque modelos de linguagem têm uma limitação prática: eles não conseguem colocar um site inteiro, com todos os seus detalhes, dentro do contexto de uma resposta.

O próprio site do projeto llms.txt explica que HTML complexo, navegação, anúncios e JavaScript podem dificultar a extração de conteúdo útil para LLMs.

Por que isso importa para a My Robot?

No caso da My Robot Barra da Tijuca, o site não é apenas um cartão de visitas.

Ele explica cursos, idades, metodologia, Robocopa, My Robot Play, Maker Store, Maker Smart, FAQ, localização e diferenciais pedagógicos.

Ou seja: existe muito contexto importante ali.

Quando uma pessoa pergunta para uma IA algo como:

“onde tem curso de robótica para crianças na Barra da Tijuca?”

“qual escola ensina programação e inteligência artificial para adolescentes no Rio de Janeiro?”

Eu quero que o conteúdo da My Robot esteja o mais claro possível para ser compreendido corretamente.

O llms.txt não é garantia de ranqueamento, nem substitui SEO, Google Business Profile, conteúdo bem escrito ou anúncios. Ele é uma camada complementar de organização.

A função dele é ajudar a IA a entender melhor o site.

llms.txt não substitui sitemap nem robots.txt

Esse ponto é importante.

O sitemap.xml ajuda buscadores a encontrarem páginas indexáveis.

O robots.txt indica regras de acesso para robôs.

Já o llms.txt oferece uma visão curada do conteúdo para modelos de linguagem. O próprio projeto explica que ele foi pensado para coexistir com padrões atuais da web, complementando sitemap e robots.txt, não substituindo esses arquivos.

Então, na prática, eu vejo assim:

robots.txt   = orienta acesso de robôs
sitemap.xml  = lista páginas importantes
llms.txt     = explica o site de forma clara para IA

Cada um tem uma função diferente.

Como deve ser a estrutura de um llms.txt?

O formato recomendado é Markdown.

O arquivo deve ficar preferencialmente na raiz do site, em /llms.txt, e precisa ter pelo menos um título principal com o nome do projeto ou site. Também pode ter um resumo, explicações adicionais e listas de links organizadas por seções.

Um exemplo simples seria:

# My Robot Barra da Tijuca

> Escola de robótica, programação e tecnologia educacional para crianças e adolescentes na Barra da Tijuca, Rio de Janeiro.

## Páginas principais
- [Cursos](https://www.exemplo.com/cursos.html): cursos de robótica, programação, IA e tecnologia.
- [FAQ](https://www.exemplo.com/faq.html): principais dúvidas de famílias e responsáveis.
- [Contato](https://www.exemplo.com/contato.html): endereço, WhatsApp e canais de atendimento.

O ideal é usar linguagem objetiva, links bem descritos e evitar termos ambíguos.

O próprio projeto recomenda linguagem clara, descrições informativas nos links e testes com modelos de linguagem para verificar se eles conseguem responder bem sobre o conteúdo do site.

O problema: o Google Analytics não mede o llms.txt automaticamente

Depois que publiquei o arquivo, veio uma pergunta prática:

“Como eu sei se alguém está acessando o llms.txt?”

A primeira tentativa foi olhar no GA4 em tempo real. Mas existe um detalhe técnico: um arquivo .txt não é uma página HTML.

Ele não carrega o script do Google Analytics.

Ele não tem <head>.

Ele não executa JavaScript.

Então, se eu simplesmente publicar o arquivo como texto puro, o GA4 provavelmente não vai medir o acesso automaticamente.

Foi por isso que precisei criar uma medição server-side.

A solução: enviar um evento para o GA4 via Measurement Protocol

Para resolver isso, usei o Measurement Protocol do Google Analytics 4.

O Measurement Protocol é uma forma de enviar eventos diretamente para os servidores do Google Analytics, por requisições HTTP.

A própria documentação do Google explica que ele permite enviar dados para o Analytics de forma diferente do gtag, Google Tag Manager ou Firebase, exigindo que os eventos sejam programados manualmente.

No meu caso, a lógica ficou assim:

1. Alguém acessa /llms.txt
2. O servidor entrega o arquivo normalmente
3. Ao mesmo tempo, o servidor envia um evento para o GA4
4. O evento aparece no Analytics como llms_txt_access

O evento que criei foi:

llms_txt_access

Com isso, eu consigo saber se a URL está sendo consultada sem depender de JavaScript no navegador.

Como configurei a medição no GA4

O processo teve duas partes: uma no Google Analytics e outra no código do site.

1. Peguei o Measurement ID

No GA4, fui em:

Administrador > Coleta e modificação de dados > Fluxos de dados

Depois selecionei o fluxo web do site e copiei o ID de métricas, que tem este formato:

G-XXXXXXXXXX

Esse valor foi salvo como variável de ambiente:

GA4_MEASUREMENT_ID

2. Criei a API Secret do Measurement Protocol

Ainda no fluxo web, acessei:

Chaves secretas da API Measurement Protocol

Depois cliquei em criar uma nova chave.

Essa chave foi salva como:

GA4_API_SECRET

Aqui existe um cuidado importante: essa chave não deve ficar exposta no HTML, no JavaScript público ou no repositório do GitHub.

Como o evento é enviado

A implementação server-side envia um POST para o endpoint do Measurement Protocol do GA4.

O payload usado segue esta ideia:

{
  "client_id": "id_anonimo_gerado_no_servidor",
  "events": [
    {
      "name": "llms_txt_access",
      "params": {
        "file_path": "/llms.txt",
        "file_url": "https://www.myrobotbarra.com.br/llms.txt",
        "content_type": "text/plain",
        "source_type": "server",
        "page_location": "https://www.myrobotbarra.com.br/llms.txt",
        "engagement_time_msec": 100,
        "session_id": 1234567890
      }
    }
  ]
}

Também incluí session_id e engagement_time_msec, porque esses parâmetros ajudam o evento a aparecer corretamente em relatórios como o Tempo Real.

O que não enviar para o Google Analytics

Esse ponto é fundamental.

Eu não envio nome, telefone, e-mail, IP, WhatsApp, dados de aluno, endereço ou qualquer dado pessoal nesse evento.

O objetivo é apenas saber que o arquivo foi acessado.

Então o evento mede apenas algo técnico:

Alguém ou algum robô acessou /llms.txt

Não mede quem foi a pessoa.

Não identifica o visitante.

Não transforma isso em lead.

Como validei se funcionou

Depois da implementação, fiz o teste mais simples:

1. Acessei /llms.txt no navegador.
2. Voltei ao Google Analytics.
3. Entrei em Relatórios > Tempo real.
4. Verifiquei se /llms.txt apareceu na tabela de páginas.

E funcionou.

O GA4 passou a mostrar o acesso ao arquivo em tempo real.

Depois disso, também é possível consultar:

Relatórios > Engajamento > Eventos

E procurar pelo evento:

llms_txt_access

Esse evento deve ser conversão?

Na minha visão, não.

O acesso ao llms.txt não é lead.

Não é clique no WhatsApp.

Não é formulário preenchido.

Não é agendamento de aula experimental.

Ele é um evento técnico.

Serve para entender se ferramentas, bots, crawlers ou usuários estão consultando o arquivo. Por isso, eu não recomendo marcar llms_txt_access como conversão no Google Ads.

As conversões importantes continuam sendo outras:

clique no WhatsApp
envio de formulário
clique em telefone
agendamento de aula experimental

O que aprendi com isso

O principal aprendizado é que SEO técnico e inteligência artificial estão ficando cada vez mais próximos.

Antes, a preocupação era apenas:

O Google consegue encontrar minhas páginas?

Agora, a pergunta começa a ser também:

As ferramentas de IA conseguem entender corretamente o meu site?

O llms.txt entra justamente nesse ponto.

Ele não resolve tudo, não substitui conteúdo bom e não garante visibilidade automática. Mas ajuda a organizar a informação do site de forma mais clara para modelos de linguagem.

E medir esse acesso no GA4 ajuda a tirar a dúvida do campo da suposição.

Em vez de apenas publicar o arquivo e esperar, agora eu consigo acompanhar se ele está sendo consultado.

Conclusão

Criar um llms.txt é uma iniciativa simples, mas estratégica.

Para um site educacional como o da My Robot Barra da Tijuca, ele ajuda a explicar melhor a proposta, os cursos, a metodologia, as páginas principais e os caminhos mais importantes para quem está buscando informações sobre robótica, programação e tecnologia educacional.

Mas publicar o arquivo é só metade do trabalho.

A outra metade é medir.

Ao configurar um evento server-side no Google Analytics 4, consegui saber se o arquivo está sendo acessado e validar que a URL aparece corretamente nos relatórios em tempo real.

Na prática, esse é o tipo de ajuste técnico que não aparece para o visitante comum, mas melhora a organização digital do site e prepara melhor a presença da marca para um ambiente onde buscas, IA e conteúdo estruturado caminham cada vez mais juntos.

Próximo passo

Agora que o evento está funcionando, eu acompanharia semanalmente:

Relatórios > Engajamento > Eventos > llms_txt_access

E manteria o llms.txt atualizado sempre que novas páginas importantes forem criadas, como cursos, eventos, Robocopa, FAQ, artigos de blog e páginas de conversão.

O que isso tem a ver com aprender programação?

Por trás de uma configuração como essa existe algo maior do que “mexer em uma ferramenta”: existe lógica de programação, leitura de documentação, organização de dados, integração entre sistemas, cuidado com privacidade e capacidade de transformar uma necessidade real em uma solução funcional.

Esses são exatamente os tipos de conceitos que aproximam os jovens do mundo profissional da tecnologia.

Quando um aluno entende como um evento é enviado para uma ferramenta de análise, como uma API recebe dados ou como um sistema precisa tratar informações com segurança, ele começa a perceber que programação não é apenas escrever código: é construir pontes entre problema, lógica e resultado.

Cursos relacionados

Próximas trilhas para continuar aprendendo

Se o tema do artigo fez sentido para sua família, estas trilhas ajudam a transformar interesse em projeto prático.

APP Developer

Criação de aplicativos, interfaces, lógica em Python e soluções digitais com começo, meio e entrega.

Conhecer curso

Inteligência Artificial

IA generativa, dados, APIs, chatbots e agentes para criar soluções com pensamento crítico.

Conhecer curso

Autobot

Arduino, sensores e automação para entender como comandos digitais movem sistemas reais.

Conhecer curso

Produtos relacionados

Produtos para entender programação além da tela

Embora o artigo seja técnico, ele conversa com lógica, eventos, dados e integrações. Estes produtos ajudam jovens a perceberem como código e eletrônica podem se transformar em soluções reais.

Placa compatível com Arduino Uno R3

Uma base acessível para conectar programação, entradas, saídas e experimentos físicos.

Ver na Maker Store

Kit Arduino Maker Store

Indicado para explorar lógica, sensores, automação e primeiros projetos de computação física.

Ver na Maker Store

Kit Maker Connect 52 em 1

Ajuda a conectar programação, montagem e resolução de problemas em projetos práticos de robótica.

Ver na Maker Store

Links de afiliado: ao comprar por estes links, você apoia a My Robot Barra da Tijuca.

llms.txt e Google Analytics no site

Introdução

O que é o llms.txt?

Por que isso importa para a My Robot?

llms.txt não substitui sitemap nem robots.txt

Como deve ser a estrutura de um llms.txt?

O problema: o Google Analytics não mede o llms.txt automaticamente

A solução: enviar um evento para o GA4 via Measurement Protocol

Como configurei a medição no GA4

1. Peguei o Measurement ID

2. Criei a API Secret do Measurement Protocol

Como o evento é enviado

O que não enviar para o Google Analytics

Como validei se funcionou

Esse evento deve ser conversão?

O que aprendi com isso

Conclusão

Próximo passo

O que isso tem a ver com aprender programação?

Próximas trilhas para continuar aprendendo

APP Developer

Inteligência Artificial

Autobot

Produtos para entender programação além da tela

Placa compatível com Arduino Uno R3

Kit Arduino Maker Store

Kit Maker Connect 52 em 1

Fontes consultadas