Introducción
Después de ocuparme del SEO, el mapa del sitio, los robots.txt, las páginas del curso, las preguntas frecuentes y el contenido estructurado, comencé a mirar un nuevo frente: cómo hacer que el sitio sea más fácil de leer mediante herramientas de inteligencia artificial.
Ahí es donde entró el archivo. llms.txt.
La idea es simple: si los motores de búsqueda utilizan sitemap.xml e robots.txt Para comprender mejor un sitio web, tiene sentido proporcionar también un archivo claro, organizado y sencillo para modelos de lenguaje, asistentes de inteligencia artificial y herramientas que necesitan interpretar el contenido de una página.
Pero no quería simplemente publicar el archivo y esperar que alguien acceda a él. Quería medir.
Por eso configuré Google Analytics 4 para saber si el llms.txt estaba siendo consultado.
¿Qué es llms.txt?
O llms.txt es una propuesta de estandarización para colocar, en la raíz de un sitio web, un archivo Markdown con información diseñada para ayudar a los modelos de lenguaje a comprender mejor ese sitio web cuando necesitan responder preguntas o buscar contexto.
En la práctica, funciona como un resumen organizado del sitio web.
En lugar de que una IA necesite navegar a través de múltiples páginas, menús, scripts, pancartas y estructuras HTML, la llms.txt Ofrece un camino más claro: explica qué es el sitio, cuáles son las páginas más importantes y dónde encontrar información relevante.
Esto es importante porque los modelos de lenguaje tienen una limitación práctica: no pueden poner un sitio web completo, con todos sus detalles, en el contexto de una respuesta. La propia web del proyecto. llms.txt explica que HTML, navegación, anuncios y JavaScript complejos pueden dificultar la extracción de contenido útil para los LLM.
¿Por qué le importa esto a My Robot?
En el caso de My Robot Barra da Tijuca, el sitio web no es sólo una tarjeta de presentación.
Explica cursos, edades, metodología, Robocopa, My Robot Play, Maker Store, Maker Smart, preguntas frecuentes, ubicación y diferencias pedagógicas.
En otras palabras: hay mucho contexto importante allí.
Cuando una persona le pregunta a una IA algo como:
“¿Dónde hay cursos de robótica para niños en Barra da Tijuca?”
o
“¿Qué escuela enseña programación e inteligencia artificial a adolescentes en Río de Janeiro?”
Quiero que el contenido de My Robot sea lo más claro posible para que se entienda correctamente.
O llms.txt No es garantía de clasificación ni reemplaza el SEO, el perfil comercial de Google, el contenido bien escrito o los anuncios. Es una capa complementaria de organización.
Su función es ayudar a la IA a comprender mejor el sitio web.
llms.txt no reemplaza el mapa del sitio ni el archivo robots.txt
Este punto es importante.
O sitemap.xml ayuda a los motores de búsqueda a encontrar páginas indexables.
O robots.txt Indica reglas de acceso para robots.
Ya el llms.txt ofrece una vista seleccionada del contenido para modelos de lenguaje. El propio proyecto explica que fue diseñado para coexistir con los estándares web actuales, complementando el mapa del sitio y el robots.txt, sin reemplazar estos archivos.
Entonces, en la práctica, lo veo así:
robots.txt = orienta acesso de robôs
sitemap.xml = lista páginas importantes
llms.txt = explica o site de forma clara para IA
Cada uno tiene una función diferente.
¿Cómo debería ser la estructura de un llms.txt?
El formato recomendado es Markdown.
El archivo debe ubicarse preferiblemente en la raíz del sitio, en /llms.txt, y debe tener al menos un título principal con el nombre del proyecto o sitio web. También puede tener un resumen, explicaciones adicionales y listas de enlaces organizados por secciones.
Un ejemplo sencillo sería:
# My Robot Barra da Tijuca
> Escola de robótica, programação e tecnologia educacional para crianças e adolescentes na Barra da Tijuca, Rio de Janeiro.
## Páginas principais
- [Cursos](https://www.exemplo.com/cursos.html): cursos de robótica, programação, IA e tecnologia.
- [FAQ](https://www.exemplo.com/faq.html): principais dúvidas de famílias e responsáveis.
- [Contato](https://www.exemplo.com/contato.html): endereço, WhatsApp e canais de atendimento.
Lo ideal es utilizar un lenguaje objetivo, enlaces bien descritos y evitar términos ambiguos. El proyecto en sí recomienda un lenguaje claro, descripciones informativas en los enlaces y pruebas con modelos de lenguaje para ver si pueden responder bien al contenido del sitio.
El problema: Google Analytics no mide llms.txt automáticamente
Después de publicar el archivo, surgió una pregunta práctica:
“¿Cómo puedo saber si alguien está accediendo al
llms.txt?”
El primer intento fue mirar GA4 en tiempo real. Pero hay un detalle técnico: un expediente .txt No es una página HTML.
No carga el script de Google Analytics.
el no tiene <head>.
No ejecuta JavaScript.
Entonces, si simplemente publico el archivo como texto sin formato, GA4 probablemente no medirá el acceso automáticamente.
Por eso necesitaba crear una medición del lado del servidor.
La solución: enviar un evento a GA4 mediante protocolo de medición
Para resolver esto, utilicé el protocolo de medición de Google Analytics 4.
El Protocolo de medición es una forma de enviar eventos directamente a los servidores de Google Analytics, a través de solicitudes HTTP. La propia documentación de Google explica que le permite enviar datos a Analytics de manera diferente a gtag, Google Tag Manager o Firebase, lo que requiere que los eventos se programen manualmente.
En mi caso, la lógica era la siguiente:
1. Alguém acessa /llms.txt
2. O servidor entrega o arquivo normalmente
3. Ao mesmo tempo, o servidor envia um evento para o GA4
4. O evento aparece no Analytics como llms_txt_access
El evento que creé fue:
llms_txt_access
Con esto puedo saber si se está consultando la URL sin depender de JavaScript en el navegador.
Cómo configuro la medición en GA4
El proceso tuvo dos partes: una en Google Analytics y otra en el código del sitio web.
1. Obtuve el ID de medición
En GA4, fui a:
Administrador > Coleta e modificação de dados > Fluxos de dados
Luego seleccioné el flujo web del sitio web y copié el ID de métricas, que tiene este formato:
G-XXXXXXXXXX
Este valor se guardó como una variable de entorno:
GA4_MEASUREMENT_ID
2. Creé la API secreta del protocolo de medición
Aún en el flujo web, accedí a:
Chaves secretas da API Measurement Protocol
Luego hice clic en crear una nueva clave.
Esta clave se guardó como:
GA4_API_SECRET
Aquí hay una precaución importante: esta clave no debe estar expuesta en HTML, JavaScript público o el repositorio de GitHub.
Cómo se envía el evento
La implementación del lado del servidor envía un POST al punto final del protocolo de medición GA4.
La carga útil utilizada sigue esta idea:
{
"client_id": "id_anonimo_gerado_no_servidor",
"events": [
{
"name": "llms_txt_access",
"params": {
"file_path": "/llms.txt",
"file_url": "https://www.myrobotbarra.com.br/llms.txt",
"content_type": "text/plain",
"source_type": "server",
"page_location": "https://www.myrobotbarra.com.br/llms.txt",
"engagement_time_msec": 100,
"session_id": 1234567890
}
}
]
}
Yo también incluí session_id e engagement_time_msec, porque estos parámetros ayudan a que el evento aparezca correctamente en informes como Tiempo Real.
Qué no enviar a Google Analytics
Este punto es fundamental.
No envío nombre, número de teléfono, correo electrónico, IP, WhatsApp, datos del estudiante, dirección ni ningún dato personal en este evento.
El objetivo es simplemente saber que se accedió al archivo.
Entonces el evento solo mide algo técnico:
Alguém ou algum robô acessou /llms.txt
No mide quién era la persona.
No identifica al visitante.
Eso no convierte esto en una pista.
¿Cómo validé que funcionó?
Después de la implementación, hice la prueba más simple:
1. Acessei /llms.txt no navegador.
2. Voltei ao Google Analytics.
3. Entrei em Relatórios > Tempo real.
4. Verifiquei se /llms.txt apareceu na tabela de páginas.
Y funcionó.
GA4 ahora muestra acceso a archivos en tiempo real.
Posteriormente también puedes consultar:
Relatórios > Engajamento > Eventos
Y busca el evento:
llms_txt_access
¿Debería este evento ser una conversión?
En mi opinión, no.
Acceso a llms.txt no es una pista.
No es un clic en WhatsApp.
No es un formulario completo.
No es un horario de clases de prueba.
Es un evento técnico.
Se utiliza para comprender si las herramientas, los robots, los rastreadores o los usuarios están consultando el archivo. Por lo tanto, no recomiendo marcar llms_txt_access como conversión en Google Ads.
Las conversiones importantes siguen siendo:
clique no WhatsApp
envio de formulário
clique em telefone
agendamento de aula experimental
Lo que aprendí de esto
El principal aprendizaje es que el SEO técnico y la inteligencia artificial están cada vez más cerca.
Antes, la preocupación era sólo:
O Google consegue encontrar minhas páginas?
Ahora la pregunta también empieza a ser:
As ferramentas de IA conseguem entender corretamente o meu site?
O llms.txt entra precisamente en este punto.
No lo soluciona todo, no reemplaza el buen contenido y no garantiza la visibilidad automática. Pero ayuda a organizar la información del sitio web de manera más clara para los modelos de lenguaje.
Y medir este acceso en GA4 ayuda a eliminar la duda del ámbito de las suposiciones.
En lugar de simplemente publicar el archivo y esperar, ahora puedo rastrear si se está consultando.
Conclusión
Crear un llms.txt Es una iniciativa sencilla pero estratégica.
Para un sitio educativo como My Robot Barra da Tijuca, ayuda a explicar mejor la propuesta, los cursos, la metodología, las páginas principales y los caminos más importantes para quienes buscan información sobre robótica, programación y tecnología educativa.
Pero publicar el archivo es sólo la mitad del trabajo.
La otra mitad está midiendo.
Al configurar un evento del lado del servidor en Google Analytics 4, pude saber si se está accediendo al archivo y validar que la URL aparezca correctamente en los informes en tiempo real.
En la práctica, este es el tipo de ajuste técnico que no aparece al visitante promedio, pero que mejora la organización digital del sitio web y prepara mejor la presencia de la marca para un entorno donde la búsqueda, la IA y el contenido estructurado van cada vez más de la mano.
Siguiente paso
Ahora que el evento está en marcha, le daría seguimiento semanalmente:
Relatórios > Engajamento > Eventos > llms_txt_access
y mantendría llms.txt Se actualiza cada vez que se crean nuevas páginas importantes, como cursos, eventos, Robocopa, preguntas frecuentes, artículos de blog y páginas de conversión.
¿Qué tiene esto que ver con el aprendizaje de programación?
Detrás de una configuración como ésta hay algo más grande que “juguetear una herramienta”: hay lógica de programación, lectura de documentación, organización de datos, integración entre sistemas, cuidado de la privacidad y capacidad de transformar una necesidad real en una solución funcional.
Precisamente estos son los tipos de conceptos que acercan a los jóvenes al mundo profesional de la tecnología. Cuando un estudiante comprende cómo se envía un evento a una herramienta de análisis, cómo una API recibe datos o cómo un sistema necesita manejar la información de forma segura, comienza a darse cuenta de que programar no es solo escribir código: es construir puentes entre problema, lógica y resultado.
Desarrollador de aplicaciones
En APP Developer, My Robot Barra da Tijuca trabaja sobre esta base de forma práctica. El estudiante aprende Python, lógica de programación, creación de interfaces, pruebas, ajustes y desarrollo de aplicaciones, construyendo un repertorio para comprender cómo se diseñan, estructuran y ponen en funcionamiento soluciones digitales reales.
Es un camino adecuado para jóvenes que quieran dar un paso más allá del consumo de tecnología y empezar a crear aplicaciones, sistemas y experiencias digitales con más autonomía, razonamiento lógico y visión de futuro.
Conozca al desarrollador de aplicacionesProductos para entender la programación más allá de la pantalla
Aunque el artículo es técnico, habla de lógica, eventos, datos e integraciones. Estos productos ayudan a los jóvenes a comprender cómo el código y la electrónica pueden convertirse en soluciones reales.
Placa compatible con Arduino Uno R3
Una base asequible para conectar programación, entradas, salidas y experimentos de física.
Ver en la tienda Maker
Kit de tienda Arduino Maker
Adecuado para explorar lógica, sensores, automatización y primeros proyectos de computación física.
Ver en la tienda Maker
Kit Maker Connect 52 en 1
Ayuda a conectar la programación, el ensamblaje y la resolución de problemas en proyectos prácticos de robótica.
Ver en la tienda MakerEnlaces de afiliados: al comprar a través de estos enlaces, apoyas a My Robot Barra da Tijuca.