Введение
Позаботившись о SEO, карте сайта, robots.txt, страницах курса, часто задаваемых вопросах и структурированном контенте, я начал искать новый фронт: как сделать сайт более удобным для чтения с помощью инструментов искусственного интеллекта.
Вот тут и появился файл llms.txt.
Идея проста: если поисковые системы используют sitemap.xml e robots.txt Чтобы лучше понять веб-сайт, имеет смысл также предоставить понятный, организованный и простой архив для языковых моделей, помощников искусственного интеллекта и инструментов, которые необходимы для интерпретации содержимого страницы.
Но я не хотел просто публиковать файл и надеяться, что кто-нибудь получит к нему доступ. Я хотел померить.
Вот почему я настроил Google Analytics 4, чтобы знать, llms.txt консультировались.
Что такое llms.txt?
O llms.txt — это предложение по стандартизации, позволяющее разместить в корне веб-сайта файл Markdown с информацией, предназначенной для того, чтобы помочь языковым моделям лучше понимать этот веб-сайт, когда им необходимо отвечать на вопросы или искать контекст.
На практике это работает как организованное резюме веб-сайта.
Вместо того, чтобы ИИ перемещался по множеству страниц, меню, скриптам, баннерам и структурам HTML, llms.txt предлагает более понятный путь: он объясняет, что представляет собой сайт, какие страницы являются наиболее важными и где найти соответствующую информацию.
Это важно, поскольку языковые модели имеют практическое ограничение: они не могут поместить весь веб-сайт со всеми его деталями в контекст ответа. Сам сайт проекта llms.txt объясняет, что сложный HTML, навигация, реклама и JavaScript могут затруднить извлечение полезного контента для LLM.
Почему это важно для My Robot?
В случае с My Robot Barra da Tijuca сайт — это не просто визитка.
В нем описаны курсы, возраст, методология, Robocopa, My Robot Play, Maker Store, Maker Smart, часто задаваемые вопросы, местоположение и педагогические различия.
Другими словами: там много важного контекста.
Когда человек спрашивает ИИ что-то вроде:
«где в Barra da Tijuca есть курсы робототехники для детей?»
или
«В какой школе учат программированию и искусственному интеллекту подростков в Rio de Janeiro?»
Я хочу, чтобы содержание My Robot было максимально ясным, чтобы его можно было правильно понять.
O llms.txt Это не гарантия рейтинга и не заменяет SEO, бизнес-профиль Google, хорошо написанный контент или рекламу. Это дополнительный уровень организации.
Его функция — помочь ИИ лучше понять сайт.
llms.txt не заменяет карту сайта или robots.txt.
Этот момент важен.
O sitemap.xml помогает поисковым системам находить индексируемые страницы.
O robots.txt указывает правила доступа для роботов.
Уже llms.txt предлагает тщательно подобранный вид контента для языковых моделей. В самом проекте поясняется, что он был разработан для сосуществования с текущими веб-стандартами, дополняя карту сайта и robots.txt, а не заменяя эти файлы.
На практике я вижу это так:
robots.txt = orienta acesso de robôs
sitemap.xml = lista páginas importantes
llms.txt = explica o site de forma clara para IA
У каждого своя функция.
Какой должна быть структура llms.txt?
Рекомендуемый формат — Markdown.
Файл желательно располагать в корне сайта, в /llms.txtи должен иметь хотя бы один основной заголовок с названием проекта или веб-сайта. Он также может содержать резюме, дополнительные пояснения и списки ссылок, организованные по разделам.
Простой пример:
# My Robot Barra da Tijuca
> Escola de robótica, programação e tecnologia educacional para crianças e adolescentes na Barra da Tijuca, Rio de Janeiro.
## Páginas principais
- [Cursos](https://www.exemplo.com/cursos.html): cursos de robótica, programação, IA e tecnologia.
- [FAQ](https://www.exemplo.com/faq.html): principais dúvidas de famílias e responsáveis.
- [Contato](https://www.exemplo.com/contato.html): endereço, WhatsApp e canais de atendimento.
В идеале — использовать объективный язык, хорошо описанные ссылки и избегать двусмысленных терминов. Сам проект рекомендует понятный язык, информативные описания в ссылках и тестирование с помощью языковых моделей, чтобы увидеть, могут ли они хорошо реагировать на контент сайта.
Проблема: Google Analytics не измеряет llms.txt автоматически.
После того как я опубликовал файл, возник практический вопрос:
«Как мне узнать, имеет ли кто-то доступ к
llms.txt?”
Первой попыткой было посмотреть на GA4 в реальном времени. Но есть техническая деталь: файл .txt не является страницей HTML.
Он не загружает скрипт Google Analytics.
У него нет <head>.
JavaScript не запускается.
Поэтому, если я просто опубликую файл в виде обычного текста, GA4, вероятно, не будет измерять доступ автоматически.
Вот почему мне нужно было создать измерение на стороне сервера.
Решение: отправить событие в GA4 через протокол измерений.
Чтобы решить эту проблему, я использовал протокол измерений Google Analytics 4.
Протокол измерений – это способ отправки событий непосредственно на серверы Google Analytics посредством HTTP-запросов. В собственной документации Google объясняется, что она позволяет отправлять данные в Analytics иначе, чем gtag, Google Tag Manager или Firebase, требуя планирования событий вручную.
В моем случае логика выглядела так:
1. Alguém acessa /llms.txt
2. O servidor entrega o arquivo normalmente
3. Ao mesmo tempo, o servidor envia um evento para o GA4
4. O evento aparece no Analytics como llms_txt_access
Событие, которое я создал, было:
llms_txt_access
Благодаря этому я могу узнать, просматривается ли URL-адрес, независимо от JavaScript в браузере.
Как я настраиваю отслеживание в GA4
Этот процесс состоял из двух частей: одна в Google Analytics, а другая в коде веб-сайта.
1. Я получил идентификатор показателя.
В GA4 я пошел к:
Administrador > Coleta e modificação de dados > Fluxos de dados
Затем я выбрал веб-поток веб-сайта и скопировал идентификатор метрики, который имеет следующий формат:
G-XXXXXXXXXX
Это значение было сохранено как переменная среды:
GA4_MEASUREMENT_ID
2. Я создал секретный API протокола измерений.
Все еще находясь в веб-потоке, я получил доступ:
Chaves secretas da API Measurement Protocol
Затем я нажал «Создать новый ключ».
Этот ключ был сохранен как:
GA4_API_SECRET
Здесь есть важная предосторожность: этот ключ не должен быть доступен в HTML, общедоступном JavaScript или в репозитории GitHub.
Как отправляется событие
Серверная реализация отправляет POST к конечной точке протокола измерений GA4.
Используемая полезная нагрузка соответствует этой идее:
{
"client_id": "id_anonimo_gerado_no_servidor",
"events": [
{
"name": "llms_txt_access",
"params": {
"file_path": "/llms.txt",
"file_url": "https://www.myrobotbarra.com.br/llms.txt",
"content_type": "text/plain",
"source_type": "server",
"page_location": "https://www.myrobotbarra.com.br/llms.txt",
"engagement_time_msec": 100,
"session_id": 1234567890
}
}
]
}
я также включил session_id e engagement_time_msec, поскольку эти параметры помогают событию правильно отображаться в таких отчетах, как «В реальном времени».
Что не отправлять в Google Analytics
Этот момент является основополагающим.
Я не отправляю имя, номер телефона, адрес электронной почты, IP, WhatsApp, данные учащихся, адрес или какие-либо личные данные на этом мероприятии.
Цель состоит в том, чтобы просто знать, что к файлу был осуществлен доступ.
Таким образом, мероприятие измеряет только что-то техническое:
Alguém ou algum robô acessou /llms.txt
Это не показатель того, кем был этот человек.
Не идентифицирует посетителя.
Это не превращает это в зацепку.
Как я убедился, что это работает
После реализации я провёл простейший тест:
1. Acessei /llms.txt no navegador.
2. Voltei ao Google Analytics.
3. Entrei em Relatórios > Tempo real.
4. Verifiquei se /llms.txt apareceu na tabela de páginas.
И это сработало.
GA4 теперь показывает доступ к файлам в режиме реального времени.
После этого вы также можете проконсультироваться:
Relatórios > Engajamento > Eventos
И найдите событие:
llms_txt_access
Должно ли это событие быть конверсией?
На мой взгляд, нет.
Доступ к llms.txt это не зацепка.
Это не клик по WhatsApp.
Это не заполненная форма.
Это не расписание пробных занятий.
Это техническое мероприятие.
Он используется, чтобы понять, просматривают ли файл инструменты, боты, сканеры или пользователи. Поэтому не рекомендую отмечать llms_txt_access как преобразование в Google Ads.
Важными преобразованиями по-прежнему остаются:
clique no WhatsApp
envio de formulário
clique em telefone
agendamento de aula experimental
Что я узнал из этого
Главный вывод заключается в том, что техническое SEO и искусственный интеллект становятся все ближе и ближе.
Раньше беспокоило только:
O Google consegue encontrar minhas páginas?
Теперь тоже возникает вопрос:
As ferramentas de IA conseguem entender corretamente o meu site?
O llms.txt входит именно в этот момент.
Это не решает всего, не заменяет хороший контент и не гарантирует автоматическую видимость. Но это помогает более четко организовать информацию на веб-сайте для языковых моделей.
А измерение этого доступа в GA4 помогает вывести сомнения из области предположений.
Вместо того, чтобы просто публиковать файл и ждать, теперь я могу отслеживать, запрашивается ли он.
Заключение
Создайте llms.txt Это простая, но стратегическая инициатива.
Для образовательного веб-сайта, такого как My Robot Barra da Tijuca, это помогает лучше объяснить предложение, курсы, методологию, главные страницы и наиболее важные пути для тех, кто ищет информацию о робототехнике, программировании и образовательных технологиях.
Но опубликовать файл – это только полдела.
Другая половина измеряет.
Настроив событие на стороне сервера в Google Analytics 4, я смог узнать, осуществляется ли доступ к файлу, и убедиться, что URL-адрес правильно отображается в отчетах в реальном времени.
На практике это тот тип технической корректировки, который не кажется обычным посетителю, но улучшает цифровую организацию веб-сайта и лучше подготавливает присутствие бренда к среде, где поиск, искусственный интеллект и структурированный контент все чаще идут рука об руку.
Следующий шаг
Теперь, когда мероприятие уже запущено, я буду отслеживать его еженедельно:
Relatórios > Engajamento > Eventos > llms_txt_access
И держал бы llms.txt обновляется при создании новых важных страниц, таких как курсы, мероприятия, Robocopa, часто задаваемые вопросы, статьи в блогах и страницы конверсий.
Какое это имеет отношение к изучению программирования?
За такой конфигурацией стоит нечто большее, чем просто «возиться с инструментом»: есть логика программирования, чтение документации, организация данных, интеграция между системами, забота о конфиденциальности и возможность превратить реальную потребность в функциональное решение.
Именно такие концепции приближают молодых людей к профессиональному миру технологий. Когда студент понимает, как событие отправляется в инструмент анализа, как API получает данные или как системе необходимо безопасно обрабатывать информацию, он начинает понимать, что программирование — это не просто написание кода: оно строит мосты между проблемой, логикой и результатом.
APP Developer
В APP Developer My Robot Barra da Tijuca практически работает на этой основе. Студент изучает Python, логику программирования, создание интерфейсов, тестирование, настройку и разработку приложений, создавая репертуар, чтобы понять, как проектируются, структурируются и вводятся в эксплуатацию реальные цифровые решения.
Это подходящий путь для молодых людей, которые хотят сделать шаг за пределы потребления технологий и начать создавать приложения, системы и цифровой опыт с большей автономией, логическим рассуждением и видением будущего.
Познакомьтесь с APP DeveloperПродукты для понимания программирования за пределами экрана
Хотя статья носит технический характер, в ней говорится о логике, событиях, данных и интеграции. Эти продукты помогают молодым людям понять, как код и электроника могут превратиться в реальные решения.
Плата совместима с Arduino Uno R3.
Доступная основа для объединения программирования, входных данных, выходных данных и физических экспериментов.
Посмотреть на Maker Store
Комплект Arduino Maker Store
Подходит для изучения логики, датчиков, автоматизации и первых проектов по физическим вычислениям.
Посмотреть на Maker Store
Комплект Maker Connect 52 в 1
Помогает объединить программирование, сборку и решение проблем в практические проекты по робототехнике.
Посмотреть на Maker StoreПартнерские ссылки: совершая покупки по этим ссылкам, вы поддерживаете My Robot Barra da Tijuca.