llms.txt: Guía del Estándar para la IA
Todo sobre llms.txt: qué es, cómo crearlo, formato correcto y por qué es esencial para la visibilidad de tu sitio en modelos de lenguaje e IA.
Equipo GEOAudit
Expertos en Preparación IA
¿Qué es llms.txt y por qué debería importarte?
llms.txt es un archivo de texto plano que se coloca en el directorio raíz de un sitio web y que sirve como directorio estructurado de contenido específicamente diseñado para modelos de lenguaje (LLMs). Su función es indicar a los agentes de IA qué contenido es relevante en tu sitio, cómo está organizado y cómo debería consumirse.
Si robots.txt controla el acceso de los rastreadores y sitemap.xml lista las URLs del sitio, llms.txt proporciona contexto semántico sobre el contenido. Explica, en lenguaje que los modelos de lenguaje comprenden de forma nativa, qué tipo de información alberga tu sitio y para qué consultas es relevante.
Este archivo está ganando adopción rápidamente porque resuelve un problema real: los modelos de lenguaje necesitan entender el propósito y la estructura de un sitio para poder citar su contenido de forma precisa y relevante.
El origen y la evolución de llms.txt
De propuesta a estándar emergente
El concepto de llms.txt surgió como respuesta a una limitación evidente: los modelos de lenguaje con capacidad de navegación web (ChatGPT, Perplexity, Claude) descubren contenido a través de búsquedas y enlaces, pero carecen de un mecanismo para entender rápidamente la estructura global de un sitio.
A diferencia de un humano que puede explorar un menú de navegación, leer una página "Acerca de" y entender intuitivamente qué ofrece un sitio, un agente de IA necesita señales más explícitas y eficientes.
llms.txt llena este vacío proporcionando:
- Una descripción general del sitio y su propósito
- Un mapa de secciones con descripción del contenido de cada una
- Enlaces prioritarios a las páginas más importantes
- Indicaciones de uso sobre qué tipo de consultas puede responder el sitio
Relación con otros archivos de descubrimiento
| Archivo | Función principal | Audiencia |
|---|---|---|
| robots.txt | Controlar acceso de rastreadores | Bots de búsqueda y de IA |
| sitemap.xml | Listar URLs para indexación | Motores de búsqueda |
| llms.txt | Describir contenido para comprensión | Modelos de lenguaje |
| humans.txt | Información sobre el equipo | Humanos curiosos |
| security.txt | Política de divulgación de seguridad | Investigadores de seguridad |
Formato y estructura de llms.txt
Estructura básica
El archivo llms.txt utiliza formato Markdown con una estructura definida:
# Nombre del Sitio
> Descripción breve del sitio y su propósito principal.
## Secciones Principales
- [Página Principal](https://tudominio.com): Descripción de lo que ofrece la página principal
- [Blog](https://tudominio.com/blog): Artículos sobre temas X, Y, Z
- [Productos](https://tudominio.com/productos): Catálogo de productos con descripciones detalladas
## Documentación
- [Guía de Inicio](https://tudominio.com/docs/inicio): Cómo empezar a usar el servicio
- [API Reference](https://tudominio.com/docs/api): Documentación técnica de la API
## Información Relevante
- Este sitio se especializa en [temática]
- El contenido está disponible en [idiomas]
- Actualización: [frecuencia de actualización]
Elementos clave del formato
Título principal (H1): el nombre de tu sitio o empresa. Debe ser exacto y consistente con tu marca.
Cita de descripción (blockquote): una descripción concisa pero informativa del propósito del sitio. Este es posiblemente el elemento más importante porque los modelos de lenguaje lo usan para evaluar la relevancia del sitio para una consulta.
Secciones (H2): agrupaciones temáticas de las páginas principales. Cada sección organiza URLs relacionadas.
Enlaces con descripción: cada URL va acompañada de una descripción que explica qué tipo de contenido contiene esa página. Los modelos de lenguaje usan estas descripciones para decidir qué páginas visitar.
Cómo crear un llms.txt efectivo
Paso 1: Define tu propósito
Antes de escribir el archivo, responde a estas preguntas:
- ¿Qué tipo de sitio web es? (comercio, blog, SaaS, medio, corporativo)
- ¿Qué temas cubre?
- ¿Para qué consultas debería un modelo de lenguaje considerar tu sitio como fuente?
- ¿Qué información única o autorizada ofreces?
Paso 2: Identifica las páginas clave
No incluyas todas las URLs de tu sitio. Selecciona las más importantes:
- Páginas que contienen tu contenido más valioso y único
- Páginas con información que los agentes de IA podrían necesitar citar
- Páginas que demuestran tu autoridad en tus temas principales
- Documentación técnica o guías completas
Paso 3: Escribe descripciones informativas
Las descripciones de cada enlace son cruciales. Deben ser:
- Específicas: "Guía paso a paso para implementar datos estructurados JSON-LD", no "Página sobre datos estructurados"
- Informativas: indica qué tipo de información encontrará el agente
- Honestas: no exageres el alcance del contenido
- Concisas: 1-2 oraciones por enlace
Paso 4: Organiza por secciones lógicas
Agrupa las URLs en secciones que reflejen la estructura temática de tu sitio, no necesariamente la estructura de navegación.
Paso 5: Coloca el archivo en la raíz
El archivo debe estar accesible en https://tudominio.com/llms.txt. Asegúrate de que:
- Devuelve un código de estado 200
- El tipo de contenido es
text/plainotext/markdown - No está bloqueado por robots.txt ni por autenticación
Ejemplo completo de llms.txt
A continuación, un ejemplo realista para un sitio de comercio electrónico de tecnología:
# TechStore España
> TechStore es una tienda online española de productos de tecnología,
> informática y electrónica. Ofrece análisis detallados, comparativas
> y guías de compra además de su catálogo de productos.
## Catálogo de Productos
- [Portátiles](https://techstore.es/portatiles): Catálogo completo de portátiles con especificaciones técnicas, precios y disponibilidad
- [Smartphones](https://techstore.es/smartphones): Catálogo de teléfonos móviles con comparativas de especificaciones
- [Componentes](https://techstore.es/componentes): Procesadores, tarjetas gráficas, memoria RAM, almacenamiento
## Guías de Compra
- [Guía de Portátiles 2026](https://techstore.es/guias/portatiles-2026): Cómo elegir un portátil según uso, presupuesto y necesidades
- [Comparativa Procesadores](https://techstore.es/guias/comparativa-procesadores): Análisis técnico de Intel vs AMD vs Apple Silicon
- [Mejores Smartphones por Presupuesto](https://techstore.es/guias/smartphones-por-presupuesto): Recomendaciones organizadas por rango de precio
## Análisis y Reviews
- [Reviews de Portátiles](https://techstore.es/reviews/portatiles): Análisis detallados con pruebas de rendimiento y batería
- [Reviews de Smartphones](https://techstore.es/reviews/smartphones): Análisis con fotos de muestra, benchmarks y experiencia de uso
## Información de la Empresa
- [Sobre Nosotros](https://techstore.es/sobre-nosotros): Historia de la empresa, equipo editorial, metodología de análisis
- [Contacto](https://techstore.es/contacto): Datos de contacto y atención al cliente
- [Política de Devoluciones](https://techstore.es/devoluciones): Condiciones de devolución y garantía
## Notas
- Los precios se actualizan diariamente
- Los análisis incluyen pruebas de rendimiento propias con metodología documentada
- Contenido disponible en español
- Envíos en toda España y Portugal
llms.txt y llms-full.txt: la versión extendida
Además del archivo llms.txt estándar, existe una variante complementaria: llms-full.txt. Mientras que llms.txt es un directorio conciso, llms-full.txt puede contener información más detallada:
- Descripciones más extensas de cada sección
- Extractos o resúmenes del contenido de las páginas clave
- Contexto adicional sobre la metodología, fuentes o enfoque del sitio
- Información que los modelos podrían necesitar sin tener que visitar cada página individual
La relación entre ambos es similar a la de un índice de un libro (llms.txt) y un resumen ejecutivo de cada capítulo (llms-full.txt).
Errores comunes al crear llms.txt
Incluir demasiadas URLs
El objetivo no es replicar el sitemap. Incluir cientos de URLs diluye la señal de qué contenido es realmente importante. Selecciona las 20-50 páginas más valiosas y relevantes.
Descripciones genéricas
"Página de productos" no aporta información útil a un modelo de lenguaje. "Catálogo de 500+ portátiles con especificaciones técnicas detalladas, precios actualizados diariamente y valoraciones de usuarios verificados" sí lo hace.
No actualizar el archivo
Un llms.txt con enlaces rotos o descripciones que no corresponden al contenido actual es peor que no tener ninguno. Incluye la actualización de llms.txt en tu flujo de trabajo de mantenimiento regular.
Formato incorrecto
El archivo debe seguir el formato Markdown estándar. Los errores de formato pueden impedir que los modelos de lenguaje lo procesen correctamente. Usa un editor con previsualización de Markdown para verificar la estructura.
Bloquear el archivo en robots.txt
Puede parecer obvio, pero asegúrate de que llms.txt no esté bloqueado por reglas de robots.txt. Debe ser accesible por todos los agentes, incluidos los de IA.
Verificar tu llms.txt con GEOAudit
GEOAudit incluye el descubrimiento por LLMs como una de sus 15 categorías de auditoría. La verificación incluye:
- Presencia del archivo
llms.txten la raíz del dominio - Accesibilidad (código de respuesta HTTP, tipo de contenido)
- Formato correcto (estructura Markdown válida)
- Calidad de las descripciones
- Coherencia con el contenido real del sitio
- Presencia opcional de
llms-full.txt
Consulta cómo funciona la auditoría completa, o revisa los planes disponibles para acceder a verificaciones periódicas.
llms.txt en el contexto de una estrategia GEO completa
El archivo llms.txt es un componente importante de una estrategia GEO, pero no es el único. Funciona en conjunto con:
- robots.txt: permite el acceso a los rastreadores de IA
- Datos estructurados JSON-LD: define las entidades formalmente
- HTML semántico: proporciona contexto estructural
- Contenido citable: ofrece fragmentos que los agentes pueden referenciar
- Señales E-E-A-T: establece la autoridad y confianza del sitio
La sinergia entre todos estos elementos es lo que determina tu visibilidad real en motores generativos. llms.txt es la puerta de entrada, pero el contenido y la estructura técnica son lo que los agentes evalúan una vez dentro.
Preguntas Frecuentes
¿Es obligatorio tener un archivo llms.txt?
No es obligatorio, pero es altamente recomendable. Los modelos de lenguaje pueden descubrir y comprender tu contenido sin llms.txt, pero este archivo les facilita el proceso significativamente. Es análogo a tener un sitemap.xml: técnicamente no es obligatorio, pero omitirlo reduce tus posibilidades de ser indexado correctamente.
¿Cómo sé si los modelos de lenguaje están leyendo mi llms.txt?
Puedes verificarlo revisando los logs de acceso de tu servidor web. Busca solicitudes a /llms.txt con user-agents como GPTBot, ClaudeBot o PerplexityBot. Si ves estas solicitudes, confirma que los agentes de IA están accediendo al archivo. GEOAudit también verifica la accesibilidad del archivo como parte de su auditoría.
¿Cada cuánto debo actualizar mi llms.txt?
Actualiza tu llms.txt cada vez que haya cambios significativos en la estructura o contenido de tu sitio: nuevas secciones, cambios de URLs importantes, nuevos tipos de contenido o cierre de secciones. Como regla general, una revisión mensual es suficiente para la mayoría de sitios, pero los sitios con cambios frecuentes deberían actualizarlo con mayor regularidad.
¿Puedo tener versiones de llms.txt en diferentes idiomas?
El estándar actual contempla un único archivo llms.txt en la raíz del dominio. Si tu sitio es multilingüe, puedes incluir secciones para cada idioma dentro del mismo archivo, o describir las diferentes versiones lingüísticas en la descripción general. Si usas subdominios por idioma (es.tudominio.com), cada subdominio puede tener su propio llms.txt.
¿llms.txt reemplaza a robots.txt o sitemap.xml?
No. Cada archivo cumple una función diferente y complementaria. robots.txt controla qué rastreadores pueden acceder a qué partes del sitio. sitemap.xml lista las URLs para indexación por motores de búsqueda. llms.txt describe el contenido en lenguaje natural para comprensión por modelos de lenguaje. Los tres archivos son compatibles y se complementan mutuamente.