TOON (Token-Oriented Object Notation) es un formato de serialización diseñado específicamente para trabajar con modelos de lenguaje grandes (LLMs), ofreciendo una representación de datos estructurados mucho más compacta que JSON, YAML o CSV. Su objetivo principal es reducir el número de tokens necesarios para representar información, lo que permite encajar más datos en el contexto de un modelo y reducir costes de procesamiento.
¿Por qué aparece TOON?
Los LLMs procesan la información en tokens, no en caracteres.
Formatos como JSON repiten claves, comillas y símbolos que consumen muchos tokens.
TOON elimina esa redundancia y usa una sintaxis más eficiente, sin perder legibilidad.
Su filosofía es:
- Menos símbolos repetidos
- Más compactación estructural
- Más claridad para humanos y para IA
Cómo funciona TOON
TOON usa tres ideas clave:
1. Arrays con tamaño explícito
En lugar de [ ], usa [ N ] para indicar cuántos elementos hay:
users[2]:
Esto ayuda a los LLMs a generar salidas coherentes y fáciles de validar.
2. Tablas para listas de objetos uniformes
En JSON, cada objeto repite las claves.
En TOON, las claves se definen una sola vez:
users[2]{id,name,role}:
1,Alice,admin
2,Bob,user
Esto reduce drásticamente los tokens.
3. Indentación en lugar de llaves
Para objetos simples y anidados, TOON usa identación estilo YAML:
config:
debug: true
port: 8080
Comparación con JSON
JSON
{
“users”: [
{“id”: 1, “name”: “Alice”, “role”: “admin”},
{“id”: 2, “name”: “Bob”, “role”: “user”}
]
}
TOON
users[2]{id,name,role}:
1,Alice,admin
2,Bob,user
El resultado:
- Menos tokens
- Mayor densidad de información
- Más capacidad para prompts largos
Ventajas de TOON
- Reducción de tokens del 30% al 60% en promedio
- Legible para humanos
- Estructura explícita que ayuda a los LLMs a no cometer errores
- Ideal para datasets grandes, catálogos, logs, informes, etc.
- Compatible con implementaciones en varios lenguajes
Cuándo usar TOON
Úsalo si:
- Envías listas grandes a un LLM
- Necesitas optimizar coste y espacio en el contexto
- Quieres que el modelo responda con datos estructurados fiables
Evítalo si:
- Tus datos son muy irregulares o profundamente anidados
- Necesitas interoperabilidad total con sistemas basados en JSON
Estado actual del formato
TOON es un estándar emergente (2025) con:
- Especificación abierta (MIT)
- Librerías en Python, TypeScript y otros lenguajes
- Creciente uso en prompting avanzado, extracción estructurada y agentes
Conclusión
TOON no pretende reemplazar JSON en la web, pero sí convertirse en el formato ideal para hablar con LLMs.
Su combinación de compacidad, claridad y estructura lo convierte en una herramienta poderosa para quienes trabajan con datos en IA, especialmente cuando los límites de tokens o los costes de API son una preocupación.








