Twitter Flickr Pinterest LinkedIn YouTube Google Maps E-mail RSS
formats

TOON: el nuevo formato optimizado para modelos de lenguaje

Anuncios

TOON (Token-Oriented Object Notation) es un formato de serialización diseñado específicamente para trabajar con modelos de lenguaje grandes (LLMs), ofreciendo una representación de datos estructurados mucho más compacta que JSON, YAML o CSV. Su objetivo principal es reducir el número de tokens necesarios para representar información, lo que permite encajar más datos en el contexto de un modelo y reducir costes de procesamiento.


¿Por qué aparece TOON?

Los LLMs procesan la información en tokens, no en caracteres.
Formatos como JSON repiten claves, comillas y símbolos que consumen muchos tokens.
TOON elimina esa redundancia y usa una sintaxis más eficiente, sin perder legibilidad.

Su filosofía es:

  • Menos símbolos repetidos
  • Más compactación estructural
  • Más claridad para humanos y para IA

Cómo funciona TOON

TOON usa tres ideas clave:

1. Arrays con tamaño explícito

En lugar de [ ], usa [ N ] para indicar cuántos elementos hay:

users[2]:

Esto ayuda a los LLMs a generar salidas coherentes y fáciles de validar.

2. Tablas para listas de objetos uniformes

En JSON, cada objeto repite las claves.
En TOON, las claves se definen una sola vez:

users[2]{id,name,role}:
1,Alice,admin
2,Bob,user

Esto reduce drásticamente los tokens.

3. Indentación en lugar de llaves

Para objetos simples y anidados, TOON usa identación estilo YAML:

config:
debug: true
port: 8080

Comparación con JSON

JSON

{
“users”: [
{“id”: 1, “name”: “Alice”, “role”: “admin”},
{“id”: 2, “name”: “Bob”, “role”: “user”}
]
}

TOON

users[2]{id,name,role}:
1,Alice,admin
2,Bob,user

El resultado:

  • Menos tokens
  • Mayor densidad de información
  • Más capacidad para prompts largos

 

 


Ventajas de TOON

  • Reducción de tokens del 30% al 60% en promedio
  • Legible para humanos
  • Estructura explícita que ayuda a los LLMs a no cometer errores
  • Ideal para datasets grandes, catálogos, logs, informes, etc.
  • Compatible con implementaciones en varios lenguajes

Cuándo usar TOON

Úsalo si:

  • Envías listas grandes a un LLM
  • Necesitas optimizar coste y espacio en el contexto
  • Quieres que el modelo responda con datos estructurados fiables

Evítalo si:

  • Tus datos son muy irregulares o profundamente anidados
  • Necesitas interoperabilidad total con sistemas basados en JSON

Estado actual del formato

TOON es un estándar emergente (2025) con:

  • Especificación abierta (MIT)
  • Librerías en Python, TypeScript y otros lenguajes
  • Creciente uso en prompting avanzado, extracción estructurada y agentes

Conclusión

TOON no pretende reemplazar JSON en la web, pero sí convertirse en el formato ideal para hablar con LLMs.
Su combinación de compacidad, claridad y estructura lo convierte en una herramienta poderosa para quienes trabajan con datos en IA, especialmente cuando los límites de tokens o los costes de API son una preocupación.

Anuncios
Home Sin categoría TOON: el nuevo formato optimizado para modelos de lenguaje
© www.palentino.es, desde el 2012 - Un Blog para compartir conocimientos ...

Uso de cookies en mi sitio palentino.es

Este sitio web utiliza cookies para que tengamos la mejor experiencia de usuario. Si continúas navegando estás dando tu consentimiento para la aceptación de las mencionadas cookies y la aceptación de la política de cookies

ACEPTAR
Aviso de cookies