Por Qué las IAs Entienden Mejor el XML: El "As Bajo la Manga" para tus Prompts
Por Qué las IAs Entienden Mejor el XML: El "As Bajo la Manga" para tus Prompts
Hoy en día, todo el mundo sabe escribirle un prompt (instrucción) a ChatGPT o Claude. Pero cuando le pedís a la IA que procese tareas complejas, analice textos largos o siga reglas estrictas, un simple párrafo de texto suele fallar. La IA se confunde, mezcla las instrucciones con los datos y aumenta la probabilidad de "alucinar" respuestas incorrectas.
Para los que trabajamos integrando IA en aplicaciones reales, hay una técnica que ayuda a mitigar este problema de forma notable: usar etiquetas XML.

El Problema del "Muro de Texto"
Imaginá que le das a un asistente humano una hoja de papel sin párrafos, sin negritas y sin títulos, donde se mezclan las reglas de lo que tiene que hacer con el texto que tiene que resumir. Le costaría mucho entender dónde termina la orden y dónde empieza el trabajo.
A los Modelos de Lenguaje Grande (LLMs) les pasa algo similar. Si le decís: "Resumí el siguiente texto pero no uses la palabra 'manzana' el texto es el siguiente había una vez un árbol...", la IA tiene que adivinar las fronteras de tu instrucción.
La Solución: Fronteras Duras con XML
El XML (eXtensible Markup Language) es un lenguaje de marcado que usa etiquetas para envolver información, muy similar al HTML de las páginas web. Se ve así: <etiqueta>contenido</etiqueta>.
Cuando escribimos un prompt profesional, lo estructuramos de esta manera:
<instrucciones>
Resumí el texto provisto. No uses la palabra "manzana".
</instrucciones>
<texto_a_resumir>
Había una vez un árbol...
</texto_a_resumir>
¿Por Qué Funciona Tan Bien?
No es magia, es estadística. Las IAs modernas fueron entrenadas leyendo trillones de líneas de texto de internet, y una gran parte de ese texto era código fuente (HTML, XML, código de programación).
Por lo tanto, las redes neuronales de la IA están matemáticamente "cableadas" para prestarle una atención especial a las etiquetas. Entienden de forma nativa que cualquier cosa que esté dentro de <instrucciones> es una regla, y lo que está dentro de <texto_a_resumir> son solo datos pasivos.
Las etiquetas XML crean fronteras duras. Le quitan a la IA gran parte de la carga de tener que adivinar la estructura de tu mensaje, permitiéndole enfocarse en ejecutar la tarea.
Ojo, usar XML no hace que un modelo sea infalible ni elimina las alucinaciones por completo, pero es una de las mejores herramientas que tenemos. En el desarrollo de software con IA, estructurar los datos correctamente suele ser la diferencia entre un asistente que da respuestas erráticas y uno que funciona con un alto nivel de precisión.


