Los Chatbots y La Agencia
Los chatbots usan técnicas conversacionales de Procesamiento de Lenguaje Natural para poder comprender las consultas (inputs | prompts) de los usuarios y automatizar respuestas. El chatbot en sí es el medio a través del cual el usuario interactúa, mientras que la “agencia” es el marco tecnológico del sistema del chatbot que le permite conectarse con otras herramientas, planificar, ejecutar acciones y aprender de acciones pasadas.
Los chatbots no agénticos no cuentan con acceso a herramientas, ni tienen memoria para almacenar aprendizajes o acciones. Requieren del input de sus usuarios. Están limitados a producir respuestas para prompts comunes y alineados con las expectativas del usuario, pero tienen una baja performance para preguntas específicas. Dado que no tienen memoria, no pueden aprender de sus errores cuando sus respuestas no son satisfactorias.
En contraste, los chatbots agénticos con el tiempo aprenden a adaptarse a las expectativas del usuario y generan experiencias personalizadas. Pueden lograr objetivos completando tareas y subtareas complejas sin intervención humana y considerar distintos enfoques, que asimismo pueden ser corregidos o actualizados según sea necesario. En contraste con los chatbots no agénticos, estos chatbots evalúan las herramientas que tienen disponibles para completar vacíos de información.
Enfoques de razonamiento
No existe una sola arquitectura estándar para construir Agentes de IA. Existen varios enfoques para resolver problemas que requieren múltiples pasos o etapas.
ReAct (Reasoning and Action – Razonar y actuar)
En este enfoque se configura al agente para “pensar” y “planificar” luego de cada acción ejecutada y, con cada herramienta de respuesta que tiene disponible, decidir cuál de ellas usará en el siguiente paso. Este ciclo de Pensar – Actuar – Observar se utiliza para resolver objetivos paso a paso y mejorar en cada respuesta.
A través de la estructura del prompt, se puede instruir a los agentes para que razonen de manera pausada y muestren cada “pensamiento”. El razonamiento verbal del agente da una idea de cómo se formulan las respuestas. En este marco, los agentes actualizan continuamente su contexto con nuevos razonamientos. Este enfoque se puede interpretar como una forma de Chain-of-Thought prompting.
ReWOO (Reasoning Without Observation – Razonamiento sin observación)
El método ReWOO, a diferencia de ReAct, elimina la dependencia de las salidas de las herramientas para la planificación de acciones. En su lugar, los agentes planifican por adelantado. El uso redundante de herramientas se evita al anticipar cuáles serán necesarias al recibir el prompt inicial del usuario. Este enfoque resulta deseable desde una perspectiva centrada en el ser humano, ya que el usuario puede confirmar el plan antes de que sea ejecutado.
El flujo de trabajo de ReWOO se compone de tres módulos. En el módulo de planificación, el agente anticipa los pasos a seguir a partir del prompt del usuario. La siguiente etapa consiste en recolectar las salidas producidas por la ejecución de las herramientas planificadas. Por último, el agente combina el plan inicial con las salidas de las herramientas para formular la respuesta final. Esta planificación anticipada puede reducir significativamente el uso de tokens, la complejidad computacional y las consecuencias de fallos intermedios en las herramientas.
Hasta acá vimos cómo un chatbot deja de ser solo un procesador de lenguaje natural para convertirse en un sistema agéntico, capaz de planificar, ejecutar acciones y adaptarse en el tiempo. La diferencia no está en la interfaz conversacional, sino en la arquitectura interna que habilita razonamiento, uso de herramientas y toma de decisiones.
Los paradigmas como ReAct y ReWOO muestran que no existe una única forma de construir agentes de IA, sino distintos enfoques para resolver problemas compuestos por múltiples pasos, con distintos niveles de control, eficiencia y autonomía.
En el próximo artículo veremos los tipos de agentes de IA, desde los más simples hasta los agentes con capacidad de aprendizaje, para entender cómo se clasifican según sus capacidades y en qué contextos resulta adecuado cada uno.