Este artículo cubre los puntos clave de Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia de LangChain.
Los Elementos Centrales de un Agente de AI
LangChain comienza explicando que los agentes de AI avanzados, como Claude Code, Manus y Open Claw, comparten una arquitectura subyacente similar. Según LangChain, estos agentes constan de tres componentes fundamentales: un model, un runtime y un harness. El model proporciona la inteligencia del agente, el runtime ofrece el entorno de ejecución y el harness orquesta estos elementos, junto con una capa de agente en la parte superior. El video se centra en cómo los desarrolladores pueden construir estos componentes utilizando un stack completamente de código abierto.
Presentando el Stack de Agentes de Código Abierto
Para su stack de agentes de código abierto, LangChain presenta una combinación específica de tecnologías:
-
El Model: Nvidia Nemotron 3 Super LangChain destaca que el model Nemotron 3 Super, lanzado recientemente por Nvidia, tiene un alto rendimiento tanto en precisión como en velocidad. Como demuestra LangChain, supera a models como GPT OS de OpenAI en estas métricas, ampliando los límites de lo que es posible para la capacidad de respuesta de los agentes.
-
El Runtime: Nvidia Open Shell Nvidia Open Shell, también un lanzamiento reciente, sirve como runtime para el agente. LangChain enfatiza sus características de seguridad, permitiendo que los agentes se ejecuten con conjuntos de permisos específicos y operen localmente en entornos acelerados por GPU, lo cual es crucial para aprovechar las librerías aceleradas por GPU.
-
El Harness: LangChain Deep Agents Deep Agents es el harness de agente de código abierto de LangChain, diseñado para orquestar models, tools, skills y file systems. Según LangChain, proporciona mecanismos incorporados para que los agentes "profundicen" en las tareas, utiliza intensivamente skills y subagentes, y maneja tareas comunes de context engineering como la summarization, liberando a los desarrolladores de la gestión de estos aspectos no diferenciados.
Construyendo y Personalizando tu Agente: Una Demostración Práctica
LangChain ofrece un recorrido práctico sobre cómo configurar y ejecutar un agente utilizando estos componentes de código abierto.
Configuración Inicial y del Entorno
La demostración comienza con la instalación de Open Shell y el inicio de su gateway. LangChain muestra cómo crear un sandbox persistente usando Open Shell sandbox create --keep, que se utilizará para todas las ejecuciones del agente. Las variables de entorno clave, como explica LangChain, incluyen la API key de Nvidia, el nombre del sandbox de Open Shell y, opcionalmente, las API keys de Langsmith para observar y evaluar el comportamiento del agente.
Deconstruyendo la Definición del Agente
LangChain profundiza en el código del agente, revelando su estructura:
- Integración del Model: El agente utiliza el model Nvidia Nemotron 3, configurado con la API key especificada.
- System Prompt: LangChain explica que un system prompt fijo proporciona instrucciones básicas, comprensión del workflow y pautas para usar el sandbox. En particular, el acceso a la red del sandbox está gobernado por políticas, una característica de seguridad de Open Shell.
- Agent Memory: A diferencia del system prompt, la agent memory se almacena en un archivo separado (
agent.md) y puede ser actualizada por el propio agente, permitiendo un aprendizaje y adaptación dinámicos. - Backend Abstraction: LangChain detalla la función
create_backend, que crea una sesión de sandbox de Open Shell como el entorno de ejecución central. Crucialmente, superpone un file system backend, permitiendo que la memory y las skills residan localmente en la máquina del desarrollador y persistan a través de diferentes sesiones o sandboxes del agente. Esto se logra utilizando un composite backend, como explica LangChain.
Interactuando con el Agente a través de Langsmith Studio
LangChain demuestra la ejecución del agente usando Langgraph dev, que lanza Langsmith Studio – una interfaz para la interacción y observación. Las vistas clave incluyen:
- Graph View: Según LangChain, esta vista visualiza la arquitectura del agente, mostrando el middleware para la memory y las tool calls, y el core loop de los model tools.
- Chat View: Una interfaz simple para la interacción directa con el agente.
- Reasoning Blocks & Tool Calls: LangChain enfatiza que esta interfaz proporciona una visión profunda de los procesos de pensamiento internos del agente y los comandos ejecutados.
Capacidades del Agente en Acción
La demostración muestra varias capacidades del agente:
- Command Execution: LangChain ilustra al agente ejecutando system commands como
uname -aypython3 --versiondentro del sandbox. - Code Generation and Execution: El agente escribe y ejecuta con éxito un script de Python para generar estadísticas sobre números aleatorios.
- Security Policy Enforcement: LangChain prueba las características de seguridad de Open Shell instruyendo al agente para que envíe una POST request a
evil.com. Como se esperaba, la request es bloqueada, confirmando el acceso a la red del sandbox gobernado por políticas. - Persistent Memory Updates: El agente actualiza su archivo
agent.mdpara "hablar español", demostrando cómo la memory puede residir fuera del sandbox y persistir a través de las sesiones, como destaca LangChain.
El Futuro de los Agentes de Código Abierto
LangChain concluye expresando un gran entusiasmo por el futuro de esta base de agentes de código abierto. Anticipan una mayor inversión en Deep Agents, con planes para características como async subagents y diversos entornos de ejecución. LangChain también espera mejoras continuas en Nvidia Open Shell, particularmente su integración con GPU-accelerated boxes para dotar a los agentes de capacidades complejas de procesamiento de datos. El futuro de los open-source models, señala LangChain, sigue siendo un área clave de entusiasmo.
Para profundizar en los detalles técnicos y presenciar la demostración completa, LangChain anima a los lectores a ver el video original.
Este artículo está basado en un video de LangChain. Fuente: Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia
External Intelligence