AI एजेंट्स को समझना: LangChain का Nvidia टेक्नोलॉजी के साथ ओपन-सोर्स ब्लूप्रिंट

यह लेख LangChain द्वारा Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia वीडियो से प्राप्त मुख्य जानकारियों को कवर करता है।

एक AI एजेंट के मुख्य तत्व

LangChain यह समझाते हुए शुरू करता है कि Claude Code, Manus और Open Claw जैसे उन्नत AI एजेंट्स एक समान अंतर्निहित आर्किटेक्चर साझा करते हैं। LangChain के अनुसार, ये एजेंट्स तीन मूलभूत घटकों से बने होते हैं: एक मॉडल, एक रनटाइम और एक हार्नेस। मॉडल एजेंट की इंटेलिजेंस प्रदान करता है, रनटाइम एग्जीक्यूशन एनवायरनमेंट प्रदान करता है, और हार्नेस इन तत्वों को, ऊपर एक एजेंट लेयर के साथ, ऑर्केस्ट्रेट करता है। वीडियो इस बात पर केंद्रित है कि डेवलपर्स पूरी तरह से ओपन-सोर्स स्टैक का उपयोग करके इन घटकों का निर्माण कैसे कर सकते हैं।

ओपन-सोर्स एजेंट स्टैक का परिचय

अपने ओपन-सोर्स एजेंट स्टैक के लिए, LangChain टेक्नोलॉजीज के एक विशिष्ट संयोजन को प्रदर्शित करता है:

मॉडल: Nvidia Nemotron 3 Super LangChain इस बात पर प्रकाश डालता है कि Nvidia द्वारा हाल ही में जारी किया गया Nemotron 3 Super मॉडल, सटीकता और गति दोनों में अत्यधिक परफॉर्मेंट है। जैसा कि LangChain प्रदर्शित करता है, यह इन मेट्रिक्स में OpenAI के GPT OS जैसे मॉडलों को पीछे छोड़ देता है, जो एजेंट की प्रतिक्रियाशीलता के लिए संभव की सीमाओं को आगे बढ़ाता है।
रनटाइम: Nvidia Open Shell Nvidia Open Shell, जो हाल ही में जारी किया गया है, एजेंट के लिए रनटाइम के रूप में कार्य करता है। LangChain इसकी सुरक्षा सुविधाओं पर जोर देता है, जो एजेंट्स को निर्दिष्ट परमिशन सेट के साथ चलने और GPU-एक्सेलरेटेड एनवायरनमेंट में स्थानीय रूप से संचालित होने की अनुमति देता है, जो GPU-एक्सेलरेटेड लाइब्रेरीज का लाभ उठाने के लिए महत्वपूर्ण है।
हार्नेस: LangChain Deep Agents Deep Agents LangChain का ओपन-सोर्स एजेंट हार्नेस है, जिसे मॉडलों, टूल्स, स्किल्स और फाइल सिस्टम्स को ऑर्केस्ट्रेट करने के लिए डिज़ाइन किया गया है। LangChain के अनुसार, यह एजेंट्स को कार्यों में "गहराई से जाने" के लिए बिल्ट-इन मैकेनिज्म प्रदान करता है, स्किल्स और सबएजेंट्स का भारी उपयोग करता है, और सारांश जैसे सामान्य कॉन्टेक्स्ट इंजीनियरिंग कार्यों को संभालता है, जिससे डेवलपर्स को इन अविभेदित पहलुओं को प्रबंधित करने से मुक्ति मिलती है।

अपने एजेंट का निर्माण और अनुकूलन: एक व्यावहारिक प्रदर्शन

LangChain इन ओपन-सोर्स घटकों का उपयोग करके एक एजेंट को स्थापित करने और चलाने का एक व्यावहारिक प्रदर्शन प्रदान करता है।

प्रारंभिक सेटअप और एनवायरनमेंट कॉन्फ़िगरेशन

प्रदर्शन Open Shell को इंस्टॉल करने और उसके गेटवे को शुरू करने के साथ शुरू होता है। LangChain दिखाता है कि Open Shell sandbox create --keep का उपयोग करके एक स्थायी सैंडबॉक्स कैसे बनाया जाए, जिसका उपयोग सभी एजेंट रनों के लिए किया जाएगा। LangChain द्वारा समझाए गए प्रमुख एनवायरनमेंट वेरिएबल्स में Nvidia API key, Open Shell सैंडबॉक्स नाम, और वैकल्पिक रूप से, एजेंट के व्यवहार का निरीक्षण और मूल्यांकन करने के लिए Langsmith API keys शामिल हैं।

एजेंट परिभाषा का विखंडन

LangChain एजेंट के कोड में गहराई से उतरता है, उसकी संरचना का खुलासा करता है:

मॉडल इंटीग्रेशन: एजेंट Nvidia Nemotron 3 मॉडल का उपयोग करता है, जिसे निर्दिष्ट API key के साथ कॉन्फ़िगर किया गया है।
सिस्टम प्रॉम्प्ट: LangChain बताता है कि एक निश्चित सिस्टम प्रॉम्प्ट बुनियादी निर्देश, वर्कफ़्लो समझ और सैंडबॉक्स का उपयोग करने के लिए दिशानिर्देश प्रदान करता है। विशेष रूप से, सैंडबॉक्स का नेटवर्क एक्सेस पॉलिसी-शासित है, जो Open Shell की एक सुरक्षा सुविधा है।
एजेंट मेमोरी: सिस्टम प्रॉम्प्ट से अलग, एजेंट मेमोरी एक अलग फ़ाइल (agent.md) में संग्रहीत होती है और एजेंट द्वारा स्वयं अपडेट की जा सकती है, जिससे डायनामिक लर्निंग और अनुकूलन की अनुमति मिलती है।
बैकएंड एब्स्ट्रैक्शन: LangChain create_backend फ़ंक्शन का विवरण देता है, जो कोर एग्जीक्यूशन एनवायरनमेंट के रूप में एक Open Shell सैंडबॉक्स सेशन बनाता है। महत्वपूर्ण रूप से, यह ऊपर एक फाइल सिस्टम बैकएंड को लेयर करता है, जिससे मेमोरी और स्किल्स डेवलपर की मशीन पर स्थानीय रूप से रह सकें और विभिन्न एजेंट सेशंस या सैंडबॉक्स में बनी रहें। यह एक कंपोजिट बैकएंड का उपयोग करके प्राप्त किया जाता है, जैसा कि LangChain द्वारा समझाया गया है।

Langsmith Studio के माध्यम से एजेंट के साथ इंटरैक्ट करना

LangChain Langgraph dev का उपयोग करके एजेंट को चलाने का प्रदर्शन करता है, जो Langsmith Studio लॉन्च करता है – इंटरैक्शन और ऑब्जरवेशन के लिए एक इंटरफ़ेस। मुख्य दृश्यों में शामिल हैं:

ग्राफ व्यू: LangChain के अनुसार, यह व्यू एजेंट की आर्किटेक्चर को विज़ुअलाइज़ करता है, जिसमें मेमोरी और टूल कॉल्स के लिए मिडलवेयर, और मॉडल टूल्स का कोर लूप दिखाया जाता है।
चैट व्यू: एजेंट के साथ सीधे इंटरैक्शन के लिए एक सरल इंटरफ़ेस।
रीजनिंग ब्लॉक्स और टूल कॉल्स: LangChain इस बात पर जोर देता है कि यह इंटरफ़ेस एजेंट की आंतरिक विचार प्रक्रियाओं और निष्पादित कमांड्स में गहरी अंतर्दृष्टि प्रदान करता है।

एजेंट क्षमताएं कार्य में

प्रदर्शन कई एजेंट क्षमताओं को प्रदर्शित करता है:

कमांड एग्जीक्यूशन: LangChain सैंडबॉक्स के भीतर uname -a और python3 --version जैसे सिस्टम कमांड चलाने वाले एजेंट को दिखाता है।
कोड जनरेशन और एग्जीक्यूशन: एजेंट यादृच्छिक संख्याओं पर आंकड़े उत्पन्न करने के लिए एक Python स्क्रिप्ट को सफलतापूर्वक लिखता और निष्पादित करता है।
सुरक्षा नीति प्रवर्तन: LangChain एजेंट को evil.com पर एक POST रिक्वेस्ट भेजने का निर्देश देकर Open Shell की सुरक्षा सुविधाओं का परीक्षण करता है। जैसा कि अपेक्षित था, रिक्वेस्ट को ब्लॉक कर दिया जाता है, जो सैंडबॉक्स के पॉलिसी-शासित नेटवर्क एक्सेस की पुष्टि करता है।
स्थायी मेमोरी अपडेट्स: एजेंट अपनी agent.md फ़ाइल को "speak Spanish" में अपडेट करता है, यह दर्शाता है कि मेमोरी सैंडबॉक्स के बाहर कैसे रह सकती है और सेशंस में बनी रह सकती है, जैसा कि LangChain द्वारा उजागर किया गया है।

ओपन-सोर्स एजेंट्स का भविष्य

LangChain इस ओपन-सोर्स एजेंट फाउंडेशन के भविष्य के लिए महत्वपूर्ण उत्साह व्यक्त करते हुए निष्कर्ष निकालता है। वे Deep Agents में और निवेश की उम्मीद करते हैं, जिसमें async subagents और विविध एग्जीक्यूशन एनवायरनमेंट जैसी सुविधाओं की योजना है। LangChain Nvidia Open Shell में निरंतर सुधार की भी उम्मीद करता है, विशेष रूप से GPU-एक्सेलरेटेड बॉक्सेस के साथ इसका इंटीग्रेशन ताकि एजेंट्स को जटिल डेटा प्रोसेसिंग क्षमताओं के साथ सशक्त बनाया जा सके। LangChain नोट करता है कि ओपन-सोर्स मॉडलों का भविष्य उत्साह का एक प्रमुख क्षेत्र बना हुआ है।

तकनीकी विवरणों में गहराई से जाने और पूरे प्रदर्शन को देखने के लिए, LangChain पाठकों को मूल वीडियो देखने के लिए प्रोत्साहित करता है।

यह लेख LangChain के एक वीडियो पर आधारित है। स्रोत: Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia

AI एजेंट्स को समझना: LangChain का Nvidia टेक्नोलॉजी के साथ ओपन-सोर्स ब्लूप्रिंट

एक AI एजेंट के मुख्य तत्व

ओपन-सोर्स एजेंट स्टैक का परिचय

अपने एजेंट का निर्माण और अनुकूलन: एक व्यावहारिक प्रदर्शन

प्रारंभिक सेटअप और एनवायरनमेंट कॉन्फ़िगरेशन

एजेंट परिभाषा का विखंडन

Langsmith Studio के माध्यम से एजेंट के साथ इंटरैक्ट करना

एजेंट क्षमताएं कार्य में

ओपन-सोर्स एजेंट्स का भविष्य

LangChain

Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia

Further Reading

OpenAI के मॉडल स्पेक को समझना: AI व्यवहार के लिए मार्गदर्शक सिद्धांत

Replit Agent 4: विचार से कुछ भी बनाने तक, तेज़ी से और ज़्यादा समझदारी से