Table of Contents
चीन की AI कंपनी डीपसीक ने अपना नया स्पर्श अटेंशन मॉडल V3.2-exp लॉन्च किया है, जो लंबे कॉन्टेक्स्ट ऑपरेशंस की इंफेरेंस कॉस्ट को आधा कर सकता है।
चीन की प्रमुख आर्टिफिशियल इंटेलिजेंस (AI) रिसर्च कंपनी डीपसीक ने सोमवार को अपना नया स्पर्श अटेंशन मॉडल V3.2-exp लॉन्च किया है। इस मॉडल का उद्देश्य खासतौर पर लंबे कॉन्टेक्स्ट ऑपरेशंस के दौरान इंफेरेंस कॉस्ट यानी खर्च को कम करना है। कंपनी का दावा है कि इस नए मॉडल की मदद से एपीआई (एप्लीकेशन प्रोग्रामिंग इंटरफेस) कॉल की लागत आधी हो सकती है, जो कि AI इंडस्ट्री में एक बड़ी समस्या का समाधान हो सकता है।
स्पर्श अटेंशन तकनीक
नए V3.2-exp मॉडल में स्पर्श अटेंशन तकनीक का इस्तेमाल किया गया है, जो दो प्रमुख सिस्टम्स पर आधारित है:
-
लाइटनिंग इंडेक्सर: यह सिस्टम कॉन्टेक्स्ट विंडो से जरूरी हिस्सों का चयन करता है।
-
फाइन-ग्रेन टोकन सिलेक्शन सिस्टम: यह सिस्टम उन हिस्सों से खास टोकन चुनकर अटेंशन विंडो में लोड करता है।
इन दोनों तकनीकों के माध्यम से, डीपसीक का नया मॉडल लंबे टेक्स्ट को भी कम सर्वर लोड पर प्रोसेस कर सकता है, जिससे की ऑपरेशन की लागत कम होती है।
also read: मेड इन इंडिया Arattai ऐप ने मचाई धूम, ऐप स्टोर पर नंबर वन…
शुरुआती टेस्टिंग और परिणाम
डीपसीक ने इस नए मॉडल की शुरुआती टेस्टिंग के नतीजे साझा किए हैं, जिसमें यह पाया गया कि स्पर्श अटेंशन की मदद से लंबे कॉन्टेक्स्ट वाले एपीआई कॉल्स की कीमत 50% तक घटाई जा सकती है। चूंकि यह मॉडल ओपन-सोर्स है और हगिंग फेस प्लेटफॉर्म पर उपलब्ध है, अन्य रिसर्च टीमें भी इस तकनीक का परीक्षण कर सकेंगी।
एआई रिसर्च पर प्रभाव
एआई इंडस्ट्री में इंफेरेंस कॉस्ट (पहले से ट्रेन किए गए मॉडल को चलाने की लागत) एक बड़ी चुनौती रही है। डीपसीक का कहना है कि स्पर्श अटेंशन तकनीक के उपयोग से ट्रांसफॉर्मर आर्किटेक्चर को अधिक एफिशिएंट (कुशल) बनाया जा सकता है। पहले, डीपसीक ने आर1 मॉडल लॉन्च किया था, जो रिइंफोर्समेंट लर्निंग के माध्यम से कम लागत में ट्रेन किया गया था। हालांकि, उसे उम्मीद के मुताबिक सफलता नहीं मिली थी, लेकिन अब स्पर्श अटेंशन के साथ कंपनी एआई को अधिक किफायती बनाने की दिशा में कदम बढ़ा रही है।
विशेषज्ञों की राय
AI विशेषज्ञों का मानना है कि हालांकि स्पर्श अटेंशन मॉडल पहले लॉन्च किए गए आर1 मॉडल जैसा बड़ा बदलाव न ला सके, लेकिन यह तकनीक अमेरिकी कंपनियों के लिए इंफेरेंस कॉस्ट को घटाने का एक अहम समाधान साबित हो सकती है।