एक नए अध्ययन ने उद्योग में हलचल मचा दी है। Microsoft Research द्वारा किए गए शोध DELEGATE-52 में खुलासा हुआ है कि जनरेटिव आर्टिफिशियल इंटेलिजेंस, जब कॉर्पोरेट दस्तावेज़ों को लंबे समय तक संपादित और दोबारा लिखने के लिए उपयोग किया जाता है, तो उसमें त्रुटियाँ आने लगती हैं और जानकारी की गुणवत्ता से समझौता हो जाता है। यह शोध बड़े भाषा मॉडलों (LLMs) के प्रदर्शन का मूल्यांकन करने के लिए बनाया गया था, जिसमें उन्हें जटिल टेक्स्ट को पढ़ने, व्याख्या करने और संशोधित करने के लगातार कार्य दिए गए। नतीजे बताते हैं कि ये उपकरण छोटे कार्यों में प्रभावशाली होते हैं, लेकिन बिना मानवीय निगरानी के लंबी अवधि तक काम करने पर वे प्रासंगिक डेटा हटा सकते हैं, सही जानकारियाँ बदल सकते हैं और धीरे-धीरे विकृतियाँ उत्पन्न कर सकते हैं।
डिग्रेडेशन की प्रक्रिया: कैसे बढ़ती हैं गलतियाँ?
DELEGATE-52 बेंचमार्क को विशेष रूप से वास्तविक पेशेवर गतिविधियों का अनुकरण करने के लिए तैयार किया गया है। पारंपरिक मूल्यांकनों के विपरीत, जो अलग-अलग प्रश्नों पर केंद्रित होते हैं, यह नया परीक्षण मापता है कि जब कोई AI सिस्टम कई चरणों में रिपोर्ट तैयार करने, प्रेजेंटेशन बनाने और सामग्री को सारांशित करने जैसे विस्तृत कार्यों के लिए स्वायत्तता प्राप्त करता है तो क्या होता है। शोधकर्ताओं ने पाया कि समस्याएँ तब और गंभीर हो जाती हैं जब एक ही दस्तावेज़ के भीतर AI द्वारा किए जाने वाले इंटरैक्शन की संख्या बढ़ जाती है। ऐसा इसलिए होता है क्योंकि छोटी-छोटी त्रुटियाँ, भले ही प्रत्येक चरण में अगोचर हों, समय के साथ जमा होती रहती हैं।
दस्तावेज़ीकृत निम्नीकरण: छोटी गलतियों का संचयी प्रभाव
इस अध्ययन में पहचाना गया एक केंद्रीय फेनोमेनन है 'दस्तावेज़ीकृत निम्नीकरण' या document degradation। यह उस क्रमिक सटीकता हानि को संदर्भित करता है जो तब होती है जब एक दस्तावेज़ AI द्वारा कई बार संशोधित किया जाता है। एक संशोधन में थोड़ी बदली गई जानकारी को बाद के चरणों में सही मान लिया जाता है, जिससे प्रगतिशील विकृतियाँ पैदा होती हैं। यह व्यवहार मनुष्यों के बीच संदेशों के क्रमिक प्रसारण के प्रभाव जैसा है, जहाँ छोटे-छोटे बदलाव मिलकर मूल से बहुत अलग परिणाम उत्पन्न करते हैं। शोध के अनुसार, यह पैटर्न बाजार में उपलब्ध कई उन्नत मॉडलों में देखा गया।
पायथन प्रोग्रामिंग: अपवाद क्यों है?
मूल्यांकन किए गए क्षेत्रों में, पायथन प्रोग्रामिंग ने अपेक्षाकृत बेहतर प्रदर्शन दिखाया। शोधकर्ताओं ने देखा कि कोड जनरेशन और संशोधन के कार्यों में ऐसी विशेषताएँ हैं जो स्वचालित मूल्यांकन को बढ़ावा देती हैं: त्रुटियों को परीक्षणों, कंपाइलरों और वैलिडेटरों द्वारा पहचाना जा सकता है, जो पारंपरिक टेक्स्ट के मामले में संभव नहीं है। यह सॉफ्टवेयर विकास में AI ऑटोमेशन की सफलता को समझाने में मदद करता है। फिर भी, विशेषज्ञ चेतावनी देते हैं कि आर्टिफिशियल इंटेलिजेंस द्वारा उत्पादित कोड को प्रोडक्शन में जाने से पहले तकनीकी समीक्षा से गुज़रना चाहिए।
मानवीय निगरानी: अभी भी अनिवार्य
DELEGATE-52 का मुख्य निष्कर्ष यह है कि मानवीय निगरानी अपरिहार्य बनी हुई है। वर्तमान मॉडल, चाहे कितने भी उन्नत हों, उस संदर्भ, इरादों या परिणामों की वास्तविक समझ नहीं रखते जिन जानकारियों को वे संभालते हैं। अनुभवी पेशेवर तथ्य-जांच, आलोचनात्मक विश्लेषण, विसंगतियों की पहचान और परिणामों के सत्यापन में महत्वपूर्ण भूमिका निभाते हैं। व्यवहार में, आर्टिफिशियल इंटेलिजेंस और मानवीय निगरानी का संयोजन किसी भी अकेले दृष्टिकोण से बेहतर परिणाम देता है। यह शोध इस बात को रेखांकित करता है कि वित्तीय रिपोर्ट, कानूनी अनुबंध और वैज्ञानिक शोध जैसी महत्वपूर्ण गतिविधियों के लिए AI को एक सहायक उपकरण के रूप में देखा जाना चाहिए, न कि प्रतिस्थापन के रूप में।
अपनी वर्तमान सीमाओं के बावजूद, विशेषज्ञों का मानना है कि AI एजेंट तेज़ी से विकसित होते रहेंगे। नई आर्किटेक्चर, बड़े कॉन्टेक्स्ट विंडो, बाहरी डेटाबेस के साथ एकीकरण और उन्नत सत्यापन तंत्र आज देखी गई समस्याओं को काफी हद तक कम कर सकते हैं। कई लोग तर्क देते हैं कि ऑटोमेशन का भविष्य ऐसे सिस्टम बनाने पर निर्भर करेगा जो लगातार अपने स्वयं के उत्तरों की जाँच कर सकें – शायद कई एजेंटों के सहयोग और स्वतंत्र सत्यापन के माध्यम से। शोध के अनुसार, सबसे आशाजनक रास्ता मनुष्यों और मशीनों के बीच सहयोग का है, जो कम्प्यूटेशनल गति को मानवीय निर्णय के साथ जोड़ता है।
