Microsoft के नए अध्ययन में खुलासा: AI दस्तावेज़ संपादन में…

एक नए अध्ययन ने उद्योग में हलचल मचा दी है। Microsoft Research द्वारा किए गए शोध DELEGATE-52 में खुलासा हुआ है कि जनरेटिव आर्टिफिशियल इंटेलिजेंस, जब कॉर्पोरेट दस्तावेज़ों को लंबे समय तक संपादित और दोबारा लिखने के लिए उपयोग किया जाता है, तो उसमें त्रुटियाँ आने लगती हैं और जानकारी की गुणवत्ता से समझौता हो जाता है। यह शोध बड़े भाषा मॉडलों (LLMs) के प्रदर्शन का मूल्यांकन करने के लिए बनाया गया था, जिसमें उन्हें जटिल टेक्स्ट को पढ़ने, व्याख्या करने और संशोधित करने के लगातार कार्य दिए गए। नतीजे बताते हैं कि ये उपकरण छोटे कार्यों में प्रभावशाली होते हैं, लेकिन बिना मानवीय निगरानी के लंबी अवधि तक काम करने पर वे प्रासंगिक डेटा हटा सकते हैं, सही जानकारियाँ बदल सकते हैं और धीरे-धीरे विकृतियाँ उत्पन्न कर सकते हैं।

डिग्रेडेशन की प्रक्रिया: कैसे बढ़ती हैं गलतियाँ?

DELEGATE-52 बेंचमार्क को विशेष रूप से वास्तविक पेशेवर गतिविधियों का अनुकरण करने के लिए तैयार किया गया है। पारंपरिक मूल्यांकनों के विपरीत, जो अलग-अलग प्रश्नों पर केंद्रित होते हैं, यह नया परीक्षण मापता है कि जब कोई AI सिस्टम कई चरणों में रिपोर्ट तैयार करने, प्रेजेंटेशन बनाने और सामग्री को सारांशित करने जैसे विस्तृत कार्यों के लिए स्वायत्तता प्राप्त करता है तो क्या होता है। शोधकर्ताओं ने पाया कि समस्याएँ तब और गंभीर हो जाती हैं जब एक ही दस्तावेज़ के भीतर AI द्वारा किए जाने वाले इंटरैक्शन की संख्या बढ़ जाती है। ऐसा इसलिए होता है क्योंकि छोटी-छोटी त्रुटियाँ, भले ही प्रत्येक चरण में अगोचर हों, समय के साथ जमा होती रहती हैं।

दस्तावेज़ीकृत निम्नीकरण: छोटी गलतियों का संचयी प्रभाव

इस अध्ययन में पहचाना गया एक केंद्रीय फेनोमेनन है 'दस्तावेज़ीकृत निम्नीकरण' या document degradation। यह उस क्रमिक सटीकता हानि को संदर्भित करता है जो तब होती है जब एक दस्तावेज़ AI द्वारा कई बार संशोधित किया जाता है। एक संशोधन में थोड़ी बदली गई जानकारी को बाद के चरणों में सही मान लिया जाता है, जिससे प्रगतिशील विकृतियाँ पैदा होती हैं। यह व्यवहार मनुष्यों के बीच संदेशों के क्रमिक प्रसारण के प्रभाव जैसा है, जहाँ छोटे-छोटे बदलाव मिलकर मूल से बहुत अलग परिणाम उत्पन्न करते हैं। शोध के अनुसार, यह पैटर्न बाजार में उपलब्ध कई उन्नत मॉडलों में देखा गया।

पायथन प्रोग्रामिंग: अपवाद क्यों है?

मूल्यांकन किए गए क्षेत्रों में, पायथन प्रोग्रामिंग ने अपेक्षाकृत बेहतर प्रदर्शन दिखाया। शोधकर्ताओं ने देखा कि कोड जनरेशन और संशोधन के कार्यों में ऐसी विशेषताएँ हैं जो स्वचालित मूल्यांकन को बढ़ावा देती हैं: त्रुटियों को परीक्षणों, कंपाइलरों और वैलिडेटरों द्वारा पहचाना जा सकता है, जो पारंपरिक टेक्स्ट के मामले में संभव नहीं है। यह सॉफ्टवेयर विकास में AI ऑटोमेशन की सफलता को समझाने में मदद करता है। फिर भी, विशेषज्ञ चेतावनी देते हैं कि आर्टिफिशियल इंटेलिजेंस द्वारा उत्पादित कोड को प्रोडक्शन में जाने से पहले तकनीकी समीक्षा से गुज़रना चाहिए।

मानवीय निगरानी: अभी भी अनिवार्य

DELEGATE-52 का मुख्य निष्कर्ष यह है कि मानवीय निगरानी अपरिहार्य बनी हुई है। वर्तमान मॉडल, चाहे कितने भी उन्नत हों, उस संदर्भ, इरादों या परिणामों की वास्तविक समझ नहीं रखते जिन जानकारियों को वे संभालते हैं। अनुभवी पेशेवर तथ्य-जांच, आलोचनात्मक विश्लेषण, विसंगतियों की पहचान और परिणामों के सत्यापन में महत्वपूर्ण भूमिका निभाते हैं। व्यवहार में, आर्टिफिशियल इंटेलिजेंस और मानवीय निगरानी का संयोजन किसी भी अकेले दृष्टिकोण से बेहतर परिणाम देता है। यह शोध इस बात को रेखांकित करता है कि वित्तीय रिपोर्ट, कानूनी अनुबंध और वैज्ञानिक शोध जैसी महत्वपूर्ण गतिविधियों के लिए AI को एक सहायक उपकरण के रूप में देखा जाना चाहिए, न कि प्रतिस्थापन के रूप में।

अपनी वर्तमान सीमाओं के बावजूद, विशेषज्ञों का मानना है कि AI एजेंट तेज़ी से विकसित होते रहेंगे। नई आर्किटेक्चर, बड़े कॉन्टेक्स्ट विंडो, बाहरी डेटाबेस के साथ एकीकरण और उन्नत सत्यापन तंत्र आज देखी गई समस्याओं को काफी हद तक कम कर सकते हैं। कई लोग तर्क देते हैं कि ऑटोमेशन का भविष्य ऐसे सिस्टम बनाने पर निर्भर करेगा जो लगातार अपने स्वयं के उत्तरों की जाँच कर सकें – शायद कई एजेंटों के सहयोग और स्वतंत्र सत्यापन के माध्यम से। शोध के अनुसार, सबसे आशाजनक रास्ता मनुष्यों और मशीनों के बीच सहयोग का है, जो कम्प्यूटेशनल गति को मानवीय निर्णय के साथ जोड़ता है।

The Premise News का संपादकीय दृष्टिकोण: Microsoft Research का यह अध्ययन एक महत्वपूर्ण समय पर आया है जब दुनिया भर की कंपनियाँ उत्पादकता बढ़ाने के लिए AI में अरबों डॉलर का निवेश कर रही हैं। दस्तावेज़ीकृत निम्नीकरण की खोज यह दर्शाती है कि स्वायत्त प्रणालियों पर आँख मूंदकर भरोसा करना खतरनाक हो सकता है, विशेषकर उन क्षेत्रों में जहाँ सटीकता अपरिहार्य है। दांव पर सिर्फ रिपोर्टों की गुणवत्ता नहीं है, बल्कि संभावित रूप से विकृत जानकारी पर आधारित निर्णय हैं – जिनके वित्तीय, नियामक और यहाँ तक कि न्यायिक परिणाम हो सकते हैं। मुख्य तनाव पूर्ण ऑटोमेशन के वादे और इस वास्तविकता के बीच उजागर होता है कि AI अभी भी अपने द्वारा संभाली जा रही जानकारी का अर्थ नहीं समझता। आने वाले महीनों में पाठकों को ध्यान देना चाहिए कि टेक्नोलॉजी कंपनियाँ इन सीमाओं पर कैसे प्रतिक्रिया देती हैं: क्या वे नए सत्यापन तरीकों में निवेश करेंगी या अपने बाजार के वादों को समायोजित करेंगी। फिलहाल, सबसे महत्वपूर्ण सबक यह है कि कृत्रिम बुद्धिमत्ता मानवीय आलोचनात्मक दृष्टि का विकल्प नहीं है – वह उसे केवल पूरक बनाती है।

Microsoft के नए अध्ययन में खुलासा: AI दस्तावेज़ संपादन में बार-बार गलतियाँ करता है

डिग्रेडेशन की प्रक्रिया: कैसे बढ़ती हैं गलतियाँ?

दस्तावेज़ीकृत निम्नीकरण: छोटी गलतियों का संचयी प्रभाव

पायथन प्रोग्रामिंग: अपवाद क्यों है?

मानवीय निगरानी: अभी भी अनिवार्य

आपकी राय क्या है?