የማይክሮሶፍት ጥናት፡ አርቲፊሻል ኢንተሊጀንስ የኮርፖሬት ሰነዶችን ሲያስተካክል ትክክለኛነቱን…

የማይክሮሶፍት ሪሰርች አዲስ ጥናት እንደሚያሳየው አርቲፊሻል ኢንተሊጀንስ (AI) የኮርፖሬት ሰነዶችን ለረጅም ጊዜ ሲያስተካክል ትክክለኛነቱን ያጣል እንዲሁም የመረጃ ጥራትን ያበላሻል። ጥናቱ DELEGATE-52 የሚል ስያሜ የተሰጠው ሲሆን ትልልቅ የቋንቋ ሞዴሎች (LLMs) ውስብስብ ጽሑፎችን በተከታታይ በማንበብ፣ በመተርጎም እና በማስተካከል ረገድ ያላቸውን አፈጻጸም መርምሯል። ውጤቶቹ እንደሚጠቁሙት እነዚህ መሳሪያዎች በአጭር ተግባራት ውስጥ አስደናቂ ቢሆኑም ያለቋሚ የሰው ቁጥጥር ሲንቀሳቀሱ ጠቃሚ መረጃዎችን ማስወገድ፣ ትክክለኛ መረጃዎችን መቀየር እና ተራማጅ ማዛባቶችን ማስገንዘብ ይችላሉ።

የDELEGATE-52 ምርምር ዘዴ እና ዋና ግኝቶቹ

የDELEGATE-52 መለኪያ የተፈጠረው እውነተኛ ሙያዊ ተግባራትን ለማስመሰል ሲሆን በዙሪያው ያሉ በርካታ የእውቀት ዘርፎችን ያሳትፋል። ከተለምዷዊ ግምገማዎች በተለየ መልኩ በገለልተኛ ጥያቄዎች ላይ ከማተኮር ይልቅ አዲሱ ፈተና የሚለካው የAI ሥርዓት ሪፖርቶች ማዘጋጀት፣ አቀራረቦችን መፍጠር እና ይዘትን ማጠቃለል ያሉ ረጅም ሂደቶችን በብዙ ደረጃዎች ለማከናወን ራስ ገዝ በሆነ መልኩ ሲሰጥ ምን እንደሚከሰት ነው። ተመራማሪዎቹ እንዳስተዋሉት ችግሮቹ ሰነድ ውስጥ በሚደረጉ የአርቲፊሻል ኢንተሊጀንስ መስተጋብር ብዛት እየጠነከሩ ይሄዳሉ። ይህ የሆነው በእያንዳንዱ ደረጃ ላይ የሚፈጸሙ ትናንሽ ስህተቶች ምንም እንኳ ሊታወቁ ባይችሉም ከጊዜ ጋር ስለሚከማቹ ነው።

የሰነድ መበላሸት ክስተት

የምርምሩ ዋና ድምዳሜዎች አንዱ የሰነድ መበላሸት (documental degradation) ተብሎ የሚጠራው ክስተት ነው። ይህ ማለት አንድ ሰነድ በAI በተከታታይ ሲስተካከል ትክክለኛነቱ ቀስ በቀስ መጥፋት ነው። አንድ መረጃ በአንድ ጊዜ ላይ በትንሹ ተቀይሮ ከሆነ በሚቀጥሉት ደረጃዎች እንደ ትክክለኛ ሊታሰብ ይችላል፣ ይህም ተራማጅ ማዛባቶችን ያስከትላል። ይህ ባህርይ በሰዎች መካከል የሚደረጉ ተከታታይ የመልእክት ማስተላለፎች የሚያስከትለውን ውጤት ያስታውሳል፣ ትናንሽ ለውጦች ተደምረው ከዋናው እጅግ የተለየ ውጤት ያስገኛሉ። ምርምሩ እንደሚገልጸው ይህ አሰራር በገበያ ላይ ባሉ የተለያዩ የላቁ ሞዴሎች ላይ ተስተውሏል።

ለትክክልነት መጥፋት ምክንያቶቹ እና የPython ተመራጭነት

ትልቁ የቋንቋ ሞዴሎች የሚሰሩት በተሰጠ አውድ ውስጥ የትኞቹ ቃላት በቅደም ተከተል ሊታዩ እንደሚችሉ በመተንበይ ነው። ይህ አቀራረብ የተራቀቁ ጽሑፎችን ቢያመነጭም የመረጃውን ትክክለኛ ትርጉም ፍጹም መረዳትን አያረጋግጥም። አንድ ሰነድ ተደጋጋሚ አርትዖት በሚደረግበት ጊዜ ሞዴሉ ምን ማቆየት፣ ማስወገድ ወይም ማስተካከል እንዳለበት መወሰን አለበት፣ እና በብዙ ሁኔታዎች አስፈላጊ መረጃዎች ከልክ በላይ ይጠቃለላሉ፣ በአግባቡ አይተረጎሙም ወይም በሚመስል ትክክለኛ ግን ስህተት በሆነ ይዘት ይተካሉ። ረጅም ሰነዶች የበለጠ ፈታኝ ናቸው ምክንያቱም ሥርዓቱ በአንድ ጊዜ ከፍተኛ መጠን ያለው አውድ ማገናዘብ ስለሚኖርበት ነው።

Python ፕሮግራሚንግ ከወጥመዶች ማምለጥ

ምርምሩ ውስጥ ከተመዘኑት ዘርፎች መካከል የPython ፕሮግራሚንግ ተግባራት በአንጻራዊ ሁኔታ የተሻለ አፈጻጸም አሳይተዋል። ተመራማሪዎቹ እንዳስተዋሉት ኮድን ማመንጨት እና ማስተካከል ሥራ አውቶማቲክ ግምገማን የሚደግፉ ባህሪያት አሏቸው፡ ስህተቶች በሙከራዎች፣ በማጠናቀሪያ ፕሮግራሞች እና በማረጋገጫ መሳሪያዎች ሊታወቁ ይችላሉ፣ ይህ ደግሞ በተለምዷዊ ጽሑፎች ላይ አይሳካም። ይህ በተራው ደግሞ በሶፍትዌር ልማት ውስጥ የAI አውቶሜሽን ትልቅ ስኬት እንዳለው ለማስረዳት ይረዳል። ቢሆንም ባለሙያዎች በአርቲፊሻል ኢንተሊጀንስ የሚመረተው ኮድ ወደ ምርት ከመግባቱ በፊት ቴክኒካል ግምገማ ማድረግ እንዳለበት ያስጠነቅቃሉ።

የሰው ቁጥጥር የማይተካ ሚና እና የወደፊት እይታ

የDELEGATE-52 ዋነኛ መደምደሚያ የሰው ቁጥጥር አሁንም አስፈላጊ ነው የሚል ነው። አሁን ያሉት ሞዴሎች ምንም ያህል የላቁ ቢሆኑም የሚጠቀሙባቸውን መረጃዎች አውድ፣ ዓላማ ወይም ውጤቶች እውነተኛ ግንዛቤ የላቸውም። ልምድ ያላቸው ባለሙያዎች እውነታ ማረጋገጥ፣ ወሳኝ ትንተና ማድረግ፣ አለመጣጣም መለየት እና ውጤቶችን ማረጋገጥ ረገድ ወሳኝ ሚና ይጫወታሉ። በተግባር አርቲፊሻል ኢንተሊጀንስን ከሰው ቁጥጥር ጋር ማጣመር ከሁለቱም የተለያዩ አቀራረቦች የተሻለ ውጤት ያስገኛል። ጥናቱ እንደ ፋይናንሺያል ሪፖርቶች፣ የሕግ ኮንትራቶች እና ሳይንሳዊ ምርምሮች ባሉ ወሳኝ ተግባራት AI የድጋፍ መሳሪያ እንጂ ምትክ መሆን እንደሌለበት ያጠነክራል።

ምንም እንኳ የአሁኑ ውስንነቶች ቢኖሩም ባለሙያዎች የAI ኤጀንቶች በፍጥነት መሻሻል እንደሚቀጥሉ ያምናሉ። አዳዲስ አርክቴክቸር፣ ትላልቅ የአውድ መስኮቶች፣ ከውጭ የመረጃ ቋቶች ጋር ውህደት እና የላቁ የማረጋገጫ ዘዴዎች ዛሬ የሚስተዋሉትን ችግሮች በእጅጉ ሊቀንሱ ይችላሉ። ብዙዎች የአውቶሜሽን ወደፊት ሁኔታ የሚወሰነው የራሳቸውን መልሶች በተከታታይ ማረጋገጥ የሚችሉ ሥርዓቶችን በመፍጠር ላይ ነው ይላሉ፣ ምናልባትም በጋራ የሚሰሩ በርካታ ኤጀንቶች እና ገለልተኛ ማረጋገጫዎች ሊኖሩ ይችላሉ። ምርምሩ እንደሚጠቁመው በጣም ተስፋ ሰጪው መንገድ የሰው-ማሽን ትብብር ነው፣ የኮምፒውተር ፍጥነትን ከሰው ውሳኔ ጋር ያጣምራል።

የThe Premise News አርታዒ አስተያየት: የማይክሮሶፍት ሪሰርች ጥናት በአሁኑ ወቅት የመጣው ዓለም ዙሪያ ያሉ ኩባንያዎች በቢሊዮን የሚቆጠር ገንዘብ በAI ላይ ኢንቨስት እያደረጉ ምርታማነትን ለማሳደግ በሚሹበት ወቅት ነው። የሰነድ መበላሸት ግኝት እንደሚያሳየው በራስ ገዝ ሥርዓቶች ላይ ጭፍን መታመን አደገኛ ሊሆን ይችላል፣ በተለይም ትክክለኛነት የማይታለፍባቸው ዘርፎች ላይ። አደረጃጀቱ የሪፖርቶች ጥራት ብቻ ሳይሆን ሊዛወሩ በሚችሉ መረጃዎች ላይ የተመሰረቱ ውሳኔዎችን ይመለከታል—ከነዚህም የፋይናንስ፣ የቁጥጥር እና የፍርድ ቤት ውጤቶች ጋር። ዋነኛው ውጥረት በሙሉ አውቶሜሽን ተስፋ እና AI አሁንም የሚቆጣጠረውን ነገር ትርጉም አለመረዱ እውነታ መካከል ይገኛል። በሚቀጥሉት ወራት አንባቢዎች የቴክኖሎጂ ኩባንያዎች ለእነዚህ ውስንነቶች እንዴት ምላሽ እንደሚሰጡ መከታተል አለባቸው፡ አዳዲስ የማረጋገጫ ዘዴዎችን በመዘርጋት ወይም የገበያ ተስፋዎቻቸውን በማስተካከል። ለአሁኑ በጣም አስፈላጊው ትምህርት አርቲፊሻል ኢንተሊጀንስ የሰውን ወሳኝ አይን አይተካም—የሚያሟላው ብቻ ነው።

የማይክሮሶፍት ጥናት፡ አርቲፊሻል ኢንተሊጀንስ የኮርፖሬት ሰነዶችን ሲያስተካክል ትክክለኛነቱን ያጣል

የDELEGATE-52 ምርምር ዘዴ እና ዋና ግኝቶቹ

የሰነድ መበላሸት ክስተት

ለትክክልነት መጥፋት ምክንያቶቹ እና የPython ተመራጭነት

Python ፕሮግራሚንግ ከወጥመዶች ማምለጥ

የሰው ቁጥጥር የማይተካ ሚና እና የወደፊት እይታ

ምን አሰቡ?