Utafiti wa Microsoft: AI hupoteza usahihi wakati wa…

Utafiti mpya kutoka Microsoft Research umebaini kuwa akili bandia ya kuzalisha, inapotumiwa kuhariri na kuandika upya hati za makampuni kwa muda mrefu, ina tabia ya kuanzisha makosa na kudhoofisha ubora wa taarifa. Utafiti huo, unaoitwa DELEGATE-52, ulitathmini utendaji wa mifano mikubwa ya lugha (LLMs) katika kazi mfululizo za kusoma, kutafsiri na kurekebisha maandishi changamano. Matokeo yanaonyesha kuwa ingawa zana hizi ni za kuvutia katika kazi fupi, zinaweza kuondoa data muhimu, kubadilisha taarifa sahihi na kusababisha upotovu unaoendelea zinapofanya kazi bila usimamizi wa binadamu mara kwa mara.

Tathmini ya hatari za uhuru wa AI kwenye hati

Kigezo cha DELEGATE-52 kiliundwa kuiga shughuli halisi za kitaalamu, kinajumuisha mamia ya maeneo ya maarifa. Kinyume na tathmini za kawaida ambazo huzingatia maswali ya pekee, mtihani huu mpya hupima kinachotokea wakati mfumo wa AI unapata uhuru wa kutekeleza mifuatano mirefu — kama vile kuandika ripoti, kuunda mawasilisho na kufupisha maudhui — katika hatua nyingi. Watafiti waliona kuwa matatizo yanazidi kuongezeka kadri idadi ya mwingiliano unaofanywa na AI ndani ya hati moja inavyoongezeka. Hii hutokea kwa sababu makosa madogo, hata yasiyoonekana katika kila hatua, hukusanyika kwa wakati.

Upungufu wa hati: mrundikano wa makosa madogo

Mojawapo ya matukio makuu yaliyotambuliwa ni ule unaoitwa upungufu wa hati. Hii ni upotezaji wa taratibu wa usahihi kadri hati inavyopitia marekebisho kadhaa yanayofanywa na AI. Taarifa iliyobadilishwa kidogo katika marekebisho moja inaweza kuchukuliwa kuwa sahihi katika hatua za baadaye, na kusababisha upotovu unaoendelea. Tabia hii inawakumbusha athari ya uwasilishaji mfululizo wa ujumbe kati ya watu, ambapo mabadiliko madogo yakijumlishwa hutoa matokeo tofauti sana na asili. Kulingana na utafiti, muundo huu ulionekana katika mifano mbalimbali ya hali ya juu inayopatikana sokoni.

Kwa nini akili bandia inapoteza usahihi?

Mifano mikubwa ya lugha hufanya kazi kwa kutabiri maneno ambayo yana uwezekano mkubwa wa kutokea kwa mfuatano, ndani ya muktadha fulani. Ingawa njia hii huzalisha maandishi ya kisasa, haihakikishi ufahamu kamili wa maana ya taarifa. Hati inapohaririwa mara kwa mara, mfano unahitaji kuamua nini cha kubaki, kuondoa au kurekebisha — na katika hali nyingi, taarifa muhimu hufupishwa kupita kiasi, hufasiriwa vibaya au hubadilishwa na maudhui yanayoonekana kuwa sahihi lakini si sahihi. Hati ndefu ni changamoto zaidi kwani zinahitaji mfumo kuzingatia muktadha mkubwa kwa wakati mmoja.

Utendaji bora wa programu ya Python

Kati ya maeneo yaliyotathminiwa, programu ya Python ilionyesha utendaji bora zaidi. Watafiti walibaini kuwa kazi za kuzalisha na kurekebisha msimbo zina sifa zinazofaa tathmini ya kiotomatiki: makosa yanaweza kutambuliwa na majaribio, vikusanyaji na vihakiki, jambo ambalo halifanyiki kwa maandishi ya kawaida. Hii husaidia kuelezea mafanikio makubwa ya uwekaji otomatiki wa AI katika ukuzaji wa programu. Hata hivyo, wataalamu wanaonya kuwa misimbo inayozalishwa na AI inahitaji kupitiwa kitaalamu kabla ya kutumika katika uzalishaji.

Jukumu lisilobadilishwa la usimamizi wa binadamu

Hitimisho kuu la DELEGATE-52 ni kwamba usimamizi wa binadamu bado ni muhimu. Mifano ya sasa, ingawa ni ya kisasa sana, haina ufahamu wa kweli wa muktadha, nia au matokeo yanayohusiana na taarifa wanazozishughulikia. Wataalamu wenye uzoefu wana jukumu muhimu katika kuhakiki ukweli, uchambuzi makini, kutambua hitilafu na kuhalalisha matokeo. Kwa vitendo, mchanganyiko kati ya AI na usimamizi wa binadamu huelekea kutoa matokeo bora zaidi kuliko mbinu yoyote pekee. Utafiti unasisitiza kuwa, kwa shughuli muhimu kama ripoti za fedha, mikataba ya kisheria na utafiti wa kisayansi, AI inapaswa kuwa chombo cha msaada, si mbadala.

Licha ya mapungufu ya sasa, wataalamu wanaamini kuwa mawakala wa AI wataendelea kubadilika kwa kasi. Usanifu mpya, madirisha makubwa ya muktadha, ujumuishaji na hifadhidata za nje na mifumo ya juu ya uthibitishaji inaweza kupunguza kwa kiasi kikubwa matatizo yanayoonekana leo. Wengi wanahoji kuwa mustakabali wa otomatiki utategemea kuundwa kwa mifumo inayoweza kuhakiki mara kwa mara majibu yake — labda kwa mawakala wengi wanaofanya kazi pamoja na uthibitishaji huru. Njia inayoahidi zaidi, kulingana na utafiti, ni ushirikiano kati ya binadamu na mashine, kuchanganya kasi ya kompyuta na uamuzi wa binadamu.

Maoni ya The Premise News: Utafiti wa Microsoft Research unakuja wakati muhimu, wakati makampuni duniani kote yanawekeza mabilioni katika AI wakitafuta tija. Ugunduzi wa upungufu wa hati unaonyesha kuwa kutumainiwa kwa mifumo inayojitegemea kunaweza kuwa hatari, hasa katika sekta ambapo usahihi ni jambo lisiloweza kujadiliwa. Kinachohusika si ubora wa ripoti tu, bali maamuzi yanayotokana na taarifa zinazoweza kupotoshwa — yenye matokeo ya kifedha, kisheria na hata kihalali. Mvutano mkuu unaofunuliwa ni kati ya ahadi ya otomatiki kamili na ukweli kwamba AI bado haielewi maana ya kile kinachokishughulikia. Katika miezi ijayo, wasomaji wanapaswa kufuatilia kwa karibu jinsi makampuni ya teknolojia yatakavyojibu mapungufu haya: kwa kuwekeza katika mbinu mpya za uthibitishaji au kurekebisha ahadi zao sokoni. Kwa sasa, somo muhimu zaidi ni kwamba akili bandia haichukui nafasi ya uangalizi makini wa binadamu — inakamilisha tu.

Utafiti wa Microsoft: AI hupoteza usahihi wakati wa kuhariri hati za makampuni

Tathmini ya hatari za uhuru wa AI kwenye hati

Upungufu wa hati: mrundikano wa makosa madogo

Kwa nini akili bandia inapoteza usahihi?

Utendaji bora wa programu ya Python

Jukumu lisilobadilishwa la usimamizi wa binadamu

Ulifikiria nini?