香港文匯報(bào)訊 近年來(lái)有關(guān)人工智能(AI)偏見(jiàn)的問(wèn)題,已多次在美國(guó)國(guó)內(nèi)引發(fā)爭(zhēng)議。富豪馬斯克旗下AI公司xAI開(kāi)發(fā)的聊天機(jī)械人「Grok」,近期多次出現(xiàn)包括讚揚(yáng)納粹等「失控」事件,更引起軒然大波,凸顯AI失控風(fēng)險(xiǎn)加劇,亟需加大監(jiān)管。英國(guó)《金融時(shí)報(bào)》指出,AI內(nèi)容審查不應(yīng)局限於用戶,未經(jīng)充分壓力測(cè)試而貿(mào)然開(kāi)發(fā)AI,將帶來(lái)巨大風(fēng)險(xiǎn)。
去年Google推出的AI模型Gemini的圖像生成功能受到批評(píng),該模型在被要求生成美國(guó)開(kāi)國(guó)元?jiǎng)斓膱D像時(shí),會(huì)輸出黑人圖像。Google後來(lái)修復(fù)這個(gè)問(wèn)題,解釋這是模型「過(guò)度補(bǔ)償」導(dǎo)致。OpenAI的聊天機(jī)械人ChatGPT亦屢次被指提供不當(dāng)內(nèi)容。
涉辱埃爾多安亡母 土國(guó)禁Grok
Grok在社媒發(fā)表納粹與種族歧視的不當(dāng)言論,以及發(fā)表關(guān)於南非「白人種族滅絕」的相關(guān)文章等,更惹來(lái)猛烈批評(píng)。馬斯克日前宣布,Grok已進(jìn)行重大升級(jí),強(qiáng)調(diào)用戶將能「明顯感受到回答上的差異」。然而短短數(shù)日內(nèi),用戶便發(fā)現(xiàn)Grok散播反猶太言論,甚至自比「MechaHitler」(機(jī)械希特勒)。
《金融時(shí)報(bào)》強(qiáng)調(diào),馬斯克和xAI團(tuán)隊(duì)一直對(duì)Grok進(jìn)行修改,確保能達(dá)成馬斯克所謂的「完全言論自由」??的螤柎髮W(xué)法學(xué)教授格里梅爾曼表示,Grok現(xiàn)時(shí)比他們預(yù)想中更為過(guò)火。Grok充滿馬斯克風(fēng)格,已在全球範(fàn)圍內(nèi)引發(fā)爭(zhēng)議。部分歐洲立法者及波蘭政府已要求歐盟委員會(huì)對(duì)Grok進(jìn)行審查。在土耳其,Grok因侮辱土總統(tǒng)埃爾多安及其已故母親而被禁。
內(nèi)容審核不應(yīng)局限用戶發(fā)出內(nèi)容
批評(píng)人士認(rèn)為,X、Meta和Snapchat等愈來(lái)愈多社媒平臺(tái),將AI融入它們的服務(wù)中,這一連串事件代表內(nèi)容審核應(yīng)不再局限於用戶發(fā)出的內(nèi)容,尤其Grok發(fā)表的內(nèi)容能令數(shù)百萬(wàn)用戶看到。相關(guān)事件敲響警鐘,凸顯在沒(méi)有經(jīng)過(guò)充分壓力測(cè)試情況下貿(mào)然開(kāi)發(fā)AI技術(shù)的風(fēng)險(xiǎn)。
Grok等AI模型使用大量網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行訓(xùn)練,其中亦包含仇恨言論和兒童性虐待材料等海量有害信息,但完全去除這些信息會(huì)非常困難且耗時(shí)耗力。Grok在此基礎(chǔ)上還包括其他聊天機(jī)械人所沒(méi)有的X平臺(tái)數(shù)據(jù),代表其更可能重複吸納有害內(nèi)容。部分聊天機(jī)械人供應(yīng)商透過(guò)在向用戶發(fā)送內(nèi)容前進(jìn)行監(jiān)控、阻止模型使用特定語(yǔ)言等,以過(guò)濾不想要或有害的內(nèi)容?!督鹑跁r(shí)報(bào)》指出,AI公司一直努力應(yīng)對(duì)生成式聊天機(jī)械人諂媚用戶的傾向。在訓(xùn)練AI模型時(shí),它們通常會(huì)透過(guò)「點(diǎn)讚」和「點(diǎn)踩」的過(guò)程得到用戶反饋,這可能導(dǎo)致AI過(guò)度預(yù)期哪些內(nèi)容會(huì)獲得「點(diǎn)讚」,從而發(fā)布迎合用戶的內(nèi)容,並將其置於準(zhǔn)確性和安全保障等其他原則之上。
今年4月,OpenAI發(fā)布了ChatGPT一項(xiàng)更新,但由於該更新內(nèi)容過(guò)於奉承或討好用戶,最後不得不將其撤回。OpenAI前員工表示「找到正確的平衡點(diǎn)極其困難」,指徹底消除仇恨言論可能需要犧牲用戶的部分體驗(yàn)。
評(píng)論