“最邪惡”AI?由一億多條仇恨言論喂養(yǎng),很難與人類區(qū)分

2022-06-10 05:32:17 來源:澎湃新聞

用1.345億個(gè)帖子的仇恨言論訓(xùn)練AI,YouTube知名深度學(xué)習(xí)博主Yannic Kilcher稱其創(chuàng)造了“有史以來最糟糕的人工智能”。

這幾天,這個(gè)名為GPT-4chan的AI學(xué)會(huì)了如何在網(wǎng)站上交談,并在不到24小時(shí)內(nèi)發(fā)布了超過15000個(gè)充滿暴力內(nèi)容的帖子,最初都沒有人認(rèn)出來它是一個(gè)聊天機(jī)器人。

網(wǎng)站4chan的用戶在YouTube上分享了他們與機(jī)器人交互的經(jīng)驗(yàn)。一位用戶寫道,“我剛對(duì)它說‘嗨’,它就開始咆哮非法移民?!?/p>

4chan的/pol/(“政治上不正確”縮寫)板塊是仇恨言論、陰謀論和極右翼極端主義的堡壘,也是4chan最活躍的版塊,日均發(fā)帖量約為15萬條,因各種匿名的仇恨言論而臭名昭著備受爭(zhēng)議。

博士畢業(yè)于蘇黎世聯(lián)邦理工學(xué)院的AI研究者Yannic Kilcher用/pol/三年來超過1.345億個(gè)帖子訓(xùn)練了GPT-4chan。該模型不僅學(xué)會(huì)了4chan仇恨言論中使用的詞,還如Kilcher所說,“這個(gè)模型很好——在一種可怕的意義上。它完美地概括了/pol/上滲透到大多數(shù)帖子里的攻擊性、虛無主義、挑釁和對(duì)任何信息的深度不信任…它可以響應(yīng)上下文,并連貫地談?wù)撛谑占詈笠淮斡?xùn)練數(shù)據(jù)后很長(zhǎng)時(shí)間內(nèi)發(fā)生的事情。”

Kilcher在語言模型評(píng)估工具上進(jìn)一步評(píng)估了GPT-4chan,他對(duì)其中一個(gè)類別的表現(xiàn)印象深刻:真實(shí)性。在基準(zhǔn)測(cè)試中,Kilcher表示GPT-4chan在生成對(duì)問題的真實(shí)回復(fù)方面“明顯優(yōu)于GPT-J和GPT-3”。其能夠?qū)W習(xí)如何撰寫與人類撰寫“無法區(qū)分”的帖子。

Kilcher避開了4chan對(duì)代理和VPN的防御,甚至使用VPN讓其看起來像是來自塞舌爾(Seychelles)的帖子?!斑@個(gè)模型很卑鄙,我必須警告你?!盞ilcher說,“這基本上就像你去網(wǎng)站并與那里的用戶互動(dòng)一樣。”

在一開始,幾乎無人想到對(duì)話的是個(gè)機(jī)器人。后來一些人懷疑這些帖子背后有一個(gè)機(jī)器人,但其他人則指責(zé)其為臥底的政府官員。人們認(rèn)出其是機(jī)器人主要因?yàn)镚PT-4chan留下大量沒有文字的回復(fù)。雖然真實(shí)用戶也會(huì)發(fā)布空回復(fù),但它們通常包含一張圖片,GPT-4chan卻無法做到。

“48小時(shí)后,很多人都清楚這是一個(gè)機(jī)器人,我把它關(guān)掉了,”Kilcher說,“但是你看,這只是故事的一半,因?yàn)榇蠖鄶?shù)用戶沒有意識(shí)到‘塞舍爾’并非孤軍奮戰(zhàn)。”

在過去的24小時(shí)內(nèi),有9個(gè)其他機(jī)器人并行運(yùn)行??偟膩碚f,他們留下了超過1500條回復(fù)——占當(dāng)天/pol/上所有帖子的10%以上。然后,Kilcher對(duì)僵尸網(wǎng)絡(luò)進(jìn)行了升級(jí)并運(yùn)行了一天。在7000個(gè)線程中發(fā)布了3萬多個(gè)帖子后,才最終停用了GPT-4chan。

一位用戶Arnaud Wanet寫道,“這可以被武器化用于政治目的,想象一下一個(gè)人可以多么容易地以這種或另一種方式左右選舉結(jié)果。”

這項(xiàng)試驗(yàn)因缺乏人工智能倫理而受到批評(píng)。

“該實(shí)驗(yàn)永遠(yuǎn)不會(huì)通過人類研究倫理委員會(huì)”,澳大利亞機(jī)器學(xué)習(xí)研究所高級(jí)研究員Lauren Oakden-Rayner認(rèn)為,“為了看看會(huì)發(fā)生什么,一個(gè)人工智能機(jī)器人在一個(gè)可公開訪問的論壇上產(chǎn)生3萬條歧視性評(píng)論……Kilcher在沒有通知用戶、未經(jīng)同意或監(jiān)督的情況下進(jìn)行實(shí)驗(yàn)。這違反了人類研究倫理?!?/p>

Kilcher辯稱這是一個(gè)惡作劇,人工智能創(chuàng)建的評(píng)論并不比4chan上的評(píng)論更糟糕。他說,“4chan上的任何人都沒有為此受到一點(diǎn)傷害。我邀請(qǐng)你花一些時(shí)間在這個(gè)網(wǎng)站上,問問自己,一個(gè)只輸出相同風(fēng)格的機(jī)器人是否真的改變了體驗(yàn)?!?/p>

“人們?nèi)栽谟懻摼W(wǎng)站上的用戶,但也討論讓人工智能與網(wǎng)站上的人互動(dòng)的后果,”Kilcher說?!岸摇酄枴@個(gè)詞似乎也變成了一種通用的俚語——這似乎是一個(gè)很好的遺產(chǎn)?!贝_實(shí),人們知曉后受到的沖擊難以言喻,以至于停用之后還有人會(huì)互相指責(zé)對(duì)方是機(jī)器人。

除此之外,更廣為擔(dān)憂的是Kilcher讓模型可被自由訪問,“制作基于4chan的模型并測(cè)試其行為方式并沒有錯(cuò)。我主要擔(dān)心的是這個(gè)模型可以免費(fèi)使用?!盠auren Oakden-Rayner在Hugging Face上GPT-4chan的討論頁面中寫道。

在被Hugging Face平臺(tái)刪除之前,GPT-4chan被下載了1000多次。Hugging Face聯(lián)合創(chuàng)始人兼CEO萊門特·德朗格 (Clement Delangue)在平臺(tái)上的一篇帖子中表示,“我們不提倡或支持作者使用該模型進(jìn)行的訓(xùn)練和實(shí)驗(yàn)。事實(shí)上,讓模型在4chan上發(fā)布消息的實(shí)驗(yàn)在我看來是非常糟糕和不恰當(dāng)?shù)模绻髡邌栁覀?,我們可能?huì)試圖阻止他們這樣做?!?/p>

Hugging Face上一位測(cè)試該模型的用戶指出,它的輸出可以預(yù)見是有毒的(toxic),“我使用良性推文作為種子文本,試用了4次演示模式。在第一次,其中一個(gè)回復(fù)帖子是一個(gè)字母N。我第三次試驗(yàn)的種子是關(guān)于氣候變化的一句話。作為回應(yīng),你的工具將其擴(kuò)展為關(guān)于羅斯柴爾德家族(原文如此)和猶太人支持它的陰謀論?!?/p>

在Twitter上,該項(xiàng)目的意義得到熱議。數(shù)據(jù)科學(xué)研究生凱瑟琳·克萊默(Kathryn Cramer)在針對(duì)Kilcher的推文中說:“你在這里所做的是挑釁行為藝術(shù),以反抗你熟悉的規(guī)則和道德標(biāo)準(zhǔn)。”

計(jì)算機(jī)科學(xué)博士安德烈·庫倫科夫(Andrey Kurenkov)發(fā)推文說,“老實(shí)說,你這樣做的理由是什么?你預(yù)見到它會(huì)得到很好的利用,還是你釋放它是為了引起戲劇性并‘激怒清醒的人群’?”

Kilcher認(rèn)為分享該項(xiàng)目是良性的,“如果我不得不批評(píng)自己,我主要會(huì)批評(píng)啟動(dòng)該項(xiàng)目的決定,”Kilcher在接受The Verge采訪中表示,“我認(rèn)為在人人平等的情況下,我可能可以將時(shí)間花在同樣具有影響力的事情上,但會(huì)帶來更積極的社區(qū)成果。”

在2016年,對(duì)于AI人們主要討論的問題是,一個(gè)公司的研發(fā)部門可能會(huì)在沒有適當(dāng)監(jiān)督的情況下啟動(dòng)攻擊性AI機(jī)器人。到了2022年,也許問題就是,根本不需要一個(gè)研發(fā)部門。?

關(guān)鍵詞:

本網(wǎng)站由 財(cái)經(jīng)產(chǎn)業(yè)網(wǎng) 版權(quán)所有 粵ICP備18023326號(hào)-29
聯(lián)系我們:85 572 98@qq.com