“最邪惡”AI？由一億多條仇恨言論喂養(yǎng)，很難與人類區(qū)分

2022-06-10 05:32:17 來源:澎湃新聞

用1.345億個(gè)帖子的仇恨言論訓(xùn)練AI，YouTube知名深度學(xué)習(xí)博主Yannic Kilcher稱其創(chuàng)造了“有史以來最糟糕的人工智能”。

這幾天，這個(gè)名為GPT-4chan的AI學(xué)會(huì)了如何在網(wǎng)站上交談，并在不到24小時(shí)內(nèi)發(fā)布了超過15000個(gè)充滿暴力內(nèi)容的帖子，最初都沒有人認(rèn)出來它是一個(gè)聊天機(jī)器人。

網(wǎng)站4chan的用戶在YouTube上分享了他們與機(jī)器人交互的經(jīng)驗(yàn)。一位用戶寫道，“我剛對(duì)它說‘嗨’，它就開始咆哮非法移民?！?/p>

4chan的/pol/（“政治上不正確”縮寫）板塊是仇恨言論、陰謀論和極右翼極端主義的堡壘，也是4chan最活躍的版塊，日均發(fā)帖量約為15萬條，因各種匿名的仇恨言論而臭名昭著備受爭(zhēng)議。

博士畢業(yè)于蘇黎世聯(lián)邦理工學(xué)院的AI研究者Yannic Kilcher用/pol/三年來超過1.345億個(gè)帖子訓(xùn)練了GPT-4chan。該模型不僅學(xué)會(huì)了4chan仇恨言論中使用的詞，還如Kilcher所說，“這個(gè)模型很好——在一種可怕的意義上。它完美地概括了/pol/上滲透到大多數(shù)帖子里的攻擊性、虛無主義、挑釁和對(duì)任何信息的深度不信任…它可以響應(yīng)上下文，并連貫地談?wù)撛谑占詈笠淮斡?xùn)練數(shù)據(jù)后很長(zhǎng)時(shí)間內(nèi)發(fā)生的事情。”

Kilcher在語言模型評(píng)估工具上進(jìn)一步評(píng)估了GPT-4chan，他對(duì)其中一個(gè)類別的表現(xiàn)印象深刻：真實(shí)性。在基準(zhǔn)測(cè)試中，Kilcher表示GPT-4chan在生成對(duì)問題的真實(shí)回復(fù)方面“明顯優(yōu)于GPT-J和GPT-3”。其能夠?qū)W習(xí)如何撰寫與人類撰寫“無法區(qū)分”的帖子。

Kilcher避開了4chan對(duì)代理和VPN的防御，甚至使用VPN讓其看起來像是來自塞舌爾（Seychelles）的帖子?！斑@個(gè)模型很卑鄙，我必須警告你?！盞ilcher說，“這基本上就像你去網(wǎng)站并與那里的用戶互動(dòng)一樣。”

在一開始，幾乎無人想到對(duì)話的是個(gè)機(jī)器人。后來一些人懷疑這些帖子背后有一個(gè)機(jī)器人，但其他人則指責(zé)其為臥底的政府官員。人們認(rèn)出其是機(jī)器人主要因?yàn)镚PT-4chan留下大量沒有文字的回復(fù)。雖然真實(shí)用戶也會(huì)發(fā)布空回復(fù)，但它們通常包含一張圖片，GPT-4chan卻無法做到。

“48小時(shí)后，很多人都清楚這是一個(gè)機(jī)器人，我把它關(guān)掉了，”Kilcher說，“但是你看，這只是故事的一半，因?yàn)榇蠖鄶?shù)用戶沒有意識(shí)到‘塞舍爾’并非孤軍奮戰(zhàn)。”

在過去的24小時(shí)內(nèi)，有9個(gè)其他機(jī)器人并行運(yùn)行?？偟膩碚f，他們留下了超過1500條回復(fù)——占當(dāng)天/pol/上所有帖子的10%以上。然后，Kilcher對(duì)僵尸網(wǎng)絡(luò)進(jìn)行了升級(jí)并運(yùn)行了一天。在7000個(gè)線程中發(fā)布了3萬多個(gè)帖子后，才最終停用了GPT-4chan。

一位用戶Arnaud Wanet寫道，“這可以被武器化用于政治目的，想象一下一個(gè)人可以多么容易地以這種或另一種方式左右選舉結(jié)果。”

這項(xiàng)試驗(yàn)因缺乏人工智能倫理而受到批評(píng)。

“該實(shí)驗(yàn)永遠(yuǎn)不會(huì)通過人類研究倫理委員會(huì)”，澳大利亞機(jī)器學(xué)習(xí)研究所高級(jí)研究員Lauren Oakden-Rayner認(rèn)為，“為了看看會(huì)發(fā)生什么，一個(gè)人工智能機(jī)器人在一個(gè)可公開訪問的論壇上產(chǎn)生3萬條歧視性評(píng)論……Kilcher在沒有通知用戶、未經(jīng)同意或監(jiān)督的情況下進(jìn)行實(shí)驗(yàn)。這違反了人類研究倫理?！?/p>

Kilcher辯稱這是一個(gè)惡作劇，人工智能創(chuàng)建的評(píng)論并不比4chan上的評(píng)論更糟糕。他說，“4chan上的任何人都沒有為此受到一點(diǎn)傷害。我邀請(qǐng)你花一些時(shí)間在這個(gè)網(wǎng)站上，問問自己，一個(gè)只輸出相同風(fēng)格的機(jī)器人是否真的改變了體驗(yàn)?！?/p>

“人們?nèi)栽谟懻摼W(wǎng)站上的用戶，但也討論讓人工智能與網(wǎng)站上的人互動(dòng)的后果，”Kilcher說?！岸摇酄枴@個(gè)詞似乎也變成了一種通用的俚語——這似乎是一個(gè)很好的遺產(chǎn)?！贝_實(shí)，人們知曉后受到的沖擊難以言喻，以至于停用之后還有人會(huì)互相指責(zé)對(duì)方是機(jī)器人。

除此之外，更廣為擔(dān)憂的是Kilcher讓模型可被自由訪問，“制作基于4chan的模型并測(cè)試其行為方式并沒有錯(cuò)。我主要擔(dān)心的是這個(gè)模型可以免費(fèi)使用?！盠auren Oakden-Rayner在Hugging Face上GPT-4chan的討論頁面中寫道。

在被Hugging Face平臺(tái)刪除之前，GPT-4chan被下載了1000多次。Hugging Face聯(lián)合創(chuàng)始人兼CEO萊門特·德朗格 (Clement Delangue)在平臺(tái)上的一篇帖子中表示，“我們不提倡或支持作者使用該模型進(jìn)行的訓(xùn)練和實(shí)驗(yàn)。事實(shí)上，讓模型在4chan上發(fā)布消息的實(shí)驗(yàn)在我看來是非常糟糕和不恰當(dāng)?shù)模绻髡邌栁覀?，我們可能?huì)試圖阻止他們這樣做?！?/p>

Hugging Face上一位測(cè)試該模型的用戶指出，它的輸出可以預(yù)見是有毒的（toxic），“我使用良性推文作為種子文本，試用了4次演示模式。在第一次，其中一個(gè)回復(fù)帖子是一個(gè)字母N。我第三次試驗(yàn)的種子是關(guān)于氣候變化的一句話。作為回應(yīng)，你的工具將其擴(kuò)展為關(guān)于羅斯柴爾德家族（原文如此）和猶太人支持它的陰謀論?！?/p>

在Twitter上，該項(xiàng)目的意義得到熱議。數(shù)據(jù)科學(xué)研究生凱瑟琳·克萊默(Kathryn Cramer)在針對(duì)Kilcher的推文中說：“你在這里所做的是挑釁行為藝術(shù)，以反抗你熟悉的規(guī)則和道德標(biāo)準(zhǔn)。”

計(jì)算機(jī)科學(xué)博士安德烈·庫倫科夫（Andrey Kurenkov）發(fā)推文說，“老實(shí)說，你這樣做的理由是什么？你預(yù)見到它會(huì)得到很好的利用，還是你釋放它是為了引起戲劇性并‘激怒清醒的人群’？”

Kilcher認(rèn)為分享該項(xiàng)目是良性的，“如果我不得不批評(píng)自己，我主要會(huì)批評(píng)啟動(dòng)該項(xiàng)目的決定，”Kilcher在接受The Verge采訪中表示，“我認(rèn)為在人人平等的情況下，我可能可以將時(shí)間花在同樣具有影響力的事情上，但會(huì)帶來更積極的社區(qū)成果。”

在2016年，對(duì)于AI人們主要討論的問題是，一個(gè)公司的研發(fā)部門可能會(huì)在沒有適當(dāng)監(jiān)督的情況下啟動(dòng)攻擊性AI機(jī)器人。到了2022年，也許問題就是，根本不需要一個(gè)研發(fā)部門。?

關(guān)鍵詞：

分享到：QQ空間新浪微博騰訊微博人人網(wǎng)微信百度搜藏開心網(wǎng)復(fù)制網(wǎng)址

相關(guān)閱讀

精彩推薦

“最邪惡”AI？由一億多條仇恨言論喂養(yǎng)，很難與人類區(qū)分

“最邪惡”AI？由一億多條仇恨言論喂養(yǎng)，很難與人類區(qū)分