北歐監獄新工種:讓囚犯訓練AI大模型,報酬...
騰訊新聞科技
2023-09-16 18:41:19
劃重點:
1.芬蘭初創公司Metroc聘用監獄囚犯訓練人工智能模型,每小時僅支付12元報酬,僅為該國最低工資標準的八分之一。
2.OpenAI等科技公司通過外包公司在全球雇傭數百萬“點擊工作者”訓練人工智能模型,主要集中在低收入的南半球國家。
3.在勞動力成本越來越高的今天,科技企業越來越多地轉向幾乎沒有其他選擇的人群--難民、經濟危機困擾國家的人口、囚犯。
相對於大型科技公司在南半球落後國家尋找廉價的數據勞工訓練人工智能模型,在高福利的芬蘭,科技公司很難尋找到數據勞工。在這一背景下,芬蘭人工智能初創公司Metroc將目光投向了在監獄內服刑的犯人,借助這些廉價的勞動力來訓練自己開發的模型。外媒實地走訪,揭開了芬蘭這種新型監獄勞動。以下為文章全文:
一個周三的早晨,我在一個沒有窗戶的房間裏,隔著一張無菌的白色桌子,被介紹給一位40多歲的女士。她有著方形的下巴,淡藍色的發帶把金色的頭發紮了起來。“女孩們都叫我橘子醬(Marmalade),”她說,也希望我這麽稱呼她。在芬蘭一所監獄裏服刑的橘子醬,將向我展示一種新型的監獄勞動。
除了一個裝水的小塑料瓶和一台惠普筆記本電腦,這張白色的桌子上什麽也沒有放置。服刑期間,橘子醬每天輪班三小時,每小時能夠得到1.54歐元(約合人民幣12元)的報酬(2022年芬蘭最低工資標準為13歐元/小時,約合人民幣100元)。這台筆記本電腦被編程為橘子醬播放關於房地產的短文,然後就剛剛閱讀的內容要求她回答“是”或“不是”。其中的一個問題問到:“前一段是指房地產決策,而不是申請嗎?”
“這種工作確實有點枯燥,”橘子醬聳聳肩說。她也不完全確定這個練習的目的。她沉思道,也許她正在幫助開發一款客服聊天機器人。
事實上,橘子醬正在訓練芬蘭初創公司Metroc的大型語言模型。該公司開發了一個搜索引擎,旨在幫助建築公司找到新批準的建築項目。為此,Metroc需要數據標簽來幫助其模型理解新聞和市政文件中關於即將出現的建築項目的線索。例如,人工智能必須能夠區分已經委托給建築師或窗戶裝配工的醫院建築項目和可能仍在招聘的項目。
在全球各國,數以百萬計的“點擊工作者”正在訓練人工智能模型,傳授機器如何區分行人和棕櫚樹,或者用什麽組合詞匯來描述暴力或性虐待。通常這些人集中在南半球,因為那裏的勞動力成本更低。比如,OpenAI聘請一家外包公司在肯尼亞、烏幹達和印度雇傭點擊工人。這種安排適用於美國公司,因為它們使用世界上最廣泛使用的語言--英語。但是在南半球沒有多少人會說芬蘭語。
這就是Metroc聘請犯人為其工作的原因。這家初創公司得到了廉價的、講芬蘭語的工人,而監獄係統可以為服刑的犯人提供就業機會,據說這種作法可以讓他們在獲釋後為數字世界的工作做好準備。利用囚犯來訓練人工智能,與技術下遊經常存在的低收入、有時是剝削性的勞動產生了令人不安的相似之處。但是在芬蘭,Metroc的這個項目得到了廣泛的支持。
“全球對數據勞工問題有一個共識。在芬蘭發生的事情,如果你仔細觀察就會發現非常不同,”一直研究芬蘭監獄數據勞工問題的赫爾辛基大學研究人員圖克卡·萊赫蒂涅米(Tuukka
Lehtiniemi)說。
四個月來,橘子醬一直住在芬蘭海門林納監獄。這所監獄的建築很現代,有大窗戶。色彩鮮豔的藝術品試圖在空蕩蕩的走廊上營造一種愉快的感覺。如果不是厚重的灰色安全門擋住了每個入口和出口,這些房間很容易屬於一個特別沒有靈魂的學校或大學建築群。
芬蘭可能因其開放式的監獄而聞名,囚犯可以在附近的城鎮工作或學習。但海門林納監獄與芬蘭其他的監獄不同。海門林納監獄是芬蘭安全等級最高的監獄,專門關押女囚犯。橘子醬被判服刑六年。根據芬蘭監獄製定的隱私條例,不能公布橘子醬的真實姓名、確切年齡或任何其他可以用來識別她的信息。但是在一個被判無期徒刑的囚犯可以在服刑12年後申請釋放的國家,6年的刑期是一個很重的判決。和住在這裏的其他100名囚犯一樣,橘子醬不允許離開海門林納監獄。
當橘子醬剛進入海門林納監獄開始服刑時,她會看著其他女犯人每天早上起床去工作:她們可以自願打掃衛生,洗衣服,或者縫製自己的衣服。一個6小時的輪班,她們將得到大約6歐元(約合6.50美元)的報酬。但是橘子醬不情願參加這樣的勞動。“我會覺得很累,”她說。相反,她在牢房裏呆了很長時間。當一名監獄顧問建議她嚐試“人工智能工作”時,短暫的三小時輪班對她很有吸引力。雖然報酬沒有其他工作高,但總比沒有的強。“報酬雖然不多,但總比呆在牢房裏好,”她說。到目前為止,橘子醬隻參加了三次輪班,但她已經有了成就感。
海門林納監獄是芬蘭三所囚犯可以自願通過數據勞動獲得報酬的監獄之一。在這三所監獄中,都提供了三台筆記本電腦供犯人參與人工智能工作。這些工作沒有為參與的囚犯設定目標。他們的報酬按小時計算,而不是按他們工作的速度或質量。坐在橘子醬身旁、留著一頭短發的獄警明娜·因基寧(Minna
Inkinen)說,在海門林納監獄,大約有20名囚犯嚐試過這種工作。“有些人肯定比其他人更喜歡這項工作,”她說。
當我周三早晨到達海門林納監獄時,縫紉室已經非常忙碌。囚犯們擠在縫紉機前,或者兩人一組在成堆的布料前幹活。但是人工智能工作的小房間在橘子醬到來之前完全是空的。因基寧說,目前總共隻有三名囚犯自願定期參加人工智能輪班,並解釋說另外兩人現在都在法庭上。“我更喜歡在一個小組裏做事,”橘子醬說,並補充說她一直開著門,這樣她就可以在回答問題的間隙和隔壁縫紉室的人聊天。
橘子醬需要回答的所有問題,都是由位於監獄南部100千米外、位於赫爾辛基的一個共創空間內,由人工編輯的問題。在這裏,我見到了Metroc高大而孩子氣的創始人、首席執行官尤西·維爾納(Jussi
Virnala)。經過一排室內秋千、一張台球桌和一群穿西裝的男人,他把我帶到一個悶熱的電話亭。這是激動人心的一周,他笑著解釋道。Metroc剛剛宣布了獲得了一筆200萬歐元(約合210萬美元)的融資,他計劃用這筆資金在北歐市場擴張。維爾納說,與他交談的投資者對該公司與芬蘭監獄的關係很感興趣。“每個人都對這種創新的方式感興趣,並為此感到興奮,”他說。
去監獄尋找數據勞工正是維爾納本人的主意。該公司需要母語為芬蘭語的人來幫助改善其大型語言模型對建築術語的理解。但在像芬蘭這樣的高工資經濟體中,在市場中找到這樣的數據勞工很難。芬蘭福利體係中慷慨的失業福利,讓芬蘭人沒有什麽動力在亞馬遜眾包平台Mechanical
Turk注冊,然後尋覓很低收入的點擊工作。“Mechanical
Turk幾乎沒有講芬蘭語的工人,”維爾納拉說。他補充說,與此同時,芬蘭語是一種隻有500萬母語使用者的語言,自動翻譯工具仍不擅長翻譯芬蘭語。
當維爾納向芬蘭監獄和緩刑機構的智能監獄項目負責人皮婭·普奧拉卡(Pia
Puolakka)兜售自己的構想時,普奧拉克立即產生了興趣。在疫情之前,另一家名為Vainu的芬蘭科技公司一直在使用囚犯從事數據勞動。但在聯合創始人之間的分歧導致該項目的公司負責人離職後,Vainu退出了與芬蘭智能監獄項目的合作。
當維爾納在2022年提出建議時,普奧拉卡渴望複活人工智能工作。她的工作是試圖讓芬蘭監獄和互聯網之間的關係更接近日益數字化的外部世界。到目前為止,她已經在每個牢房裏安裝了筆記本電腦,這樣囚犯們就可以瀏覽受限的網站列表,並申請視頻通話的許可。她認為數據勞動是自己任務的另一部分。
普奧拉卡的目的不是取代如製作路標或園藝等傳統的監獄勞動,而是給犯人提供更多的勞動選擇。數據標注隻能三小時一班。“這種工作每天幹八個小時可能會很累,”她說,並補充說,如果囚犯和其他類型的監獄勞動一起做數據標簽會很好。“這種類型的工作是未來,如果我們想讓囚犯為監獄外的生活做好準備,過一種沒有犯罪的生活,這些類型的技能可能至少與監獄提供的傳統工作類型一樣重要,”她說。
但是這種工作給囚犯們提供了多少可以在出獄後轉移到工作中的技能還不得而知。曾管理過一年多監獄項目的Vainu聯合創始人圖奧馬斯·拉西拉(Tuomas
Rasila)他承認,他沒有這方麵的證據。他說,這個項目運行的時間不夠長,不足以收集數據。“我認為,讓那些可能感覺置身於社會之外的人接受現代社會最高科技方麵的培訓,是一個令人振奮的想法,”拉西拉說。
不過也有一些人認為,這種新形式的監獄勞動是支撐人工智能革命的廉價勞動力熱潮的一部分。專注於人工智能的高級研究員阿莫斯·托赫(Amos
Toh)表示:“我們正在走向更方便、更高效的全自動社會的說法,往往會掩蓋這樣一個事實,即許多這些係統都是由人工驅動的。”在托赫看來,加速尋找所謂的點擊工作者創造出一種趨勢,即企業越來越多地轉向幾乎沒有其他選擇的人群:難民、受經濟危機困擾的國家的人口,如今還包括了囚犯。
“這種動態是我們非常熟悉的,”托赫說。“我們在這裏看到的是更廣泛現象的一部分,建築技術背後的勞動被外包給可能在剝削性工作條件下辛勤工作的工人。”托赫還質疑數據勞動是否能幫助囚犯建立數字技能。他說:“監獄裏的人可以通過很多方式提升自己,比如獲得證書和參加高等教育。但我懷疑以每小時1歐元的價格為一家公司做數據標記是否會帶來有意義的進步。”海門林納監獄確實為囚犯提供人工智能在線課程,但當工作人員試圖解釋這些課程的好處時,橘子醬卻麵無表情。
當我見到來自赫爾辛基大學的研究員萊赫蒂涅米時,我還對監獄項目的優點感到困惑。從監獄直接前往Metroc公司辦公室的整個過程讓我感覺不太舒服,因為監獄的犯人每小時隻能獲得1.54歐元的報酬,而Metroc卻在慶祝自己獲得了2000萬歐元的估值。在宏偉的圓頂赫爾辛基大教堂對麵的一家咖啡館裏,萊赫蒂涅米耐心地聽我描述那種感覺。
不過萊赫蒂涅米自己對囚犯的采訪讓他有了不同的看法,他對這個項目總體上是積極的。對於我關於薪酬差距的觀點,他認為囚犯並不是主流社會中的普通勞動力。“比較我作為一名研究人員的收入和囚犯在監獄裏的勞動所得,這是沒有意義的,”他說。“我聽到的唯一負麵消息是,這項工作做得不夠。隻有少數人能做到這一點,”他說,指的是每座監獄隻有三台筆記本電腦的限製。
“當我們想到數據勞動時,我們往往會想到Mechanical
Turk、南半球或美國農村的勞動力,”他說。但對他而言,這是一個獨特的本地版本的數據勞動,伴隨著有益於社會的扭曲。與其他監獄勞動選擇相比,它給囚犯提供了認知刺激的工作,同時也代表了芬蘭語言在人工智能革命中的地位。
如果沒有這種主動性,萊赫蒂涅米擔心非英語語言會被這種下一代技術拒之門外。對普通的語言學習者而言,芬蘭語方言更是難上加難。“不是所有的芬蘭人英語都講得很好,所以也需要這些本土形式的數據標簽,”萊赫蒂涅米說。Metroc並不是唯一一家被迫創造性地尋找芬蘭數據勞工的公司。2011年,芬蘭國家圖書館創建了一個遊戲來激勵誌願者幫助數字化其檔案。2020年,廣播公司YLE與赫爾辛基大學和國家開發公司VAKE合作,要求誌願者捐贈他們說芬蘭語的錄音。
目前還不清楚的是,芬蘭監獄的勞動條件--眾所周知的以改造為主--是否可以在其他司法方式不那麽進步的國家複製。根據一項數據,在美國,76%的囚犯報告說監獄勞動是強製性的。“美國的監獄係統與我們在芬蘭或北歐國家的監獄係統非常不同。這是一個完全不同的想法,”拉西拉說。“在芬蘭,圍繞數據勞工項目有一種完全積極的感覺,因為每個人都知道這是非常自願的。”
人工智能公司隻會需要更多的數據勞工,迫使他們不斷尋找越來越不尋常的勞動力來跟上步伐。隨著Metroc計劃將其業務擴展到北歐和芬蘭語以外的語言,維爾納正在考慮是否將監獄裏的數據勞工項目擴展到其他國家。“這是我們需要探索的東西,”他說。