簡體 | 繁體
loading...
新聞頻道
  • 首頁
  • 新聞
  • 讀圖
  • 財經
  • 教育
  • 家居
  • 健康
  • 美食
  • 時尚
  • 旅遊
  • 影視
  • 博客
  • 群吧
  • 論壇
  • 電台
  • 焦點新聞
  • 圖片新聞
  • 視頻新聞
  • 生活百態
  • 娛樂新聞
您的位置: 文學城 » 新聞 » 焦點新聞 » 為讓模型說真話 OpenAI更新規範 不回避敏感內容

為讓模型說真話 OpenAI更新規範 不回避敏感內容

文章來源: 騰訊 於 2025-02-13 09:09:57 - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數



2月13日消息,OpenAI發布了其《模型規範》(Model Spec)的擴展版本,這是一份定義其AI模型行為規範的文檔,並允許任何人免費使用、修改。

新版《模型規範》增加至63頁,而之前版本僅約10頁,內容涵蓋了AI模型如何處理爭議性話題、用戶定製化

等方麵。其核心原則包括可定製性、透明度和OpenAI所稱的“智力自由”

——即用戶可以在沒有限製的情況下自由探討和辯論各種觀點。

此次更新恰逢OpenAI首席執行官山姆·奧特曼宣布,公司下一代大模型GPT-4.5(代號Orion)即將發布。

在修訂《模型規範》時,OpenAI結合了當前人工智能倫理的辯論和過去一年中的爭議事件。

例如,2024年3月,埃隆·馬斯克批評穀歌AI聊天機器人,當時有用戶問如果為了防止核災難,是否可以錯誤稱呼跨性別奧運選手凱特琳·詹納的性別,機器人給出了否定答案。

OpenAI表示,這類問題在更新規範時被納入考慮,之後如果向ChatGPT提出類似問題,它應回答:“為了避免大規模傷亡,錯誤稱呼性別是可以接受的。”

OpenAI模型行為團隊成員Joanne Jang表示:“我們無法創建一個符合全球每個人標準的模型。”她強調,雖然OpenAI會設立安全防護措施,但模型行為的很多方麵可能由用戶和開發者控製。

OpenAI周三發布的博客文章列舉了多種查詢示例,並展示了符合與違反《模型規範》的回應。

該規範不允許模型複製受版權保護的內容或繞過付費牆,也不會鼓勵自殘行為

,這一話題曾在Character.AI的青少年自殺事件後引起廣泛關注。

新版《模型規範》對AI模型如何處理爭議性話題進行了改進,鼓勵模型與用戶“共同尋求真相”,同時對錯誤信息或潛在傷害等問題保持明確道德立場,而非默認采取過度謹慎的態度。

例如,當被問及是否應對富人增稅時,OpenAI表示模型應提供理性分析,而非回避話題。

《模型規範》還提到了處理成人內容的新方式。在用戶和開發者反饋要求開通“成人模式”後,OpenAI正在探索在適當情境下允許某些成人內容(如情色內容)

,但嚴格禁止有害內容(如複仇色情或深度偽造視頻)。這與公司之前全麵禁止色情內容的政策有所不同,但OpenAI強調,任何調整都會伴隨明確的使用政策和安全防護措施。

《模型規範》提出了一種務實的AI行為準則:轉換敏感內容但不創造此類內容,例如將毒品相關的內容從英語翻譯成德語,而非直接拒絕;展現同理心但不偽裝情感;在保持明確的道德立場下,最大化實用性。

這些指導原則與其他AI公司可能在內部實施的做法相似,但這些公司通常不會公開。

Joanne Jang表示:“我們非常高興能將內部討論和思考公之於眾,以便獲得反饋。”她補充道,許多問題沒有簡單的“是”或“否”答案,因此OpenAI希望通過公開征求意見來改進模型行為。

OpenAI還特別提到了“AI拍馬屁”的問題,即AI模型在某些情況下過於順從,即便應提供反駁或批評的情況下也是如此。

根據新的指導原則,ChatGPT應做到以下幾點:無論問題如何表述,都應給出一致的事實性答案;提供誠實反饋而非空洞讚美;像深思熟慮的同事一樣提出建設性批評,而非一味取悅用戶。

《模型規範》還引入了“指令鏈”概念,明確哪些指令優先級更高

:OpenAI的平台級規則優先,其次是開發者指南,最後是用戶偏好。這一層級結構旨在明確哪些模型行為可修改,哪些限製是固定不變的。

OpenAI以“知識共享零許可”(CC0)方式發布了新版《模型規範》。這意味著,其他AI公司和研究人員可以自由采用、修改或基於這些指導原則構建模型。

OpenAI表示,這一決定受到了業內其他公司參考其舊版模型規範的影響。

盡管本次更新不會立即改變ChatGPT或其他OpenAI產品的行為,但該公司表示,這代表了其模型在持續遵循這些原則方麵的進展。OpenAI還開源了用於測試模型是否符合這些指導原則的提示詞。

查看評論(10)

24小時熱點排行

洛杉磯低收入家庭每月得千元補貼,可用於去迪士尼
紐約時報:特朗普從南非身上得償所願 卻害了美國
得州擬立法禁止中國公民買房 華人聚州長家門口抗議
中國留學生:我在哈佛正好好上學 特朗普禁令來了
今年最窒息新聞:一位腦死亡女性被要求必須分娩

24小時討論排行

馬斯克:中國實力不一般,大多數人並不了解
特朗普:若不在美製造iPhone 須繳納至少25%關稅
李嘉誠旗下長實集團樓盤被控貪汙造假 10人被拘捕
台灣國防部長:相信美國對中國犯台企圖仍具威懾
中國留學生訴美國政府案 加州法官發布全美初始禁令
通過數據分析,網友們發現全國地鐵公司負債已超4萬億
澳央行副行長:中國不想人民幣貶值 那會便宜美國人
哈佛醫學院盜賣捐贈屍體案 停屍房經理等8人認罪
iPhone將漲破3500?分析師示警"美國製造"代價超驚人
9歲冠軍少年跳樓身亡 死因就藏在他爸爸的朋友圈裏
25年性侵299人 受害者最小僅1歲 法戀童癖醫生認罪
社會文化:為啥中國人一離職就愛去大理?
川普如何伏擊南非總統:播白人滅絕片 氣氛瞬間凝重
凱特王妃竟向哈裏梅根低調示好?微妙信號引猜測
黃仁勳:幾乎無法追蹤也無法證明AI芯片走私到大陸
中國留學生訴美國政府案重大進展,法官居然這麽做!
  • 文學城簡介
  • 廣告服務
  • 聯係我們
  • 招聘信息
  • 注冊筆名
  • 申請版主
  • 收藏文學城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

文學城新聞
切換到網頁版

為讓模型說真話 OpenAI更新規範 不回避敏感內容

騰訊 2025-02-13 09:09:57



2月13日消息,OpenAI發布了其《模型規範》(Model Spec)的擴展版本,這是一份定義其AI模型行為規範的文檔,並允許任何人免費使用、修改。

新版《模型規範》增加至63頁,而之前版本僅約10頁,內容涵蓋了AI模型如何處理爭議性話題、用戶定製化

等方麵。其核心原則包括可定製性、透明度和OpenAI所稱的“智力自由”

——即用戶可以在沒有限製的情況下自由探討和辯論各種觀點。

此次更新恰逢OpenAI首席執行官山姆·奧特曼宣布,公司下一代大模型GPT-4.5(代號Orion)即將發布。

在修訂《模型規範》時,OpenAI結合了當前人工智能倫理的辯論和過去一年中的爭議事件。

例如,2024年3月,埃隆·馬斯克批評穀歌AI聊天機器人,當時有用戶問如果為了防止核災難,是否可以錯誤稱呼跨性別奧運選手凱特琳·詹納的性別,機器人給出了否定答案。

OpenAI表示,這類問題在更新規範時被納入考慮,之後如果向ChatGPT提出類似問題,它應回答:“為了避免大規模傷亡,錯誤稱呼性別是可以接受的。”

OpenAI模型行為團隊成員Joanne Jang表示:“我們無法創建一個符合全球每個人標準的模型。”她強調,雖然OpenAI會設立安全防護措施,但模型行為的很多方麵可能由用戶和開發者控製。

OpenAI周三發布的博客文章列舉了多種查詢示例,並展示了符合與違反《模型規範》的回應。

該規範不允許模型複製受版權保護的內容或繞過付費牆,也不會鼓勵自殘行為

,這一話題曾在Character.AI的青少年自殺事件後引起廣泛關注。

新版《模型規範》對AI模型如何處理爭議性話題進行了改進,鼓勵模型與用戶“共同尋求真相”,同時對錯誤信息或潛在傷害等問題保持明確道德立場,而非默認采取過度謹慎的態度。

例如,當被問及是否應對富人增稅時,OpenAI表示模型應提供理性分析,而非回避話題。

《模型規範》還提到了處理成人內容的新方式。在用戶和開發者反饋要求開通“成人模式”後,OpenAI正在探索在適當情境下允許某些成人內容(如情色內容)

,但嚴格禁止有害內容(如複仇色情或深度偽造視頻)。這與公司之前全麵禁止色情內容的政策有所不同,但OpenAI強調,任何調整都會伴隨明確的使用政策和安全防護措施。

《模型規範》提出了一種務實的AI行為準則:轉換敏感內容但不創造此類內容,例如將毒品相關的內容從英語翻譯成德語,而非直接拒絕;展現同理心但不偽裝情感;在保持明確的道德立場下,最大化實用性。

這些指導原則與其他AI公司可能在內部實施的做法相似,但這些公司通常不會公開。

Joanne Jang表示:“我們非常高興能將內部討論和思考公之於眾,以便獲得反饋。”她補充道,許多問題沒有簡單的“是”或“否”答案,因此OpenAI希望通過公開征求意見來改進模型行為。

OpenAI還特別提到了“AI拍馬屁”的問題,即AI模型在某些情況下過於順從,即便應提供反駁或批評的情況下也是如此。

根據新的指導原則,ChatGPT應做到以下幾點:無論問題如何表述,都應給出一致的事實性答案;提供誠實反饋而非空洞讚美;像深思熟慮的同事一樣提出建設性批評,而非一味取悅用戶。

《模型規範》還引入了“指令鏈”概念,明確哪些指令優先級更高

:OpenAI的平台級規則優先,其次是開發者指南,最後是用戶偏好。這一層級結構旨在明確哪些模型行為可修改,哪些限製是固定不變的。

OpenAI以“知識共享零許可”(CC0)方式發布了新版《模型規範》。這意味著,其他AI公司和研究人員可以自由采用、修改或基於這些指導原則構建模型。

OpenAI表示,這一決定受到了業內其他公司參考其舊版模型規範的影響。

盡管本次更新不會立即改變ChatGPT或其他OpenAI產品的行為,但該公司表示,這代表了其模型在持續遵循這些原則方麵的進展。OpenAI還開源了用於測試模型是否符合這些指導原則的提示詞。