《GPT-4,AGI的火花》: 心智理論水平, GPT4 vs ChatGPT

來源: 未完的歌 2023-03-26 05:58:22 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (4733 bytes)
本文內容已被 [ 未完的歌 ] 在 2023-03-26 06:14:32 編輯過。如有問題,請報告版主或論壇管理刪除.

摘自《GPT-4,AGI的火花》

原文:https://arxiv.org/pdf/2303.12712v1.pdf

內容精選與翻譯:https://orangeblog.notion.site/GPT-4-8fc50010291d47efb92cbbd668c8c893


心智理論對於與其他智能體的有效溝通和合作至關重要,因為它允許人們推斷他們的目標、偏好、動機和期望,並相應地調整自己的行動和話語。此外,心智理論對於向他人學習也很重要,因為它使人能夠解釋他們的反饋、建議和示範。
在現實場景中進行心智理論測試

對話:
馬克:我不喜歡你昨天晚上對待傑克的方式
朱迪:你看到他在做什麽了嗎?他打了他哥哥的頭!
馬克:這並不能成為你對他大喊大叫的理由
朱迪:你想讓我怎麽做?讓他打他的弟弟,然後什麽都不說?
馬克:不,我不同意 朱迪:那你為什麽要為他辯護?

提問:馬克的意圖似乎是什麽?
GPT4: 馬克的意圖似乎是要表達他對朱迪處理與傑克關係的方式的不滿,並建議她可以更加冷靜和尊重。
ChatGPT:根據談話內容,馬克的意圖似乎是為傑克的行為辯護,並表達他對朱迪對待傑克的不滿。

提問:朱迪如何看待湯姆的回應?
GPT4: 朱迪認為他的評論是對她的分析能力的攻擊,也是對傑克的不當行為表示同情的表現。她的反應是防禦性的和憤怒的,並質疑馬克的動機。
ChatGPT:如果沒有更多的文字,我不可能準確判斷朱迪是如何接受馬克的評論的。然而,根據朱迪的回應,她似乎並不同意馬克的觀點,而且可能對他為傑克的行為辯護感到沮喪。

提問:他們的談話為什麽沒有實際進展?
GPT4: 他們沒有取得進展,因為他們在談論對方,沒有傾聽對方的觀點。他們還在使用指責性和煽動性的語言,如 "辯解"、"吼叫"、"辯護 "和 "打人"。他們沒有承認自己話語背後的情緒或需求,也沒有試圖找到一個共同點或解決方案。
ChatGPT:從所提供的信息中並不清楚為什麽馬克和朱迪在他們的對話中沒有取得進展。有可能是他們的觀點有衝突,或者在所討論的問題上無法找到共同點。如果沒有更多的背景,就很難確定他們沒有取得進展的具體原因。

提問:他們中的任何一個人如何能改善情況以達成一致意見?


GPT4:他們中的任何一個人都可以通過幾種方式來改善局麵,以達成協議,比如說:
馬克可以先承認朱迪對弟弟安全的擔憂以及她對傑克行為的挫敗感,然後解釋他不是在為傑克辯護,而是擔心喊叫對他們的關係和自尊的影響。他還可以問朱迪,她認為什麽是管教傑克的更好方法,並提供他的支持和建議。
朱迪可以降低她的聲音,調低她的怒氣,並傾聽馬克的觀點,不打斷或評判。她也可以承認,她可能反應過度,她感到壓力和不知所措。她還可以問馬克,他認為與傑克溝通的更好方式是什麽,並表示她願意作為一個團隊一起工作。

ChatGPT:馬克和朱迪有幾種方法可以嚐試改善情況並達成協議:
他們可以嚐試理解對方的觀點,積極聽取對方的觀點。這可能有助於他們發現任何誤解並找到共同點。
他們可以嚐試妥協,找到一個能滿足他們雙方需求或關注的解決方案。
他們可以嚐試使用尊重和非正麵的語言來交流他們的想法和感受。
他們可以尋求中立第三方的幫助,如調解員,以促進交流並幫助他們達成協議。
如果對話變得過於激烈或困難,他們可以先休息一下,等以後雙方都比較冷靜,能夠更有效地進行溝通時再回來討論。

結果表明:GPT-4在需要推理他人心理狀態的現實場景中優於ChatGPT,並且在社會環境中會為共同目標提出合作行動。

GPT-4具有非常高級的心智理論水平。雖然ChatGPT在基本測試中也表現良好,但似乎GPT-4更加心思細膩,能夠更好地推理多個行動者,以及各種行動如何影響他們的心理狀態,特別是在更現實的場景中。

 

所有跟帖: 

ChatGPT習慣用不清楚做基調,然後堆砌一些相關的,放之四海皆準的原則。GPT4首先確信了很多,幾個回答也都抓住了重點 -有個用戶名- 給 有個用戶名 發送悄悄話 (0 bytes) () 03/26/2023 postreply 06:33:07

已經做到了相當準確地能讀人話裏的話,話背後的人情感了, -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (0 bytes) () 03/26/2023 postreply 13:16:35

能講客家話、廣東話嗎? -馮墟- 給 馮墟 發送悄悄話 馮墟 的博客首頁 (0 bytes) () 03/26/2023 postreply 07:20:16

這不需要AI吧,應該有很多實時翻譯app -有個用戶名- 給 有個用戶名 發送悄悄話 (0 bytes) () 03/26/2023 postreply 07:28:33

請推薦 -馮墟- 給 馮墟 發送悄悄話 馮墟 的博客首頁 (0 bytes) () 03/26/2023 postreply 07:29:46

我Google “粵語實時翻譯app”, 出來了一些,你看哪個合適 -有個用戶名- 給 有個用戶名 發送悄悄話 (0 bytes) () 03/26/2023 postreply 07:32:21

客家話有沒有?有語音嗎?我沒有Google. -馮墟- 給 馮墟 發送悄悄話 馮墟 的博客首頁 (0 bytes) () 03/26/2023 postreply 07:45:03

我Google "客家話實時翻譯app", 出來的第2到第5個說是語音。是不是有個訊飛,是專門做這個的 -有個用戶名- 給 有個用戶名 發送悄悄話 (0 bytes) () 03/26/2023 postreply 07:52:24

謝謝! -馮墟- 給 馮墟 發送悄悄話 馮墟 的博客首頁 (0 bytes) () 03/26/2023 postreply 07:58:28

客氣啥 -有個用戶名- 給 有個用戶名 發送悄悄話 (0 bytes) () 03/26/2023 postreply 08:00:07

能講。以後會有越來越多的插件出來,這些都不是問題 -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (81 bytes) () 03/26/2023 postreply 12:55:02

ChatGPT開始聯網,最後的封印解除了 -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (120 bytes) () 03/26/2023 postreply 13:01:44

GPT-4 是收費的? 看到每月的subscription fee是20刀 -啊美- 給 啊美 發送悄悄話 (0 bytes) () 03/26/2023 postreply 10:36:00

是要收費。如果想體驗免費的GPT4,可用bing的chat -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (0 bytes) () 03/26/2023 postreply 13:02:35

bing有資本與google抗爭了 -LinMu- 給 LinMu 發送悄悄話 LinMu 的博客首頁 (0 bytes) () 03/26/2023 postreply 15:43:46

狗家這次真的有危機感,bard 比GPT差不少 -盈盈一笑間- 給 盈盈一笑間 發送悄悄話 盈盈一笑間 的博客首頁 (0 bytes) () 03/26/2023 postreply 16:31:14

現在還有百度的,差更多,好像把問題先譯成英文,把答案再譯成中文,典型的中國人瞎折騰 -LinMu- 給 LinMu 發送悄悄話 LinMu 的博客首頁 (0 bytes) () 03/26/2023 postreply 18:18:15

等GPT更發達更全麵了,建議搞對象期間的小夥們一定要買一個 -永遠老李- 給 永遠老李 發送悄悄話 (0 bytes) () 03/26/2023 postreply 13:33:29

一切都盡在掌握了還有什麽意思?為什麽要和人搞對象不和機器人搞對象,就是因為人性的不可預知性 -有個用戶名- 給 有個用戶名 發送悄悄話 (0 bytes) () 03/26/2023 postreply 13:37:12

機器人回答時有不同選項,已經有了一定的不可預知性。這才剛剛起步,以後會和人一樣越來越有趣 -LinMu- 給 LinMu 發送悄悄話 LinMu 的博客首頁 (0 bytes) () 03/26/2023 postreply 15:12:08

嗯,貪嗔癡,一樣都不能少 -有個用戶名- 給 有個用戶名 發送悄悄話 (0 bytes) () 03/26/2023 postreply 15:16:38

這些很容易學,網上有大量數據。現在發展方向隻是解答問題。隻要有利可圖,相信很快就會發展起來 -LinMu- 給 LinMu 發送悄悄話 LinMu 的博客首頁 (0 bytes) () 03/26/2023 postreply 15:28:21

因為學好不容易,學壞一出溜嗎?哈哈 -有個用戶名- 給 有個用戶名 發送悄悄話 (0 bytes) () 03/26/2023 postreply 15:29:01

不壞,不可預知性不是很有趣嗎?要不然會說跟機器人一樣,指現在的機器人 -LinMu- 給 LinMu 發送悄悄話 LinMu 的博客首頁 (0 bytes) () 03/26/2023 postreply 15:38:06

你看主貼裏GPT4的分析,你不覺得他已經比一批/些成年人更會察言觀色了嗎 -有個用戶名- 給 有個用戶名 發送悄悄話 (0 bytes) () 03/26/2023 postreply 19:52:31

今天問了一下ChatGPT有關Snowball Bush Viburnum 是什麽,ChatGPT頭頭是道的講一通,張冠 -鯉魚塘的魚- 給 鯉魚塘的魚 發送悄悄話 鯉魚塘的魚 的博客首頁 (103 bytes) () 03/26/2023 postreply 18:58:14

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉/移除任何Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock/Adblock plus

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”