Meta開源大模型Llama 3：性能直逼GPT-4

騰訊科技訊4月19日消息，據國外媒體報道，美國科技巨頭Meta推出了其最強大的開源人工智能(AI)模型Llama 3，以追趕行業領導者OpenAI。Meta首席執行官紮克伯格表示，Llama 3有8B和70B兩個版本，大版本的Llama 3將有超過4000億參數。由於預訓練和指令微調，Llama 3相比Llama 2有了極大的改進。

此外，Meta還同時發布了AI助手的更新版本。該助手將在Meta的Facebook、Instagram、WhatsApp和Messenger應用以及一個新設立的獨立網站Meta.ai中獲得更突出的地位，讓Llama3能夠更直接地與微軟支持的OpenAI的熱門產品ChatGPT競爭。

Meta在去年7月份發布了Llama2。此後，包括穀歌、馬斯克旗下的xAI與Mistral等在內的數家公司發布了開源的大語言模型，競爭十分激烈。

Llama3直接對標OpenAI的GPT-4，後者已經成為一個強大的多模態模型，不僅能夠處理更長的文本，還支持圖像輸入。Meta此前已推出三個版本的Llama2，其中最大的一個擁有700億個參數，另外兩個版本分別擁有130億和70億個參數。

在宣布這一消息之際，Meta一直在努力向其數十億用戶推廣生成式人工智能產品，包括對計算基礎設施進行全麵改造，以及整合此前截然不同的研究和產品團隊，從而挑戰OpenAI在該技術上的領先地位。

開源的Llama是Meta人工智能戰略的重要組成部分。這家社交媒體巨頭希望利用人工智能來提高其廣告工具的效率，並增強其社交媒體應用的吸引力。Meta首席執行官馬克·紮克伯格（MarkZuckerberg）在本月初向投資人表示，今年的主要關注領域包括推出Llama3和“擴大MetaAI助手的實用性”。

追趕GPT-4

Meta希望Llama3能趕上OpenAI的GPT-4。不過知情人士透露，因為研究人員尚未開始對Llama3進行微調，所以尚未決定Llama3是否將是多模態模型。微調是開發人員為現有模型提供額外數據的過程，以便它可以學習新信息或任務。較大的模型通常會提供更高質量的答複，而較小的模型往往會更快的提供答複。有消息稱，正式版的Llama3將會在今年7月正式推出。

Meta首席產品官克裏斯·考克斯（ChrisCox）在接受采訪時表示，該公司為Llama3植入了全新的計算機編碼功能，如今它不僅可以輸出文本，還可以輸出圖像。他補充說，更高級的推理，如製定更長的多步計劃的能力，將在後續版本中推出。Meta在官方博客中表示，計劃在未來幾個月發布的正式版也將具有“多模態”能力，這意味著它可以生成文本和圖像。

考克斯說：“最終的目標是幫助用戶擺脫煩心事。無論是與企業互動，無論是寫東西，還是計劃旅行，讓他們的生活更輕鬆。”他還表示，將圖像納入Llama3的訓練將增強今年推出的新一代雷朋Meta智能眼鏡的功能，讓MetaAI能夠識別使用者看到的物體並回答有關它們的問題。

Meta還宣布與Alphabet的穀歌建立新的合作夥伴關係，在助手的答複中包括實時搜索結果，作為與微軟必應現有合作的補充。隨著此次更新，MetaAI助手正在擴展到美國以外的十多個市場，包括澳大利亞、加拿大、新加坡、尼日利亞和巴基斯坦。考克斯說，Meta“仍在努力以正確的方式在歐洲做到這一點”。歐洲的隱私規定更加嚴格，即將出台的人工智能法案也準備提出披露模型訓練數據等要求。

生成式人工智能模型對數據的巨大需求已開始限製該技術的發展。作為追趕努力的一部分，Meta一直在發布像Llama3這樣的模型供開發人員免費商業使用，因為強大的免費模型的成功可能會阻礙競爭對手從其專有技術中賺取收入的計劃。

紮克伯格周四在發布會上稱MetaAI是“你可以自由使用的最智能的人工智能助手”。他表示，最大版本的Llama3目前正在用4000億個參數進行訓練，在MMLU(大規模多任務語言理解)測試中得分為85分。他表示，推出的兩個較小版本現在分別有80億個參數和700億個參數，後者MMLU的得分為82分。（編譯/無忌）