九九热在线免费观看视频,日韩中文字幕亚洲精品,另类专区一区二区三区

當(dāng)?shù)貢r(shí)間4月8日，Meta Platforms（納斯達(dá)克：META）旗下超級(jí)智能實(shí)驗(yàn)室（Meta Superintelligence Labs，下稱MSL）發(fā)布多模態(tài)推理模型Muse Spark系列，并同步上線該系列第一款模型。

Meta將Muse Spark稱為公司“有史以來最強(qiáng)大的模型”。該模型支持工具使用、視覺思維鏈以及多智能體編排，主打多模態(tài)感知與推理能力。Meta首席人工智能官、MSL負(fù)責(zé)人汪滔（Alexandr Wang）介紹，過去九個(gè)月，MSL團(tuán)隊(duì)“從一片空地”上重建了整條AI系統(tǒng)框架和算力基礎(chǔ)設(shè)施，推翻了過往的諸多做法。

這是MSL自2025年6月成立以來發(fā)布的首個(gè)正式產(chǎn)品，也是Meta在人工智能戰(zhàn)略大幅調(diào)整后向外界交出的第一份答卷。消息公布當(dāng)日，Meta股價(jià)收漲6.50%，報(bào)612.42美元/股。

從開源轉(zhuǎn)向“閉源”，模型能力尚未全面領(lǐng)先

與Meta此前發(fā)布的Llama系列模型不同，Muse Spark為閉源模型。目前用戶可通過網(wǎng)站及Meta AI應(yīng)用程序使用該模型，但API（應(yīng)用程序接口）尚未全面開放，僅向少數(shù)客戶提供預(yù)覽版。至于Muse Spark未來是否開源，汪滔僅表示其后續(xù)版本“計(jì)劃開源”，但并未給出時(shí)間表。

在效率方面，Meta表示，通過改進(jìn)模型架構(gòu)、優(yōu)化算法及數(shù)據(jù)清洗，Muse Spark的算力效率大幅提升——與上一代旗艦?zāi)Ｐ蚅lama 4 Maverick相比，Muse Spark達(dá)到相同能力所需算力不足后者十分之一。

從Meta公布的內(nèi)部基準(zhǔn)測(cè)試結(jié)果來看，Muse Spark在多模態(tài)理解、健康問答和智能體任務(wù)方面的表現(xiàn)具有競(jìng)爭(zhēng)力，但尚未實(shí)現(xiàn)全面超越競(jìng)爭(zhēng)對(duì)手的頭部模型。例如，在多模態(tài)基準(zhǔn)測(cè)試CharXiv Reasoning中，Muse Spark思考模式得分為86.4，超過GPT-5.4的82.8和Gemini 3.1 Pro High的80.2，但在其他多個(gè)多模態(tài)基準(zhǔn)測(cè)試中，其得分低于Gemini 3.1 Pro High。

在智能體能力方面，Muse Spark思考模式在DeepSearchQA測(cè)試中得分74.8，超過Gemini 3.1的69.7和GPT-5.4的73.6，GDPval-AA Elo測(cè)試得分亦高于Gemini 3.1和Grok 4.2。在編程能力關(guān)鍵指標(biāo)SWE-Bench Verified等多項(xiàng)基準(zhǔn)測(cè)試中，Muse Spark的得分接近或低于Claude Opus 4.6、Gemini 3.1和GPT-5.4。

Muse Spark還提供“沉思模式（Contemplating mode）”，該模式通過編排多個(gè)智能體進(jìn)行并行推理。沉思模式的Muse Spark在“人類終極考試（Humanity’s Last Exam）”中取得了58.4%的成績(jī)，略遜于GPT 5.4 Pro的58.7%，在“前沿科學(xué)研究（Frontier Science Research）”中取得了38.3%的成績(jī)，高于GPT 5.4 Pro的36.7%。

在第三方平臺(tái)Artificial Analysis的綜合智能能力排名上，Muse Spark目前列第四，前三名依次為谷歌Gemini 3.1 Pro、OpenAI GPT-5.4和Claude Opus 4.6。

獨(dú)立評(píng)測(cè)機(jī)構(gòu)Vals AI在Muse Spark公開發(fā)布前對(duì)其進(jìn)行了測(cè)試。該機(jī)構(gòu)首席執(zhí)行官雷恩·克里希南（Rayan Krishnan）認(rèn)為，Meta從Llama 4到Muse Spark實(shí)現(xiàn)了模型能力的顯著提升，Meta已成為一家具備競(jìng)爭(zhēng)力的AI實(shí)驗(yàn)室，若能維持當(dāng)前進(jìn)步速度，有望在較短時(shí)間內(nèi)推出業(yè)內(nèi)領(lǐng)先的模型。但他同時(shí)指出，編程能力仍是Muse Spark的明顯短板，預(yù)計(jì)這將是Meta后續(xù)重點(diǎn)攻關(guān)的方向。

驗(yàn)證Meta AI戰(zhàn)略轉(zhuǎn)型成果

Muse Spark也是Meta過去一年AI戰(zhàn)略劇烈轉(zhuǎn)型的成果。

2023年至2024年間，Meta憑借Llama 1、2、3系列開源模型在AI社區(qū)贏得廣泛認(rèn)可。這些模型性能接近OpenAI同期的旗艦?zāi)Ｐ停欢瘸蔀閷W(xué)術(shù)領(lǐng)域和開發(fā)者社區(qū)的重要基礎(chǔ)設(shè)施。

但轉(zhuǎn)折發(fā)生于2025年4月，Meta發(fā)布開源多模態(tài)模型Llama 4后遭到外界質(zhì)疑，多名測(cè)試者指出模型針對(duì)特定排行榜進(jìn)行優(yōu)化“刷榜”，實(shí)際性能甚至不及馬斯克旗下xAI發(fā)布的上一代模型。Meta后來承認(rèn)了針對(duì)基準(zhǔn)測(cè)試的特定優(yōu)化行為。

與此同時(shí)，Meta首席AI科學(xué)家楊立昆（Yann LeCun）長(zhǎng)期質(zhì)疑主流大語言模型（LLM）路線，認(rèn)為其無法通向通用人工智能，楊立昆主張基于視頻訓(xùn)練的世界模型（World Model），要讓模型與人類一樣，通過物理直覺的方式來理解世界，這一立場(chǎng)被部分人士認(rèn)為其令Meta在大模型競(jìng)爭(zhēng)中貽誤時(shí)機(jī)。

多重壓力之下，Meta啟動(dòng)了大規(guī)模AI團(tuán)隊(duì)重組。2025年6月，Meta宣布以約143億美元獲得數(shù)據(jù)標(biāo)注初創(chuàng)公司Scale AI 49%股份，并將時(shí)任Scale AI創(chuàng)始人兼首席執(zhí)行官汪滔招入麾下。隨后，扎克伯格發(fā)布內(nèi)部信，將基礎(chǔ)研究、產(chǎn)品團(tuán)隊(duì)及FAIR整合成為新的MSL。扎克伯格給新實(shí)驗(yàn)室定下的目標(biāo)是：下一代AI大模型在2026年前后達(dá)到行業(yè)先進(jìn)水平，未來要做服務(wù)個(gè)人的超級(jí)智能體（Agent），由汪滔與GitHub前CEO Nat Friedman領(lǐng)導(dǎo)。

Meta首席執(zhí)行官扎克伯格還親自出馬招攬AI人才，據(jù)報(bào)道曾在其位于加州帕洛阿爾托和太浩湖的私宅中接待研究人員，并開出高達(dá)1億美元的薪資待遇。最終，MSL組建了一支由50余名研究人員、工程師及其他AI從業(yè)者構(gòu)成的核心團(tuán)隊(duì)。

然而，人員大規(guī)模涌入也帶來了摩擦。2025年10月，Meta被曝計(jì)劃裁減其人工智能團(tuán)隊(duì)約600個(gè)職位，多名Meta早期AI員工在此期間離職，部分系主動(dòng)跳槽，另有部分人員在2025年10月公司重組中遭裁員。去年底，楊立昆宣布離職，這一人事變動(dòng)被外界普遍視為Meta徹底擁抱主流LLM路線的標(biāo)志性信號(hào)。

對(duì)于新模型，扎克伯格曾在1月份的財(cái)報(bào)電話會(huì)議上表示，預(yù)計(jì)首批模型會(huì)表現(xiàn)不錯(cuò)，但更重要的是，新模型將展示Meta所處的快速發(fā)展軌道，隨著新模型的不斷發(fā)布，預(yù)計(jì)Meta將在年內(nèi)穩(wěn)步推進(jìn)技術(shù)前沿。

仍面臨巨大競(jìng)爭(zhēng)壓力

Meta長(zhǎng)遠(yuǎn)目標(biāo)是構(gòu)建其所謂的“超級(jí)智能”（superintelligence），這是一種超越人類的智能技術(shù)，能為Meta超10億用戶提供處理各類任務(wù)的個(gè)人智能體。

而在資本市場(chǎng)方面，Meta在AI基礎(chǔ)設(shè)施領(lǐng)域的投入規(guī)模在美國(guó)科技公司中屬于最為激進(jìn)之列。該公司此前預(yù)告，2026年資本開支可能相比上年翻一倍，預(yù)計(jì)在1150億美元至1350億美元之間。

目前來看，Meta雖已憑借Muse Spark重新進(jìn)入第一梯隊(duì)的競(jìng)爭(zhēng)視野，但距離全面領(lǐng)先仍有明顯差距，大模型賽道的競(jìng)爭(zhēng)在2026年正愈發(fā)激烈。

4月7日，Anthropic披露最新大模型Claude Mythos Preview，號(hào)稱能在沒有任何人類干預(yù)的情況下，自主發(fā)現(xiàn)并利用各大主流操作系統(tǒng)和Web瀏覽器中的復(fù)雜漏洞。據(jù)Anthropic發(fā)布的技術(shù)博客，在體現(xiàn)真實(shí)漏洞利用能力的測(cè)試中，Claude Mythos Preview準(zhǔn)確率大幅提升。Anthropic還表示，新模型有望重塑網(wǎng)絡(luò)安全領(lǐng)域。

此外，市場(chǎng)傳言顯示，OpenAI的GPT-6可能在4月推出。與此同時(shí)，DeepSeek于4月8日低調(diào)更新了對(duì)話界面，新增“快速模式”與“專家模式”選項(xiàng)，被部分觀察人士解讀為DeepSeekV4版本上線的前奏。