騰訊混元圖像 3.0 發(fā)布僅僅一周,就開(kāi)啟了全球“霸榜“模式。
10月5日,國(guó)際大模型競(jìng)技場(chǎng)LMArena最新文生圖榜單顯示,混元圖像 3.0在全球26個(gè)大模型中,高居第一位。這一結(jié)果來(lái)自全球所有用戶的“盲測(cè)”,這也標(biāo)志著混元在多模態(tài)生成方面達(dá)到全球領(lǐng)先水平。
![]()
LMArena官方社交平臺(tái)也第一時(shí)間發(fā)文祝賀:“文生圖排行榜大洗牌!騰訊混元圖像3.0登頂競(jìng)技場(chǎng)——同時(shí)被評(píng)為最佳綜合文生圖模型與最佳開(kāi)源文生圖模型。這款圖像生成模型已超越Seedream 4,以及代號(hào)“nano-banana”的Gemini 2.5 Flash Image Preview。重大突破,恭喜騰訊混元?!?nbsp;
![]()
![]()
LMArena是美國(guó)加州大學(xué)伯克利分校推出的創(chuàng)新AI模型評(píng)估平臺(tái),評(píng)測(cè)核心方法是基于人類真實(shí)偏好的“盲測(cè)”機(jī)制,讓用戶對(duì)不同AI模型的回答進(jìn)行匿名投票,衡量模型的表現(xiàn)。用戶輸入問(wèn)題后,平臺(tái)提供兩個(gè)模型的回答,用戶根據(jù)偏好選擇更優(yōu)答案,投票結(jié)果直接塑造公共排行榜。 由于該平臺(tái)訪問(wèn)量巨大,并且評(píng)測(cè)機(jī)制貼近實(shí)際體驗(yàn),被稱為是目前國(guó)際上最權(quán)威的競(jìng)技場(chǎng)榜單。
混元圖像3.0是騰訊9月28日發(fā)布并開(kāi)源的原生多模態(tài)生圖模型。這是首個(gè)開(kāi)源工業(yè)級(jí)原生多模態(tài)生圖模型,也是目前效果最好的開(kāi)源生圖模型?;煸獔D像3.0具備常識(shí)并能夠利用知識(shí)進(jìn)行推理;同時(shí)語(yǔ)義理解準(zhǔn)確度高,并具備極致美學(xué)質(zhì)感,能生成真實(shí)的高質(zhì)感圖片;支持中英文文字生成,長(zhǎng)文本文字渲染。
混元圖像3.0模型也同樣受到開(kāi)發(fā)者的歡迎,發(fā)布后不久即登上了Hugging Face開(kāi)源社區(qū)模型熱榜的第一名,持續(xù)一周穩(wěn)居第一;如今又登上了LMarena榜單的榜首,反映了用戶與社區(qū)對(duì)模型的關(guān)注與認(rèn)可。
騰訊混元團(tuán)隊(duì)透露,混元圖像3.0目前的版本已開(kāi)放了文生圖能力,圖生圖、圖像編輯、多輪交互等版本將于后續(xù)發(fā)布。
![]()
理解世界知識(shí),可基于簡(jiǎn)單提示詞自主推理生成
![]()
精確生成文字,支持長(zhǎng)文本渲染
![]()
準(zhǔn)確理解復(fù)雜語(yǔ)義
![]()
多格表情包生成
![]()
寫(xiě)實(shí)感與美學(xué)提升
多模態(tài)正在成為混元大模型的核心競(jìng)爭(zhēng)力之一,混元3D與圖像生成模型均處于行業(yè)頂尖水平。在3D生成領(lǐng)域,8月上海人工智能實(shí)驗(yàn)室的全球3D生成模型評(píng)測(cè)榜單顯示,混元3D模型在圖生3D和文生3D任務(wù)中均位列第一;混元世界模型Voyager在斯坦福大學(xué)WorldScore基準(zhǔn)測(cè)試中綜合能力排名首位。
混元目前已形成語(yǔ)言、圖像、視頻、3D模型的多尺寸、多模態(tài)開(kāi)源矩陣,提供接近商業(yè)模型性能的開(kāi)源基座。圖像、視頻衍生模型數(shù)量總數(shù)達(dá)到3000個(gè),混元3D系列模型社區(qū)下載量超過(guò)260萬(wàn)。
雅菲 曉風(fēng)