一句線WAIC

  7月27日,2025世界人工智能大會騰訊論壇上,騰訊正式發(fā)布混元3D世界模型1.0,并宣布全面開源。這是業(yè)界首個開源可沉浸漫游、可交互、可仿真的世界生成模型,為游戲開發(fā)、VR、數(shù)字內(nèi)容創(chuàng)作等領(lǐng)域帶來了全新的可能性。

  除3D模型外,騰訊混元還披露了包括端側(cè)混合推理語言模型、多模態(tài)理解模型、ag九游會官方 九游AG游戲視覺模型等在內(nèi)的一系列開源計劃。

  據(jù)介紹,騰訊混元3D世界模型1.0融合了全景視覺生成與分層3D重建技術(shù),同時支持文字和圖片輸入,實(shí)現(xiàn)了高質(zhì)量、風(fēng)格多樣的可漫游3D場景生成。過去需要專業(yè)建模團(tuán)隊數(shù)周才能搭建的3D虛擬世界,現(xiàn)在只需一句文字或一張圖片,幾分鐘內(nèi)即可生成。

  對游戲開發(fā)者而言,混元3D世界模型極大簡化了3D場景構(gòu)建流程,只需輸入“一座中世紀(jì)城堡,城堡塔樓宏偉壯闊,城堡周圍是一座石頭雕像,石頭鋪成的路以及美麗的花朵,卡通風(fēng)格”等簡單指令,模型即可快速生成包含建筑、地形、植被的完整3D場景。輸出的Mesh文件可用于游戲原型搭建或關(guān)卡設(shè)計,還能靈活調(diào)整前景物體、更換天空背景,滿足個性化創(chuàng)作需求。

一句線WAIC(圖1)

一句線WAIC(圖2)

  對于無建模經(jīng)驗的普通用戶,混元3D世界模型同樣友好易用,通過混元3D創(chuàng)作引擎,僅需一句話或者一張圖即可快速生成360°沉浸式視覺空間,生成的場景可無縫導(dǎo)入Vision Pro等虛擬頭顯,帶來沉浸式體驗。

  混元3D世界模型1.0的核心還在于其創(chuàng)新的“語意層次化3D場景表征及生成算法”。該算法將復(fù)雜3D世界解構(gòu)為不同語意層級,實(shí)現(xiàn)前景與背景、地面與天空的智能分離,不僅生成視覺效果逼真的整體場景,還能輸出標(biāo)準(zhǔn)化的3D Mesh資產(chǎn),兼容Unity、Unreal Engine、Blender等主流工具。用戶可對場景內(nèi)元素進(jìn)行獨(dú)立編輯或物理仿真,無縫銜接AIGC技術(shù)與傳統(tǒng)CG工作流。

一句線WAIC(圖3)

  與全球領(lǐng)先的開源模型相比,混元3D世界模型1.0在文生世界、圖生世界的美學(xué)質(zhì)量和指令遵循能力等關(guān)鍵維度均全面超越當(dāng)前SOTA的開源模型。

  目前,混元3D世界模型1.0已全面開源。從秒級生成單個3D資產(chǎn),到一鍵打造可漫游的3D世界,騰訊混元正在逐步構(gòu)建完善的3D內(nèi)容生成生態(tài)。