混元正式发布并开源了业界首个3D世界生成模型——混元3D世界模型1.0(点击体验)。
融合了全景视觉生成与分层3D重建技术,同时支持文字和图片输入,过去需要专业建模团队数周才能搭建的3D虚拟世界,现在只需一句文字或一张图片,几分钟内即生成一个可沉浸式漫游、可交互、可仿真的虚拟世界。
持续创新、飞速迭代、拥抱开源腾讯混元技术团队热招中。
我们有着充沛的算力资源、丰富的训练
期待更多热爱AI大模型的优秀人才加入腾讯混元,共同探索智能上限,一起构建向善的AGI!
社招岗位
AIGC算法研究员(文生3D)深圳/上海/北京
AIGC算法研究员(文生图)深圳/上海/北京
AIGC算法研究员(多模态生成基模方向)深圳/上海/北京
大模型
算法工程师 (大模型推理能力)深圳/北京大语言模型精调
算法工程师 (代码方向)深圳/北京大模型强
化学 习研究员深圳/上海/北京AGI模型架构研究员深圳/上海/北京
精调
算法工程师 (问答&RAG方向)深圳/北京大模型应用
算法工程师 深圳/北京数据 算法工程师 深圳/北京大模型
数据 开发专家深圳/北京大模型推理加速工程师深圳/上海/北京/杭州
大模型推理优化研发工程师(算子优化/编译)深圳/上海/北京/杭州
异构Pytorch框架研发工程师/专家深圳/上海/北京/杭州
大模型训练框架研发工程师深圳/上海/北京/杭州
机器学习平台GPU调度研发工程师深圳/上海/北京
青云计划热招岗位
感兴趣的事业群和部门选择:
TEG-腾讯混元大语言模型部 /多模态模型部 / 机器学习平台部 /
技术研究-机器学习方向/
自然语言处理 方向/多模态方向/多媒体处理方向/高性能计算方向/数据 工程方向 深圳/北京/上海
在2025世界
这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为
除3D世界模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、
作为此次发布的亮点之一,腾讯混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,同时支持文字和图片输入,实现了高质量、风格多样的可漫游3D场景生成。
过去需要专业建模团队数周才能搭建的3D虚拟世界,现在只需一句文字或一张图片,几分钟内即可生成。
对
无建模经验的普通用户,通过混元 3D 创作引擎,仅需一句话或者一张图即可快速生成360°沉浸式视觉空间,生成的场景可无缝导入Vision Pro等虚拟头显,带来沉浸式体验。
混元3D世界模型1.0的核心还在于其创新的「语意层次化3D场景表征及生成算法」。
该算法将复杂3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具。用户可对场景内元素进行独立
与全球领先的开源模型相比,混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键维度均全面超越当前SOTA的开源模型。
文生360°全景指标
图生360°全景指标
文生3D场景指标
图生3D场景指标
目前,混元3D世界模型1.0已全面开源。从秒级生成单个3D资产,到一键打造可漫游的3D世界,腾讯混元正逐步构建完善的3D内容生成生态。
混元旗舰模型TurboS自年初发布后,保持着每月一个版本的快速迭代,在代码、理科能力和复杂指令遵循方面都有明显提升,在全球大模型权威排行榜上稳居前列。
混元TurboS创新采用了前沿的混合线性注意力机制与MoE模型架构,是大模型研发前沿分支的重要代表,这也是业界首个基于混合线性注意力机制落地的超大规模MoE模型。
基于TurboS基座,混元T1进一步提升了推理能力,混元T1综合能力国内领先,在项目级代码生成、高难度数学推理、文本写作等方面都展现出不错的效果。
端到端语音模型混元Voice、多模态理解模型混元Vision基于混元大语言模型基座打造,继承了出色的理解、认知和推理能力。在多模态理解上,今年连续发布多款模型,在LMArena Vision全球大模型权威榜单中获得国内榜首。
混元在多模态生成方面布局全面,3D生成能力全球领先,最新混元3D2.5模型质感大幅提升,在上海
除本次发布即开源的混元3D世界模型1.0,混元还将在月底开源一系列小尺寸模型,包含0.5B、1.8B、4B、7B混合推理模型,更轻量、好部署。
在LMArena Vision榜单拿下国内第一的多模态理解模型混元-large-vision,以及专为
前不久腾讯开源的企业级混合推理大语言模型混元-A13B,在总参数80B、激活参数仅13B的情况下,效果比肩同等架构的领先开源模型,同时推理速度更快,性价比更高。
混元还开放了完整多模态生成能力及工具集插件,陆续开源了业界领先的文生图、视频生成和 3D 生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量分别达到1400和1600个,混元3D系列模型社区下载量超过230 万,已成为全球最受欢迎的3D开源模型。
高招云直播