阶跃星辰发布并开源全新 3D 大模型 Step1X-3D:参数总量达 4.8B,性能超越主流模型

2025 年 5 月 14 日,AI 技术公司 阶跃星辰(StepFun AI) 正式发布并全面开源其最新 3D 大模型 —— Step1X-3D,标志着国产大模型在三维内容生成领域迈出关键一步。

超大规模参数架构,支持高保真 3D 内容生成

据介绍,Step1X-3D 拥有总计 48 亿参数量,其中包含:

  • 1.3B 的几何(geometry)模块;
  • 3.5B 的纹理(texture)模块。

该模型基于原生 3D 架构设计,充分结合了几何建模与纹理生成的双重能力,支持高保真、结构可控的三维资产生成,面向游戏、影视、虚拟人、数字孪生等多种场景,具备极强的通用性与实用性。

性能评估全面领先,CLIP-Score 高于所有对比模型

为了全面验证模型能力,阶跃星辰构建了覆盖 110 个多样化任务的综合测试体系,并对比当前多款主流 3D 大模型。在自动化评估结果中,Step1X-3D 在多个关键维度取得领先表现

尤其是在评估文本描述与生成内容一致性的核心指标 —— CLIP-Score 上,Step1X-3D 拿下目前所有公开模型中的最高分,甚至超越了 Hunyuan3D 2.0 等成熟模型,显示出强大的语义理解与三维表达能力。

完整开源:训练代码 + 数据 + 模型全链路释放

为了推动 3D AI 社区的开放发展,阶跃星辰不仅开源了 Step1X-3D 模型,还全链路开源了训练框架与数据资产,其中包括:

  • 800K 高质量 3D 资产
  • 完整数据清洗与预处理策略
  • 3D VAE 编码器模块
  • 3D geometry diffusion 与 texture diffusion 训练代码

开发者与研究人员可通过以下平台访问和使用 Step1X-3D:

延伸阅读:多模态 AI 正在重塑内容创作方式

随着 GPT-4o、Gemini 等多模态模型将文字、图像、音频甚至视频逐步融合生成,3D 模型也正成为 AI 原生内容生态的重要一环。如果你希望用中文畅快体验全球顶级大模型,包括 GPT-4o、Claude、Gemini 等,欢迎访问 GPT 中文站,开启属于你的多模态 AI 创作之旅。