SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    阶跃星辰

    共 12 篇文章
    排序
    发布更新浏览点赞
    阶跃星辰开源Step-Audio-R1:首个支持测试时计算扩展的音频大语言模型,“越想越准”比肩Gemini 3

    阶跃星辰开源Step-Audio-R1:首个支持测试时计算扩展的音频大语言模型,“越想越准”比肩Gemini 3

    阶跃星辰开源的 Step-Audio-R1 打破了传统音频模型的性能瓶颈,成为首个支持“测试时计算扩展”的音频大语言模型。它通过创新的模态落地推理蒸馏技术,让模型直接基于声学特征进行链式思考,而非依赖...
    语音模型# Step-Audio-R1# 阶跃星辰
    4天前
    0110
    阶跃星辰开源 Step-Audio-EditX:首个基于 LLM 的迭代式音频编辑模型

    阶跃星辰开源 Step-Audio-EditX:首个基于 LLM 的迭代式音频编辑模型

    阶跃星辰(Step AI)正式发布 Step-Audio-EditX —— 一款革命性的基于大语言模型(LLM)的音频编辑系统,首次实现对语音情感、说话风格与副语言特征的高精度、迭代式、零样本控制,并...
    语音模型# Step-Audio-EditX# 阶跃星辰# 音频编辑模型
    4周前
    01070
    阶跃星辰发布开源语音大模型Step-Audio 2 mini:多任务性能登顶SOTA,攻克语音AI“智商情商”痛点

    阶跃星辰发布开源语音大模型Step-Audio 2 mini:多任务性能登顶SOTA,攻克语音AI“智商情商”痛点

    今日,阶跃星辰正式发布开源端到端语音大模型Step-Audio 2 mini,该模型在音频理解、语音识别、翻译及对话等多个国际基准测试集中均斩获SOTA(state-of-the-art,当前最优)成...
    语音模型# Step-Audio 2 mini# 阶跃星辰
    3个月前
    01720
    阶跃星辰发布 NextStep-1:140 亿参数自回归模型,用“连续令牌”重塑图像生成

    阶跃星辰发布 NextStep-1:140 亿参数自回归模型,用“连续令牌”重塑图像生成

    在图像生成领域,自回归模型长期被视作“文本专家,视觉弱项”——它们擅长逐词生成语言,却难以像扩散模型那样精细构建图像。而如今,阶跃星辰(StepFun)正试图打破这一边界。 GitHub:https...
    图像模型# NextStep-1# 图像生成# 图像编辑
    4个月前
    04830
    阶跃星辰发布 Step 3:开源最强多模态推理模型,推动“模芯”生态共建

    阶跃星辰发布 Step 3:开源最强多模态推理模型,推动“模芯”生态共建

    在2025世界人工智能大会(WAIC)开幕前夕,中国大模型企业阶跃星辰于今日在上海正式发布其新一代基础大模型——Step 3。该模型定位为“推理时代最适合应用的基座模型”,将于7月31日面向全球开源...
    大语言模型# Step 3# 多模态推理模型# 阶跃星辰
    4个月前
    01270
    阶跃星辰推出用于生成高保真度和可控制的纹理化3D资产的开放框架Step1X-3D

    阶跃星辰推出用于生成高保真度和可控制的纹理化3D资产的开放框架Step1X-3D

    阶跃星辰推出一个用于生成高保真度和可控制的纹理化3D资产的开放框架Step1X-3D,该框架旨在解决3D生成领域面临的挑战,包括数据稀缺性、算法限制和生态系统碎片化。Step1X-3D通过以下三个主要...
    3D模型# 3D资产# Step1X-3D# 阶跃星辰
    7个月前
    02030
    开源版Suno!ComfyUI已原生支持音乐生成模型ACE-Step

    开源版Suno!ComfyUI已原生支持音乐生成模型ACE-Step

    ACE-Step是由中国团队阶跃星辰(StepFun)与ACE Studio联合开发的​​开源音乐生成基础大模型​​,旨在为音乐创作者提供高效、灵活且高质量的音乐生成与编辑工具。该模型采用Apache...
    工作流# ACE Studio# ACE-Step# ComfyUI
    7个月前
    06010
    阶跃星辰推出新型通用图像编辑模型Step1X-Edit 

    阶跃星辰推出新型通用图像编辑模型Step1X-Edit 

    阶跃星辰推出新型通用图像编辑模型Step1X-Edit ,图像编辑与自然语言指令结合已成为视觉-语言研究中日益重要的任务。用户可以通过直观的自然语言指令来编辑图像,但这在技术上带来了独特的挑战,例如理...
    图像模型# Step1X-Edit# 图像编辑模型# 阶跃星辰
    7个月前
    03050
    阶跃星辰开源图生视频模型 Step-Video-TI2V:30B参数,运动幅度和镜头运动可控

    阶跃星辰开源图生视频模型 Step-Video-TI2V:30B参数,运动幅度和镜头运动可控

    在2025年2月,阶跃星辰开源了两款Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。现在,阶跃星辰进一步扩展其开源贡献,推出了基于30B参数Step...
    视频模型# Step-Video-TI2V# 图生视频模型# 阶跃星辰
    9个月前
    01990
    阶跃星辰开源面向智能语音交互的框架Step-Audio:1300 亿参数的统一语音-文本多模态模型,能够实现语音理解与生成的统一

    阶跃星辰开源面向智能语音交互的框架Step-Audio:1300 亿参数的统一语音-文本多模态模型,能够实现语音理解与生成的统一

    阶跃星辰团队开源了面向智能语音交互的框架 Step-Audio,旨在解决当前开源语音模型在数据收集成本高、动态控制能力弱和智能水平有限等问题。Step-Audio 提出了一个 1300 亿参数的统一语...
    语音模型# Step-Audio# 语音-文本多模态模型# 语音交互
    10个月前
    03340
    阶跃星辰开源300 亿参数文生视频模型Step-Video-T2V:能够生成长达 204 帧的高质量视频

    阶跃星辰开源300 亿参数文生视频模型Step-Video-T2V:能够生成长达 204 帧的高质量视频

    由前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕创办的AI公司阶跃星辰,开源了一款强大的文生视频模型——Step-Video-T2V。该模型拥有 300 亿参数,能够生成长达 204 帧的高质...
    视频模型# Step-Video-T2V# Step-Video-T2V-Turbo# 文生视频模型
    10个月前
    02940
    阶跃星辰发布Step-2系列语言模型新品:Step-2 mini与Step文学大师版

    阶跃星辰发布Step-2系列语言模型新品:Step-2 mini与Step文学大师版

    阶跃星辰于昨日正式推出了Step-2系列语言模型的两款新品——Step-2 mini和Step文学大师版,为用户提供了更多样化的选择。 地址:https://yuewen.cn/chats/new S...
    早报# 阶跃星辰
    10个月前
    01680
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    MuMuAINovel

    MuMuAINovel

    MuMuAINovel 是一款开源的 AI 小说创作辅助工具,专为写作者设计。它不替代你的创意,而是帮你把想法快速转化为结构完整、设定一致、可扩展的长篇故事。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    AI 智能盲人眼镜系统

    AI 智能盲人眼镜系统

    AI 智能盲人眼镜系统是一个面向视障用户的智能辅助工具原型,整合了盲道导航、过马路辅助、物品识别和语音交互等核心功能。通过视频、音频、IMU(惯性测量单元)等多模态输入,系统可提供实时语音引导与环境感知能力,帮助用户更安全地感知周围环境。
    查看完整榜单