SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2227 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    视频生成通用世界模型WorldDreamer:可以完成自然场景和自动驾驶场景多种视频生成任务

    视频生成通用世界模型WorldDreamer:可以完成自然场景和自动驾驶场景多种视频生成任务

    来自清华和极佳科技的研究人员联手推出了全新的视频生成通用世界模型WorldDreamer。它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序列生视频等。 项目主...
    新技术# WorldDreamer# 视频生成
    2年前
    04950
    豆包“AI编程”功能重大升级:HTML预览、Python运行以及生成完整项目的能力,进一步提升了用户的开发体验

    豆包“AI编程”功能重大升级:HTML预览、Python运行以及生成完整项目的能力,进一步提升了用户的开发体验

    今年初,豆包网页版和电脑版推出了备受欢迎的“AI编程”功能,为用户解决代码难题提供了极大的便利。现在,这一功能迎来了三项重要升级:HTML预览、Python运行以及生成完整项目的能力,进一步提升了用户...
    早报# 豆包
    9个月前
    04930
    DeepSeek R1 模型完成小版本升级!官方依旧选择开源,DeepSeek-R1-0528已上线Hugging Face

    DeepSeek R1 模型完成小版本升级!官方依旧选择开源,DeepSeek-R1-0528已上线Hugging Face

    昨晚,DeepSeek 官方在交流群中宣布:DeepSeek R1 已完成小版本升级(代号:R1-0528),用户现已可通过官方网页、App 和小程序体验(记得开启“深度思考”模式),API 接口与使...
    早报# DeepSeek-R1# DeepSeek-R1-0528
    7个月前
    04910
    Figure重磅发布Figure 03电池,人形机器人能源系统的重大突破

    Figure重磅发布Figure 03电池,人形机器人能源系统的重大突破

    人形机器人初创公司 Figure 在今天正式发布其第三代电池系统——Figure 03(F.03)电池,标志着其人形机器人平台在能源系统设计上的重大突破。 这款电池不仅是 Figure 人形机器人技术...
    早报# Figure# 机器人
    5个月前
    04900
    多模态统一模型UniMuMo:能够处理文本、音乐和动作(运动)数据,并在这三种模式之间生成内容

    多模态统一模型UniMuMo:能够处理文本、音乐和动作(运动)数据,并在这三种模式之间生成内容

    香港中文大学、华盛顿大学、不列颠哥伦比亚大学、麻省大学阿默斯特分校、 MIT-IBM Watson AI 实验室和思科研究院的研究人员推出多模态统一模型UniMuMo,它能够处理文本、音乐和动作(运动...
    新技术# UniMuMo# 多模态统一模型
    1年前
    04890
    StyleCineGAN:从单张风景静图生成循环播放的动态图像

    StyleCineGAN:从单张风景静图生成循环播放的动态图像

    韩国科学技术院推出StyleCineGAN,它能够自动从单张风景静图生成循环播放的动态图像,也就是所谓的“cinemagraph”,让普通用户和专业人士都能够轻松创建高质量的cinemagraph,无...
    新技术# StyleCineGAN# 动态图像
    2年前
    04890
    Meta 推出免费视频剪辑软件Edits,挑战字节跳动旗下CapCut(剪映)

    Meta 推出免费视频剪辑软件Edits,挑战字节跳动旗下CapCut(剪映)

    Meta 于本周二正式全球发布了其视频创作应用 Edits,这款应用旨在为创作者提供一个强大的工具,用于跟踪视频创意、获取灵感,并使用特效和 AI 工具创建高质量视频。Edits 支持 iOS 和 A...
    早报# CapCut# Edits# Meta
    8个月前
    04870
    全新LoRA训练方法ADDifT(交替直接差分训练)

    全新LoRA训练方法ADDifT(交替直接差分训练)

    背景与动机 LoRA(低秩适应)是一种参数高效的微调技术,广泛用于大语言模型和扩散模型(如Stable Diffusion)的定制化训练。然而,传统LoRA训练方法存在效率低和易学到无关特征(如背景或...
    新技术# ADDifT# Lora# LoRA模型
    9个月前
    04860
    帧感知视频扩散模型FVDM:时间步向量化方法,提高了视频生成任务的质量和灵活性

    帧感知视频扩散模型FVDM:时间步向量化方法,提高了视频生成任务的质量和灵活性

    香港城市大学、大湾区大学、国防科技大学、香港中文大学和岭南大学的研究人员推出了一种新的视频扩散模型,称为帧感知视频扩散模型(Frame-Aware Video Diffusion Model,简称FV...
    新技术# FVDM# 帧感知视频扩散模型
    1年前
    04860
    3D网格模型生成框架AToM

    3D网格模型生成框架AToM

    来自Snap、沙特阿卜杜拉国王科技大学、多伦多大学的研究人员推出一款3D模型生成框架AToM(Amortized Text-to-Mesh),AToM的核心特点是能够同时优化多个文本提示(prompt...
    新技术# 3D网格模型# AToM
    2年前
    04860
    GenXD:能够从任意数量的条件图像生成高质量的3D和4D场景

    GenXD:能够从任意数量的条件图像生成高质量的3D和4D场景

    近年来,2D视觉生成取得了显著成功,但在3D和4D生成方面,由于缺乏大规模数据和有效的模型设计,实际应用仍然具有挑战性。新加坡国立大学和微软的研究人员推出了一个名为GenXD的模型,它能够从任意数量的...
    新技术# 3D# GenXD
    1年前
    04840
    用于视觉配音的先进框架PersonaTalk:实现高保真和个性化的视觉配音

    用于视觉配音的先进框架PersonaTalk:实现高保真和个性化的视觉配音

    在音频驱动的视觉配音中,合成准确的口型同步同时保持和突出说话者的“个性”是一个巨大的挑战。现有方法往往未能捕捉到说话者的独特说话风格或保留面部细节。为了解决这一问题,字节跳动提出了 PersonaTa...
    新技术# PersonaTalk# 视觉配音
    1年前
    04830
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    微舆(BettaFish)

    新微舆(BettaFish)

    “微舆” 是一个从0实现的创新型 多智能体 舆情分析系统,帮助大家破除信息茧房,还原舆情原貌,预测未来走向,辅助决策。用户只需像聊天一样提出分析需求,智能体开始全自动分析 国内外30+主流社媒 与 数百万条大众评论。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    查看完整榜单