SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2628 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Google I/O 2025 发布 Native Speech Generation:AI 语音迈入拟真新纪元,免费支持多角色播客制作!

    Google I/O 2025 发布 Native Speech Generation:AI 语音迈入拟真新纪元,免费支持多角色播客制作!

    在2025年的Google I/O开发者大会上,Google AI Studio推出了一项名为“Native Speech Generation(原生语音生成)”的创新功能,将AI语音生成技术推向了一...
    早报# Native Speech Generation# 原生语音生成# 谷歌
    11个月前
    04890
    新型框架Cavia:生成具有相机控制功能的多视角视频

    新型框架Cavia:生成具有相机控制功能的多视角视频

    德克萨斯大学奥斯汀分校、苹果和谷歌的研究人员推出新型框架Cavia,它能够生成具有相机控制功能的多视角视频。简单来说,Cavia可以根据一张图片和一些相机运动的指令,生成一系列从不同角度和时间点观察的...
    新技术# Cavia
    1年前
    04880
    韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack

    韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack

    韩国科学技术研究院和DeepAuto.ai的研究人员推出一种新型数据投毒攻击方法Silent Branding Attack ,专门针对文生图模型。该方法能够在文生图模型中隐秘地嵌入特定品牌标志或符号...
    新技术# Silent Branding Attack# 文生图模型# 韩国科学技术研究院
    1年前
    04870
    新型端到端模型DnD-Transformer:提高了图像生成任务的质量和效率,为图像生成领域带来了新的可能

    新型端到端模型DnD-Transformer:提高了图像生成任务的质量和效率,为图像生成领域带来了新的可能

    北京大学、阿里巴巴集团、威斯康星大学麦迪逊分校和北京理工大学的研究人员推出新型端到端模型DnD-Transformer,这是一种用于高效细粒度图像生成的二维自回归Transformer。简单来说,这个...
    新技术# DnD-Transformer# 图像生成
    2年前
    04870
    基于物理的交互式3D对象动态生成方法PhysDreamer:利用视频生成技术实现与3D物体进行物理交互

    基于物理的交互式3D对象动态生成方法PhysDreamer:利用视频生成技术实现与3D物体进行物理交互

    来自麻省理工学院、斯坦福大学、 哥伦比亚大学和康奈尔大学的研究人员推出PhysDreamer系统,这是一个基于物理的交互式3D对象动态生成方法。PhysDreamer能够使静态的3D对象通过视频生成模...
    新技术# 3D对象# PhysDreamer
    2年前
    04870
    新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动

    新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动

    北京航空航天大学和爱诗科技的研究人员推出新型视频生成方法TrackGo,它能够根据用户的输入精确控制视频中对象的运动。这项技术允许用户通过自由形式的遮罩(masks)和箭头来指定目标对象或部分,以及它...
    新技术# TrackGo# 视频生成
    2年前
    04860
    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学的研究人员推出RIFLEx,解决视频扩散模型在生成更长视频时的时空连贯性问题。该方法通过调整位置编码中的内在频率,有效抑制重复内容的生成,同时保持运动一致性,无需额外训练或修改模型。 项目主页...
    新技术# RIFLEx# 清华大学# 视频扩散模型
    1年前
    04850
    Visual SKETCHPAD 框架:为多模态语言模型提供一个可视化的“草图板”,使其能够在解决问题时生成中间草图并进行推理

    Visual SKETCHPAD 框架:为多模态语言模型提供一个可视化的“草图板”,使其能够在解决问题时生成中间草图并进行推理

    华盛顿大学、艾伦人工智能研究所和宾夕法尼亚大学的研究人员推出Visual SKETCHPAD 框架,为多模态语言模型(LMs)提供一个可视化的“草图板”,使其能够在解决问题时生成中间草图并进行推理。这...
    新技术# Visual SKETCHPAD# 多模态语言模型# 草图板
    12个月前
    04830
    新型文本到图像生成方法FRAP:基于自适应调整每个词汇的提示权重来改善生成图像与提示之间的一致性和真实性

    新型文本到图像生成方法FRAP:基于自适应调整每个词汇的提示权重来改善生成图像与提示之间的一致性和真实性

    阿尔伯塔大学电子与计算机工程系、华为技术加拿大公司和华为麒麟解决方案的研究人员推出新型文本到图像生成方法FRAP,旨在提高由文本提示生成图像的真实性和忠实度,确保生成的图像与文本描述的内容精确匹配。F...
    新技术# FRAP# 文生图
    2年前
    04830
    Perplexity 开发 AI 试穿功能,助力在线购物“所见即所得”

    Perplexity 开发 AI 试穿功能,助力在线购物“所见即所得”

    在线购物虽然方便,但“看不到实物”始终是用户的一大顾虑。为了解决这一痛点,Perplexity 正在开发一项基于人工智能的“虚拟试穿”功能,让用户在购买服装前,能通过上传个人照片生成穿着效果预览图,从...
    早报# AI 试穿# Perplexity
    10个月前
    04820
    ObjectMate:能够在无需微调的情况下,实现对象插入和主题驱动的图像生成

    ObjectMate:能够在无需微调的情况下,实现对象插入和主题驱动的图像生成

    对象插入和主体驱动生成是计算机视觉中的两个重要任务,旨在将给定的对象合成到由图像或文本指定的场景中。具体来说: 对象插入:将一个对象无缝地插入到目标场景中,要求合成后的图像在姿态、光照等方面看起来逼真...
    新技术# ObjectMate# 图像编辑
    1年前
    04820
    基于文本的编辑框架TurboEdit:能够使用极少的几步就能基于文本指令编辑真实图片

    基于文本的编辑框架TurboEdit:能够使用极少的几步就能基于文本指令编辑真实图片

    特拉维夫大学的研究人员推出一种流行的基于文本的编辑框架TurboEdit,它能够使用极少的几步就能基于文本指令编辑真实图片。这种技术利用了所谓的“扩散模型”(diffusion models),这是一...
    新技术# TurboEdit# 图像编辑# 编辑框架
    2年前
    04820
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    pure-genealogy

    pure-genealogy

    pure-genealogy是一个完全开源、深度中文化、支持多维可视化的现代化家族族谱管理系统。它不仅是一个工具,更是一种数字家史的载体。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    BuildCores

    BuildCores

    BuildCores 是一款集 3D 组装预览、智能兼容性检测、全球比价 于一体的在线装机工具。无论你是首次装机的新手,还是追求极致性能的发烧友,都能在手机或电脑上轻松规划、验证并优化你的 PC 配置。
    查看完整榜单