SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    来自亚利桑那州立大学、英特尔实验室、Hugging Face和华盛顿大学的研究人员推出SPRIGHT T2I,探讨如何改进文生图(Text-to-Image,简称T2I)模型在生成图像时保持空间一致性...
    新技术# SPRIGHT T2I# 文生图模型
    2年前
    09180
    新型视图合成技术InstantSplat:在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景

    新型视图合成技术InstantSplat:在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景

    来自德克萨斯大学奥斯汀分校、英伟达、厦门大学、佐治亚理工学院、斯坦福大学和南加州大学推出新型视图合成技术InstantSplat,它能够在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重...
    新技术# 3D场景# InstantSplat
    2年前
    01,0430
    基于身份条件的人脸基础模型Arc2Face:能够根据一个人的面部特征生成高质量的、逼真的图像

    基于身份条件的人脸基础模型Arc2Face:能够根据一个人的面部特征生成高质量的、逼真的图像

    来自英国伦敦帝国理工学院的研究人员推出基于身份条件的人脸基础模型Arc2Face,能够根据一个人的面部特征生成高质量的、逼真的图像。 项目主页 GitHub Demo 模型 想象一下,如果你有一张朋友...
    新技术# Arc2Face
    2年前
    05710
    视频编辑框架VideoSwap:让用户自定义视频中的主要对象(例如人物、动物或物体),同时保持背景不变

    视频编辑框架VideoSwap:让用户自定义视频中的主要对象(例如人物、动物或物体),同时保持背景不变

    来自新加坡国立大学和Meta推出视频编辑框架VideoSwap,它能够让用户自定义视频中的主要对象(例如人物、动物或物体),同时保持背景不变。你还可以通过交互式操作(如添加、删除等)进一步细化交换结果...
    新技术# VideoSwap# 视频编辑框架
    2年前
    07970
    TextCraftor:通过微调文本编码器来提高文本到图像生成模型的性能,使得生成的图像更加精确地反映文本描述的内容

    TextCraftor:通过微调文本编码器来提高文本到图像生成模型的性能,使得生成的图像更加精确地反映文本描述的内容

    来自Snap和美国东北大学的研究人员推出文本编码器TextCraftor,它通过微调文本编码器来提高文本到图像生成模型的性能,使得生成的图像更加精确地反映文本描述的内容。这种方法减少了对大量数据集的依...
    新技术# TextCraftor# 文本编码器
    2年前
    05710
    新型3D生成模型GaussianCube:通过结构化表示和优化传输方法解决了传统3D高斯溅射的问题

    新型3D生成模型GaussianCube:通过结构化表示和优化传输方法解决了传统3D高斯溅射的问题

    来自中国科学技术大学、清华大学和微软亚洲研究院的研究人员推出新型3D生成模型GaussianCube,它通过结构化表示和优化传输方法解决了传统3D高斯溅射的挑战,为3D内容的生成和编辑提供了一种高效且...
    新技术# 3D生成模型# GaussianCube
    2年前
    05480
    多模态大语言模型LITA:专门设计来处理视频中的时间定位问题

    多模态大语言模型LITA:专门设计来处理视频中的时间定位问题

    英伟达推出多模态大语言模型LITA(Language Instructed Temporal-Localization Assistant),它专门设计来处理视频中的时间定位问题。 GitHub 论文...
    新技术# LITA# 多模态大语言模型
    2年前
    08010
    创新框架FeatUp:提高深度学习模型中图像特征的空间分辨率,而不会损失原有的语义信息

    创新框架FeatUp:提高深度学习模型中图像特征的空间分辨率,而不会损失原有的语义信息

    来自麻省理工、微软、Adobe和谷歌的研究团队推出创新框架FeatUp,它能够提高深度学习模型中图像特征的空间分辨率,而不会损失原有的语义信息。在计算机视觉领域,深度学习模型通常会从图像中提取特征,这...
    新技术# FeatUp# 深度模型
    2年前
    05340
    图像转换方法img2img-turbo:在单个步骤中完成复杂的图像转换任务,同时不需要成对的训练数据,适用于多种应用场景

    图像转换方法img2img-turbo:在单个步骤中完成复杂的图像转换任务,同时不需要成对的训练数据,适用于多种应用场景

    来自卡内基梅隆大学和Adobe的研究人员推出新的图像转换方法img2img-turbo,它能够在单个步骤中将图像从源域转换到目标域,例如从白天的场景转换到夜晚,或者添加和移除天气效果如雾、雪和雨。这种...
    新技术# img2img-turbo# 图像转换
    2年前
    09180
    图像编辑框架FlexEdit:用于灵活且可控地编辑图像中的物体

    图像编辑框架FlexEdit:用于灵活且可控地编辑图像中的物体

    来自VinAI Research和越南科技大学的研究人员推出图像编辑框架FlexEdit,它是一个基于扩散模型(Stable Diffusion)的图像编辑框架,专门设计用于灵活且可控地编辑图像中的物...
    新技术# FlexEdit# 图像编辑框架
    2年前
    07310
    Garment3DGen:根据真实世界的图像或通过文本描述生成的图像来创建3D服装模型

    Garment3DGen:根据真实世界的图像或通过文本描述生成的图像来创建3D服装模型

    Meta推出Garment3DGen,它是一种自动化的方法,能够将基础的服装网格模型转换成可以直接用于模拟的资产,无论是通过图像还是文本提示。这个方法使得快速生成资产变得简单快捷,大大降低了原本需要专...
    新技术# 3D服装模型# Garment3DGen
    2年前
    07260
    图像风格化技术B-LoRA:将单张图片中的风格和内容分离,从而实现高质量的图像风格化处理

    图像风格化技术B-LoRA:将单张图片中的风格和内容分离,从而实现高质量的图像风格化处理

    来自特拉维夫大学和赖希曼大学的研究团队推出B-LoRA(Block Low-Rank Adaptation),它能够将单张图片中的风格和内容分离,从而实现高质量的图像风格化处理。图像风格化是指在保持图...
    新技术# B-LoRA# 图像风格化
    2年前
    05630
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    互联网大厂模拟器

    互联网大厂模拟器

    《互联网大厂模拟器》或许不会改变现实,但它提供了一个出口:在虚拟世界里,我们可以安全地体验“另一种职场人生”,然后笑着关掉页面,继续面对明天的站会。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    OpenStock

    OpenStock

    OpenStock 是昂贵市场平台的开源替代品。追踪实时价格、设置个性化提醒并探索详细的公司洞察——公开构建,为所有人服务,永久免费。
    查看完整榜单