SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2227 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    非自回归扩散框架的动态帧化身DAWN:根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频

    非自回归扩散框架的动态帧化身DAWN:根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频

    中国科学技术大学和科大讯飞研究院的研究人员推出新框架DAWN,它能够根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频。这项技术的核心在于使用非自回归(NAR)扩散模型来一次性生成动态长度的...
    新技术# DAWN# 头部动画
    1年前
    04430
    Jina AI推出新型文本嵌入模型 jina-embeddings-v3:专为多语言数据和长文本检索任务优化

    Jina AI推出新型文本嵌入模型 jina-embeddings-v3:专为多语言数据和长文本检索任务优化

    Jina AI推出文本嵌入模型 jina-embeddings-v3,这是一个具有 5.7 亿参数的新型文本嵌入模型,它在多语言数据和长上下文检索任务上实现了最先进的性能,支持的最大上下文长度达到 8...
    新技术# jina-embeddings-v3# 文本嵌入模型
    1年前
    04410
    LM Arena 被指控操纵 AI 基准测试,缺乏公正性和透明性

    LM Arena 被指控操纵 AI 基准测试,缺乏公正性和透明性

    一项由 Cohere、斯坦福大学、麻省理工学院和 Ai2 研究人员联合发布的新研究,指责热门 AI 基准测试平台 LM Arena(Chatbot Arena 的背后组织)帮助少数顶级 AI 实验室通...
    早报# LM Arena
    8个月前
    04380
    新型图像到视频生成技术OSV:可以将单张图像仅仅一步内生成高质量视频

    新型图像到视频生成技术OSV:可以将单张图像仅仅一步内生成高质量视频

    复旦大学、香港科技大学、香港中文大学和腾讯优图实验室的研究人员推出新型图像到视频生成技术OSV,可以将单张图像转换成视频。这项技术的目标是能够快速生成高质量的视频内容,而不需要复杂的多步骤处理。例如...
    新技术# OSV
    1年前
    04380
    图像编辑框架InstantDrag:通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速

    图像编辑框架InstantDrag:通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速

    首尔国立大学和浦项科技大学的研究人员推出图像编辑框架InstantDrag,它能够让用户通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速。例如,你有一张图片,你想要移动图片中的某个部...
    新技术# InstantDrag# 图像编辑
    1年前
    04380
    ElevenLabs发布全球首个AI“狗语”TTS模型Text To Bark,开启跨物种沟通新时代?

    ElevenLabs发布全球首个AI“狗语”TTS模型Text To Bark,开启跨物种沟通新时代?

    ElevenLabs于4月1日一本正经的宣布推出全球首个为狗开发的AI文本转语音模型:Text To Bark,号称标志着人类与宠物之间的沟通进入了一个全新的时代。 用户只需输入一条消息,选择狗狗的品...
    早报# ElevenLabs# Text To Bark# 狗语
    9个月前
    04370
    图像匹配框架MINIMA:解决跨视图和跨模态的情况下,多模态感知中的图像匹配问题

    图像匹配框架MINIMA:解决跨视图和跨模态的情况下,多模态感知中的图像匹配问题

    华中科技大学和武汉大学的研究人员推出一个统一的图像匹配框架MINIMA,即模态不变图像匹配。这项研究旨在解决多模态感知中的图像匹配问题,特别是在跨视图和跨模态的情况下。例如,在自动驾驶中,需要将可见光...
    新技术# MINIMA# 图像匹配框架
    11个月前
    04370
    警惕!谷歌 Gemini CLI 存在高危漏洞,可能被用于静默窃取敏感信息

    警惕!谷歌 Gemini CLI 存在高危漏洞,可能被用于静默窃取敏感信息

    一款旨在提升开发效率的 AI 编码工具,也可能成为攻击者入侵系统的跳板。 谷歌于 2025 年 6 月推出的 Gemini CLI——一款集成其最先进 Gemini 2.5 Pro 模型的命令行代码助...
    早报# Gemini CLI# 谷歌
    5个月前
    04360
    用ChatGPT生成个性化微信表情包,简单几步教你玩转创意表达

    用ChatGPT生成个性化微信表情包,简单几步教你玩转创意表达

    GPT4o的原生图像生成功能,让ChatGPT再次成为网络热点,它允许用户通过简单的文本提示创建高质量图像。从吉卜力风格的壁纸到复杂的图像编辑,这一功能为创意表达带来了无限可能。 目前,ChatGPT...
    教程# ChatGPT# 微信表情包
    8个月前
    04360
    Meta推出个性化图像生成模型Imagine yourself:根据参考照片,生成遵循特定文字描述的新图像,而且不需要对每个新用户进行单独调整

    Meta推出个性化图像生成模型Imagine yourself:根据参考照片,生成遵循特定文字描述的新图像,而且不需要对每个新用户进行单独调整

    Meta旗下GenAI团队推出个性化图像生成模型Imagine yourself,与传统的基于调整的个性化技术不同,Imagine yourself作为一个无需调整的模型运行,使得所有用户都能利用共享...
    新技术# Imagine yourself# Meta
    1年前
    04350
    OpenAI新推理模型o3和o4-mini:性能提升,幻觉问题却更严重

    OpenAI新推理模型o3和o4-mini:性能提升,幻觉问题却更严重

    OpenAI最近推出的o3和o4-mini AI模型在性能上展现了许多突破性进展,尤其是在编码和数学任务中表现优异。然而,这些新模型的“幻觉”问题——即编造不存在的事实或内容——却比以往的模型更加严重...
    早报# o3# o4-mini# OpenAI
    8个月前
    04340
    谷歌用AI重构航班搜索,推“航班优惠”功能直面反垄断与竞争压力

    谷歌用AI重构航班搜索,推“航班优惠”功能直面反垄断与竞争压力

    谷歌周四宣布推出一项由人工智能驱动的新功能——航班优惠(Flight Deals),旨在帮助用户通过自然语言查询,发现更便宜、更灵活的旅行选择。这一更新将AI深度整合进其核心的旅行搜索服务,但同时也让...
    早报# 航班优惠# 航班搜索# 谷歌
    4个月前
    04330
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    OpenSkills

    OpenSkills

    OpenSkills 是 Anthropic的 Claude Skills 系统的开源实现。它让 Cursor、Windsurf、Aider 等主流 AI 编码代理也能使用与 Claude Code 完全兼容的技能系统——相同的提示格式、相同的文件结构、相同的渐进式披露机制,只是调用方式从内置工具变为 CLI 命令。
    必应图像创建器

    必应图像创建器

    微软必应旗下的图像创建器(Bing Image Creator)是基于基于OpenAI 的 DALL-E 图片生成技术,可以让用户通过输入一些自然语言的指令(咒语),生成各种有趣和创意的图片。此工具以后也将会是必应搜索的一部分,用户可以在网页上直接使用,也可以通过Bing Chat来使用。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Poe

    Poe

    Poe 不仅仅是一个聊天应用,它是一个集成了多模型互动、自定义应用创建和多样化工具的综合性平台。无论是希望通过多种 AI 模型解决问题的用户,还是希望探索 AI 创造力的开发者,Poe 都提供了丰富的可能性。
    查看完整榜单