SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2230 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Long Volumetric Video:高效地表示和渲染长时间的体积视频

    Long Volumetric Video:高效地表示和渲染长时间的体积视频

    浙江大学、斯坦福大学和香港科技大学的研究人员发布论文,主题是关于如何高效地表示和渲染长时间的体积视频(Long Volumetric Video)。体积视频是一种能够从多个视角捕捉动态场景并提供自由视...
    新技术# EasyVolcap# longvolcap# 体积视频
    1年前
    03690
    WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统

    WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统

    阿卜杜拉国王科技大学、兰州大学、悉尼大学的研究人员推出WikiAutoGen,这是一个用于自动化生成多模态维基百科风格文章的系统。它通过整合文本和图像信息,生成高质量、多模态的维基百科风格文章,同时引...
    新技术# WikiAutoGen# 多模态# 维基百科
    9个月前
    03680
    新型图生视频模型VidCRAFT3:能够同时控制相机运动、物体运动和光照方向

    新型图生视频模型VidCRAFT3:能够同时控制相机运动、物体运动和光照方向

    复旦大学、浙江大学、华为诺亚方舟实验室、西湖大学的研究人员推出新型高质量图像到视频生成模型VidCRAFT3 ,能够同时控制相机运动、物体运动和光照方向。它通过解耦这些视觉元素的控制,实现了对生成视频...
    新技术# VidCRAFT3# 视频生成
    10个月前
    03670
    ReferEverything:专为视频中通过自然语言描述的概念进行分割而设计

    ReferEverything:专为视频中通过自然语言描述的概念进行分割而设计

    来自卡内基梅隆大学、伊利诺伊大学香槟分校和丰田研究所的研究者们共同提出了一种名为ReferEverything(Reference Expression Modeling)的创新框架,专为视频中通过自...
    新技术# ReferEverything# 分割模型
    1年前
    03670
    Flow-GRPO:将在线强化学习与流匹配模型相结合,用于提升文生图模型生成任务的性能

    Flow-GRPO:将在线强化学习与流匹配模型相结合,用于提升文生图模型生成任务的性能

    香港中文大学MM实验室、清华大学、快手科技、南京大学和上海人工智能实验室推出新方法Flow-GRPO,它将在线强化学习(Reinforcement Learning, RL)与流匹配(Flow Mat...
    新技术# Flow-GRPO# 强化学习# 流匹配
    7个月前
    03660
    超分辨率渲染新技术框架DFASRR:实现任意比例的超分辨率渲染,以实时生成高清晰度图像

    超分辨率渲染新技术框架DFASRR:实现任意比例的超分辨率渲染,以实时生成高清晰度图像

    南京大学计算机软件新技术国家重点实验室的研究人员介绍了一种名为“DFASRR(Deep Fourier-based Arbitrary-scale Super-resolution for Real...
    新技术# DFASRR# 超分辨率渲染
    1年前
    03660
    FlipSketch:将静态绘图转换为文本引导的草图动画

    FlipSketch:将静态绘图转换为文本引导的草图动画

    草图动画作为一种强大的视觉叙事工具,从简单的手工翻页涂鸦发展到了专业的工作室制作,为创作者提供了无限的想象空间。然而,传统的动画制作过程复杂,不仅需要一支熟练的艺术家团队来绘制关键帧和中间帧,还要求艺...
    新技术# FlipSketch# 草图动画
    1年前
    03660
    Anthropic 回应 OpenAI:1 美元向美国政府机构提供 Claude

    Anthropic 回应 OpenAI:1 美元向美国政府机构提供 Claude

    在 OpenAI 宣布以每年 1 美元的价格向美国联邦行政部门提供 ChatGPT Enterprise 仅一周后,Anthropic 迅速出手,将这场“AI 入政”竞赛推向新高度。 周二,Anthr...
    早报# Anthropic# Claude
    4个月前
    03650
    Anthropic 推出百万 tokens 上下文:Claude Sonnet 4 支持 75 万字输入

    Anthropic 推出百万 tokens 上下文:Claude Sonnet 4 支持 75 万字输入

    Anthropic 正在将其 AI 模型的上下文窗口推向新高度。近日,公司宣布其主力模型 Claude Sonnet 4 现已支持 100 万个 tokens 的上下文长度,相当于可一次性处理 75 ...
    早报# Anthropic# Claude Sonnet 4
    4个月前
    03650
    SimpleGVR:轻量高效视频超分辨率模型,让低清视频也能高清呈现

    SimpleGVR:轻量高效视频超分辨率模型,让低清视频也能高清呈现

    由澳门大学智慧城市物联网国家重点实验室、中国科学院深圳先进技术研究院、清华大学、快手科技和深圳理工大学联合研究团队提出了一种新型视频超分辨率(Video Super-Resolution, VSR)模...
    新技术# SimpleGVR# 视频超分辨率模型
    6个月前
    03650
    OpenAI即将推出GPT-4o的升级版GPT-4.1:更智能、更小巧

    OpenAI即将推出GPT-4o的升级版GPT-4.1:更智能、更小巧

    OpenAI正准备推出其旗舰模型GPT-4o的升级版——GPT-4.1,同时还将发布一系列轻量级变体,如GPT-4.1 mini和nano。这一战略调整旨在提升AI的可扩展性和可访问性,让高级AI能力...
    早报# GPT-4.1# GPT-4o# OpenAI
    8个月前
    03650
    Grok上线全新语音交互模式,支持18+模式

    Grok上线全新语音交互模式,支持18+模式

    xAI 最近为其AI助手Grok推出了一种新的语音交互模式,这种模式目前仅面向高级订阅用户开放。该功能与 OpenAI 的 ChatGPT 高级语音模式类似,但在内容上却有着显著的不同——Grok 提...
    早报# Grok# 语音
    10个月前
    03650
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    人生 K 线

    新人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单