SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2230 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    图像超分辨率技术InvSR:基于扩散反转(Diffusion Inversion)来提高图像的分辨率

    图像超分辨率技术InvSR:基于扩散反转(Diffusion Inversion)来提高图像的分辨率

    南洋理工大学(NTU)S-Lab提出了一种新的图像超分辨率(Super-Resolution, SR)技术——InvSR,旨在利用大型预训练扩散模型中封装的丰富图像先验来提高SR性能。传统的超分辨率方...
    新技术# InvSR# 图像超分辨率
    1年前
    03650
    Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

    Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

    游戏的未来不再依赖专业设计师逐帧构建,而是由每一位玩家通过想象、生成与体验来共同塑造。 今天,Dynamics Lab 正式推出 Mirage —— 全球首个AI原生、实时生成的用户生成内容(UGC...
    新技术# Dynamics Lab# Mirage
    6个月前
    03630
    MiniMax 发布其首个文本到图像生成模型 Image-01

    MiniMax 发布其首个文本到图像生成模型 Image-01

    MiniMax 近日正式发布了其首个文本到图像生成模型 Image-01,标志着其在多模态视觉领域的重大突破。Image-01 不仅扩展了 MiniMax 的 AI 功能,还为全球用户带来了极具创意和...
    早报# Image-01# MiniMax# 图像生成模型
    10个月前
    03630
    强化学习新范式OREAL:基于结果奖励的强化学习(RL)提升大语言模型在数学推理任务中的表现

    强化学习新范式OREAL:基于结果奖励的强化学习(RL)提升大语言模型在数学推理任务中的表现

    上海AI实验室、上海交通大学、香港中文大学和InnoHK的研究人员提出基于结果奖励的强化学习新范式OREAL,通过基于结果奖励的强化学习(RL)提升大语言模型(LLMs)在数学推理任务中的表现。该框架...
    新技术# OREAL# 大语言模型# 强化学习
    10个月前
    03630
    Ollama v0.7.0发布:添加新多模态模型引擎,多模态模型支持全面升级

    Ollama v0.7.0发布:添加新多模态模型引擎,多模态模型支持全面升级

    Ollama 最新发布的 v0.7.0 版本带来了对多模态模型的支持,标志着其在本地推理和模型集成能力上的重要突破。此次更新不仅扩展了视觉多模态模型的支持范围,还通过全新的多模态引擎提升了性能、准确性...
    早报# Ollama# 多模态模型# 多模态模型引擎
    7个月前
    03620
    新型虚拟试穿技术FitDiT:专为优化DiT模型的虚拟试穿性能而设计

    新型虚拟试穿技术FitDiT:专为优化DiT模型的虚拟试穿性能而设计

    尽管基于图像的虚拟试穿技术已取得显著进展,但在生成高保真度和适应性强的拟合图像上仍面临诸多挑战。尤其在纹理感知维护和尺寸感知拟合等关键领域,现有方法往往难以达到理想效果,这限制了技术的整体实用性。为应...
    新技术# FitDiT# 虚拟试穿
    11个月前
    03610
    OpenAI发布全新GPT-4.1系列模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano

    OpenAI发布全新GPT-4.1系列模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano

    本周一,OpenAI发布了全新的模型系列——GPT-4.1,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编程和指令遵循方面表现出色,标志着OpenAI在打造“代理...
    大语言模型早报# GPT-4.1# GPT-4.1 mini# GPT-4.1 nano
    8个月前
    03600
    MotiF:通过引导模型关注更多运动区域来改善文本对齐和运动生成

    MotiF:通过引导模型关注更多运动区域来改善文本对齐和运动生成

    文本-图像到视频生成(TI2V) 是一项旨在根据文本描述从静态图像生成动态视频的技术。尽管这一领域已经取得了一定进展,但现有方法在生成与文本提示良好对齐的视频时仍面临显著挑战,尤其是在指定运动细节方面...
    新技术# MotiF# 图生视频
    12个月前
    03600
    Grammarly 推出九大人机协作写作智能体,可预测论文评分

    Grammarly 推出九大人机协作写作智能体,可预测论文评分

    Grammarly 今日正式推出九个全新人工智能智能体(AI Agents),集成于其“AI 原生写作界面”中,旨在为学生和教育工作者提供更智能、更精准的写作支持。 这些智能体覆盖从构思、写作到反馈的...
    早报# Grammarly# 写作智能体
    4个月前
    03590
    为了AI的“福祉”?Anthropic 让 Claude 能主动结束有害对话

    为了AI的“福祉”?Anthropic 让 Claude 能主动结束有害对话

    Anthropic宣布,其最新一代大模型 Claude Opus 4 和 4.1 获得了一项新能力:在极端情况下,主动终止与用户的对话。 这并非因为用户“说错话”,而是当对话持续涉及严重滥用内容——如...
    早报# Anthropic# Claude
    4个月前
    03590
    大规模视频动作数据集EgoVid-5M:专为第一人称视角(egocentric)视频生成而设计

    大规模视频动作数据集EgoVid-5M:专为第一人称视角(egocentric)视频生成而设计

    阿里巴巴集团智能计算研究院、中国科学院自动化研究所、清华大学和中国科学院大学的研究人员推出大规模视频动作数据集EgoVid-5M,专为第一人称视角(egocentric)视频生成而设计。该数据集包含了...
    新技术# EgoVid-5M# 视频动作数据集
    1年前
    03580
    Anthropic 推出新一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4

    Anthropic 推出新一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4

    今天,Anthropic 宣布推出下一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4。这两个模型在编码、高级推理和 AI 代理方面设定了新的行业标准,为开发者和...
    早报# Claude# Claude Code# Claude Opus 4
    7个月前
    03560
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    人生 K 线

    新人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单