SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2231 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Hugging Face 推出开源替代方案 Open Deep Research,挑战 OpenAI 的 Deep Research

    Hugging Face 推出开源替代方案 Open Deep Research,挑战 OpenAI 的 Deep Research

    在 OpenAI 发布其多步骤研究工具 Deep Research 后不到一天,Hugging Face 迅速推出了名为 Open Deep Research 的开源项目。这一举动不仅展示了 Hugg...
    早报# Deep Research# Hugging Face# Open Deep Research
    10个月前
    03270
    ChatGPT移动应用收入突破20亿美元,领跑AI助手赛道

    ChatGPT移动应用收入突破20亿美元,领跑AI助手赛道

    根据应用市场分析机构 Appfigures 的最新数据,自2023年5月上线以来,ChatGPT 的 iOS 与 Android 移动应用全球消费者支出已达到 20亿美元。 这一数字不仅标志着其在移动...
    早报# ChatGPT
    4个月前
    03260
    DEER:让大模型推理更高效,动态提前退出的新方法

    DEER:让大模型推理更高效,动态提前退出的新方法

    近年来,大型推理语言模型(LRLM)如 DeepSeek-R1 和 GPT-O1 的发展显著提升了复杂问题的解决能力。这些模型通过延长推理过程中“思维链”(Chain of Thought, CoT...
    新技术# DEER# 大模型推理
    8个月前
    03260
    Runway 发布新一代视频生成模型 Gen-4,聚焦图像生成视频与世界一致性

    Runway 发布新一代视频生成模型 Gen-4,聚焦图像生成视频与世界一致性

    AI 初创公司 Runway 于周一正式发布其新一代生成式 AI 模型 Gen-4,声称这是有史以来最高保真度的视频生成模型之一。Gen-4 已经向 Runway 的个人付费和企业客户推出,其强大的功...
    早报# Gen-4# Runway# 视频生成模型
    9个月前
    03260
    用于类别无关的姿态估计新型框架EdgeCape

    用于类别无关的姿态估计新型框架EdgeCape

    特拉维夫大学的研究人员推出新型框架EdgeCape,它用于类别无关的姿态估计(Category-Agnostic Pose Estimation, CAPE)。EdgeCape能够通过单一模型在多样化...
    新技术# EdgeCape# 姿态估计
    1年前
    03260
    专门为I2V模型量身定制的大规模数据集TIP-I2V:包含了超过170万独特的用户提供的文本和图像提示

    专门为I2V模型量身定制的大规模数据集TIP-I2V:包含了超过170万独特的用户提供的文本和图像提示

    AI驱动的视频生成领域正在迅速发展,图像到视频(I2V)模型因其视觉一致性和增强的可控性而处于前沿。然而,一个显著的差距一直存在:缺乏专门的数据集来理解图像到视频提示的独特需求。为了填补这一空白,悉尼...
    新技术# TIP-I2V# 图生视频模型
    1年前
    03260
    Perplexity旗下 AI 浏览器 Comet 正式免费向所有人开放

    Perplexity旗下 AI 浏览器 Comet 正式免费向所有人开放

    AI 搜索公司 Perplexity 宣布,其自研浏览器 Comet 即日起对所有用户免费开放,不再需要订阅门槛和邀请码。 此前,这款浏览器仅限于每月 200 美元的 Perplexity Max 用...
    早报# Comet# Perplexity
    3个月前
    03250
    长上下文调优训练范式LCT:通过将预训练的单镜头视频扩散模型扩展到场景级视频生成,以生成具有视觉和动态一致性的多镜头视频内容

    长上下文调优训练范式LCT:通过将预训练的单镜头视频扩散模型扩展到场景级视频生成,以生成具有视觉和动态一致性的多镜头视频内容

    香港中文大学和字节跳动的研究人员提出了一种名为 Long Context Tuning(LCT,长上下文调优)的训练范式,通过将预训练的单镜头视频扩散模型扩展到场景级视频生成,以生成具有视觉和动态一致...
    新技术# LCT# 训练范式# 长上下文调优
    9个月前
    03250
    谷歌回应 AI 搜索争议:总点击量稳定,但“一些网站”已受影响

    谷歌回应 AI 搜索争议:总点击量稳定,但“一些网站”已受影响

    “AI 搜索正在杀死出版商”——这是过去一年中频繁出现的论断。多项第三方研究指出,随着谷歌在搜索结果页引入“AI 概述(AI Overviews)”和对话式功能,用户点击外部网站的次数显著减少。 对此...
    早报# Google# 谷歌
    5个月前
    03240
    谷歌Bug大放送:免费领取一年Gemini Advanced和2TB云端存储

    谷歌Bug大放送:免费领取一年Gemini Advanced和2TB云端存储

    近日,谷歌的一项活动出现了意外漏洞,原本仅限美国学生的 Gemini Advanced 会员计划 现在对任何人开放。通过切换到美国IP地址,用户可以免费领取一年的 Gemini Advanced 高级...
    早报# Gemini Advanced# 谷歌
    8个月前
    03240
    视频分词器VidTok:用于将视频内容编码成紧凑的潜在标记

    视频分词器VidTok:用于将视频内容编码成紧凑的潜在标记

    微软研究院、上海交通大学和北京大学的研究人员推出视频分词器VidTok,它是一个多功能且开源的工具,用于将视频内容编码成紧凑的潜在标记(latent tokens)。VidTok在连续和离散标记化方面...
    新技术# VidTok# 视频分词器
    1年前
    03240
    基于扩散模型的面部匿名化技术:匿名化后的面部与原始照片无缝融合,使其非常适合各种现实世界应用

    基于扩散模型的面部匿名化技术:匿名化后的面部与原始照片无缝融合,使其非常适合各种现实世界应用

    特伦托大学、奥卢大学和新加坡国立大学的研究人员推出一种基于扩散模型的面部匿名化技术,旨在简化面部匿名化流程,同时保留原始图像中的面部表情、头部姿势、眼神方向和背景元素等关键细节。这种方法有效地掩盖了身...
    新技术# 面部匿名化技术
    1年前
    03240
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    PDF Craft

    新PDF Craft

    PDF Craft是一款专注于扫描版书籍 PDF 转换的开源工具。它利用 DeepSeek OCR 模型,在本地完成从图像型 PDF 到结构化电子书(如 Markdown 或 EPUB)的全流程处理,无需联网,不依赖大语言模型(LLM),适合对隐私、精度与效率有要求的用户。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单