SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2231 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    OpenAI宣布将于4月30日停用GPT-4

    OpenAI宣布将于4月30日停用GPT-4

    OpenAI近日宣布,将于4月30日从ChatGPT中正式停用两年前推出的AI模型GPT-4。根据周四发布的更新日志,GPT-4将被当前ChatGPT的默认模型GPT-4o“完全取代”。不过,用户仍可...
    早报# GPT-4# OpenAI# 萨姆·奥尔特曼
    8个月前
    03180
    Anthropic为其AI助手Claude推出了令人期待的网络搜索功能

    Anthropic为其AI助手Claude推出了令人期待的网络搜索功能

    Anthropic为其AI助手Claude推出了令人期待的网络搜索功能,这项更新使得Claude能够提供更加及时和相关的回答。通过整合实时网络信息,Claude不仅能访问最新的事件和数据,还能在需要最...
    早报# Anthropic# Claude# 网络搜索
    9个月前
    03180
    新型检索增强生成(RAG)框架 ViDoRAG:专门用于处理视觉丰富文档中的复杂推理任务

    新型检索增强生成(RAG)框架 ViDoRAG:专门用于处理视觉丰富文档中的复杂推理任务

    中国科学技术大学、阿里通义实验室和上海交通大学的研究人员推出新型检索增强生成(RAG)框架 ViDoRAG,专门用于处理视觉丰富文档中的复杂推理任务。该框架通过动态迭代推理代理(agents)和多模态...
    新技术# ViDoRAG# 检索增强生成
    9个月前
    03180
    摩尔线程宣布已经成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

    摩尔线程宣布已经成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

    在 DeepSeek 开源周的第四天,摩尔线程宣布了一项重要的技术进展:成功支持 DeepSeek 的开源通信库 DeepEP 和并行算法 DualPipe,并发布了相关的开源代码仓库 MT-Deep...
    早报# DeepEP# DeepSeek# DualPipe
    10个月前
    03180
    零样本视频对象插入框架VideoAnydoor:能够在视频中高精度地插入给定对象,并且允许用户精确控制对象的运动

    零样本视频对象插入框架VideoAnydoor:能够在视频中高精度地插入给定对象,并且允许用户精确控制对象的运动

    由香港大学和阿里巴巴达摩院等机构的研究团队推出零样本视频对象插入框架VideoAnydoor ,它能够在视频中高精度地插入给定对象,并且允许用户精确控制对象的运动。这项技术的核心挑战在于既要保留参考对...
    新技术# VideoAnydoor# 视频对象插入
    12个月前
    03180
    文生图模型SnapGen:能够在移动平台上生成高分辨率和高品质的图像

    文生图模型SnapGen:能够在移动平台上生成高分辨率和高品质的图像

    现有的文本到图像(T2I)扩散模型虽然在生成高质量图像方面表现出色,但面临着几个关键挑战: 模型尺寸大:许多先进的T2I模型包含数十亿个参数,导致存储和部署成本高昂。 运行时间慢:生成高分辨率图像通常...
    新技术# SnapGen# 文生图模型
    1年前
    03180
    MUVERA:让多向量检索像单向量一样快的新一代高效算法

    MUVERA:让多向量检索像单向量一样快的新一代高效算法

    在 RAG(Retrieval-Augmented Generation)系统中,信息检索是决定整体性能的关键环节。传统的单向量搜索(如基于 ElasticSearch 或 FAISS 的 MIPS...
    新技术# MUVERA# 向量检索
    6个月前
    03170
    OpenAI 正式面向 ChatGPT Pro 用户开放o3 Pro 模型

    OpenAI 正式面向 ChatGPT Pro 用户开放o3 Pro 模型

    OpenAI 正式向 ChatGPT Pro 用户推出全新升级模型——o3 Pro。该模型基于此前发布的 o3 和 o4-mini 模型进行增强,进一步提升了推理能力与多模态工具调用效率,专为专业用户...
    早报# o3 Pro 模型# OpenAI
    7个月前
    03170
    Google I/O 2025 发布 Native Speech Generation:AI 语音迈入拟真新纪元,免费支持多角色播客制作!

    Google I/O 2025 发布 Native Speech Generation:AI 语音迈入拟真新纪元,免费支持多角色播客制作!

    在2025年的Google I/O开发者大会上,Google AI Studio推出了一项名为“Native Speech Generation(原生语音生成)”的创新功能,将AI语音生成技术推向了一...
    早报# Native Speech Generation# 原生语音生成# 谷歌
    7个月前
    03170
    OpenAI推出最贵推理模型o1-pro,值不值?

    OpenAI推出最贵推理模型o1-pro,值不值?

    OpenAI又有了新动作,推出了更强大的o1“推理”模型版本o1-pro。然而,这个新模型的高昂价格引发了广泛的关注和讨论。 o1-pro:强大的性能与昂贵的价格 o1-pro是OpenAI在其开发者...
    早报# o1-pro# OpenAI
    9个月前
    03170
    谷歌引入 AI 技术以判断用户年龄,加强未成年人保护

    谷歌引入 AI 技术以判断用户年龄,加强未成年人保护

    谷歌近期宣布将推出一项新的 AI 驱动功能,旨在更好地保护其平台(包括 YouTube)上的未成年用户。这一举措是谷歌为加强儿童网络安全所做的更广泛努力的一部分。 AI 判断用户年龄的功能 谷歌计划测...
    早报# YouTube# 谷歌
    10个月前
    03170
    字节跳动发布豆包大模型 1.5 Pro,性能超越 GPT-4o 和 Claude 3.5 Sonnet

    字节跳动发布豆包大模型 1.5 Pro,性能超越 GPT-4o 和 Claude 3.5 Sonnet

    字节跳动今日正式发布了其最新的豆包大模型 1.5 Pro(Doubao-1.5-pro),该模型在多个测评基准上,包括知识、代码、推理和中文等方面,展现了优于 GPT-4o 和 Claude 3.5 ...
    早报# 字节跳动# 豆包大模型 1.5 Pro
    10个月前
    03170
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    PDF Craft

    新PDF Craft

    PDF Craft是一款专注于扫描版书籍 PDF 转换的开源工具。它利用 DeepSeek OCR 模型,在本地完成从图像型 PDF 到结构化电子书(如 Markdown 或 EPUB)的全流程处理,无需联网,不依赖大语言模型(LLM),适合对隐私、精度与效率有要求的用户。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单