SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2249 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Opera 推出 AI 浏览器操作员(Browser Operator),助力高效浏览体验

    Opera 推出 AI 浏览器操作员(Browser Operator),助力高效浏览体验

    Opera推出了一项创新功能——AI 浏览器操作员(Browser Operator)。这款原生 AI 代理通过将 AI 技术直接集成到浏览器中,帮助用户更高效地完成各种在线任务,例如购物、预订航班或...
    早报# Browser Operator# Opera# 浏览器操作员
    10个月前
    03910
    微软推出面向临床医生的统一语音 AI 助手Dragon Copilot

    微软推出面向临床医生的统一语音 AI 助手Dragon Copilot

    微软宣布推出 Dragon Copilot,这是一款专为临床医生设计的统一语音 AI 助手。它结合了 Dragon Medical One(DMO)和 DAX Copilot(DAX)的功能,通过强大...
    早报# Dragon Copilot# 微软# 语音 AI 助手
    10个月前
    01970
    微软将 DeepSeek 7B 和 14B AI 模型引入 Copilot+ PC

    微软将 DeepSeek 7B 和 14B AI 模型引入 Copilot+ PC

    微软正在加速推进设备端 AI 的发展,通过将 DeepSeek 7B 和 14B 模型引入 Copilot+ PC,为开发人员和用户带来更强大的 AI 功能和更高效的计算体验。 DeepSeek 模型...
    早报# DeepSeek-R1# 微软
    10个月前
    02210
    Gemini Live将带来重大更新:让谷歌的 AI 模型通过摄像头“看”世界

    Gemini Live将带来重大更新:让谷歌的 AI 模型通过摄像头“看”世界

    谷歌正在为旗下的 AI 助手 Gemini 带来重大更新,使其具备更强的互动性和情境感知能力。通过引入实时视频分析和屏幕共享功能,Gemini 不再是一个简单的聊天机器人,而是一个能够“看”到并理解用...
    早报# Gemini# 谷歌
    10个月前
    02530
    如何在安卓设备上添加和使用 Gemini 扩展服务

    如何在安卓设备上添加和使用 Gemini 扩展服务

    在安卓设备上,Gemini 应用通过扩展服务为用户提供了更多功能。这些扩展服务可以帮助 Gemini 与各种应用和服务互动,从而增强其人工智能驱动的任务执行能力。以下是关于如何添加和使用 Gemini...
    教程# Gemini# 扩展服务
    10个月前
    02280
    谷歌为 Colab 升级 AI 代理工具,数据科学代理(Data Science Agent)正式上线

    谷歌为 Colab 升级 AI 代理工具,数据科学代理(Data Science Agent)正式上线

    谷歌的云端笔记本工具 Google Colab 迎来了新的升级,引入了 数据科学代理(Data Science Agent),以帮助用户更高效地进行数据处理、可视化和分析。这一工具最初在去年年初的谷歌...
    早报# Google Colab# 数据科学代理# 谷歌
    10个月前
    02410
    Stability AI 与 Arm 合作,将音频生成模型Stable Audio Open带入移动设备

    Stability AI 与 Arm 合作,将音频生成模型Stable Audio Open带入移动设备

    AI 初创公司 Stability AI 宣布与Arm 合作,优化了其音频生成模型 Stable Audio Open,使其能够在运行 Arm 芯片的移动设备上运行。这一合作旨在推动生成式 AI 技术...
    早报# Arm# Stability AI# Stable Audio Open
    10个月前
    02310
    MiniMax 发布其首个文本到图像生成模型 Image-01

    MiniMax 发布其首个文本到图像生成模型 Image-01

    MiniMax 近日正式发布了其首个文本到图像生成模型 Image-01,标志着其在多模态视觉领域的重大突破。Image-01 不仅扩展了 MiniMax 的 AI 功能,还为全球用户带来了极具创意和...
    早报# Image-01# MiniMax# 图像生成模型
    10个月前
    03890
    深圳大学推出Attention Distillation:用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中

    深圳大学推出Attention Distillation:用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中

    深圳大学的研究团队介绍了一种名为 Attention Distillation (AD) 的方法,用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中。该方法通过计算预训练扩散模型中的自注...
    新技术# Attention Distillation# 参考图像# 深圳大学
    10个月前
    04490
    用推理模型评估模块化RAG:推理模型在核心检索任务中尚未超越传统RAG管道

    用推理模型评估模块化RAG:推理模型在核心检索任务中尚未超越传统RAG管道

    在检索增强生成(RAG)系统中,kapa.ai一直在探索如何利用最新的技术提升系统的性能和适应性。最近,它们团队尝试将OpenAI的o3-mini推理模型融入RAG管道,希望借助其强大的推理能力优化信...
    科普# RAG# 推理模型# 检索增强生成
    10个月前
    02530
    Mistral AI:欧洲的AI新星,能否撼动OpenAI的霸主地位?

    Mistral AI:欧洲的AI新星,能否撼动OpenAI的霸主地位?

    Mistral AI是一家来自法国的科技初创公司,凭借其AI助手Le Chat和多个基础模型,被公认为法国最有前途的科技初创公司之一。它也被视为欧洲唯一一家能够与OpenAI竞争的AI企业。然而,尽管...
    科普# Le Chat# Mistral AI# 法国
    10个月前
    02830
    OpenAI计划将视频生成工具Sora引入ChatGPT,拓展AI创作能力

    OpenAI计划将视频生成工具Sora引入ChatGPT,拓展AI创作能力

    在本周五的一次Discord办公时间会议上,OpenAI的高管透露了其计划将AI视频生成工具 Sora 集成到广受欢迎的消费者聊天机器人 ChatGPT 中。这一举措标志着OpenAI正致力于进一步扩...
    早报# OpenAI# Sora# 视频生成
    10个月前
    02260
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Vibium

    新Vibium

    Vibium 是专为 AI 代理构建的浏览器自动化基础架构。一个单一二进制文件即可处理浏览器生命周期、WebDriver BiDi 协议,并暴露一个 MCP 服务器——因此 Claude Code(或任何 MCP 客户端)无需任何设置即可驱动浏览器。非常适用于 AI 代理、测试自动化以及任何需要浏览器的场景。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    查看完整榜单