SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2359 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    港大、浙大联合快手提出Context-as-Memory:解决交互式长视频生成的场景一致性难题

    港大、浙大联合快手提出Context-as-Memory:解决交互式长视频生成的场景一致性难题

    香港大学、浙江大学与快手可灵团队的研究人员,针对当前交互式长视频生成中“场景易断裂、历史上下文难复用”的痛点,提出 Context-as-Memory(上下文即记忆) 方法。该方法通过将历史帧直接作为...
    新技术# Context-as-Memory# 场景一致性
    6个月前
    02950
    DuPO框架:通过双学习和偏好优化的方法,使大语言模型能够在没有标注数据的情况下进行自我验证和优化

    DuPO框架:通过双学习和偏好优化的方法,使大语言模型能够在没有标注数据的情况下进行自我验证和优化

    字节跳动Seed团队和南京大学的研究人员推出DuPO框架,它通过双学习(dual learning)和偏好优化(preference optimization)的方法,使大语言模型(LLMs)能够在没...
    新技术# DuPO框架# 大语言模型
    6个月前
    01770
    北卡教堂山分校新研究:GPT-5、Gemini-2.5-Pro等顶级多模态大语言模型,竟难区分图像90°与270°旋转

    北卡教堂山分校新研究:GPT-5、Gemini-2.5-Pro等顶级多模态大语言模型,竟难区分图像90°与270°旋转

    北卡罗来纳大学教堂山分校的研究团队,针对多模态大语言模型(MLLMs)的空间视觉推理能力展开专项测试——聚焦“图像旋转角度识别”任务(判断图像是否旋转0°、90°、180°、270°)。 GitHub...
    新技术# RotBench# 多模态大语言模型# 空间视觉推理能力
    6个月前
    01480
    Cursor Agent接入Linear:从问题跟踪到代码提交,无需切换工具即可完成开发闭环

    Cursor Agent接入Linear:从问题跟踪到代码提交,无需切换工具即可完成开发闭环

    Cursor正式推出与Linear的集成功能——现在,开发者可直接在Linear(项目管理工具)中触发Cursor后台代理,自动处理错误修复、功能构建、用户反馈响应等开发任务,无需在“问题跟踪”与“编...
    早报# Cursor Agent# Linear
    6个月前
    04470
    谷歌发布新款Gemini教育工具:覆盖教、学全场景,免费开放且强化数据安全

    谷歌发布新款Gemini教育工具:覆盖教、学全场景,免费开放且强化数据安全

    在今年的国际教育技术学会(ISTE)大会上,谷歌针对教育场景推出全新人工智能解决方案,围绕“教育者提效”与“学生赋能”两大核心,升级Gemini系列工具,同时强化数据安全与责任管控,适配不同规模教育机...
    早报# Gemini教育工具# 谷歌
    6个月前
    01820
    谷歌Pixel 10推出Pixel Journal:设备端AI助写日记,支持情绪记录与隐私锁定

    谷歌Pixel 10推出Pixel Journal:设备端AI助写日记,支持情绪记录与隐私锁定

    在Pixel 10系列发布会上,谷歌正式推出全新日记应用 Pixel Journal,距离苹果2023年随iOS 17推出Journal应用约两年。这款应用以“设备端AI辅助创作”为核心,支持添加多维...
    早报# Pixel 10# Pixel Journal# 谷歌
    6个月前
    03570
    谷歌AI模式全球扩展:新增餐厅预订代理功能,支持个性化搜索

    谷歌AI模式全球扩展:新增餐厅预订代理功能,支持个性化搜索

    谷歌宣布对其“AI模式”进行两项核心升级:一是将该功能扩展至180个新国家(暂支持英语),此前仅覆盖美国、英国、印度;二是新增代理预订、个性化搜索及协作分享功能,进一步提升搜索的实用性与定制化体验。其...
    早报# AI模式# 谷歌
    6个月前
    02460
    智谱AI发布AutoGLM 2.0:全球首个手机Agent免费开放,云端运行不占本地资源

    智谱AI发布AutoGLM 2.0:全球首个手机Agent免费开放,云端运行不占本地资源

    智谱AI正式推出 AutoGLM 2.0,定位“全球首个手机Agent”,面向所有用户免费开放。新版本以“Agent + 云手机 + 云电脑”为技术底座,让AI在云端独立运行,完全不占用本地设备资源...
    早报# AutoGLM 2.0# 智谱AI
    6个月前
    01790
    百度蒸汽机2.0 上线:首次实现多人有声视频一体化生成

    百度蒸汽机2.0 上线:首次实现多人有声视频一体化生成

    百度正式发布 MuseSteamer 2.0 —— 其音视频一体化生成模型的重大升级版本,在行业内首次实现多人有声视频的端到端联合生成。 这意味着,用户只需输入一段文字描述,系统即可自动生成包含多个角...
    早报# MuseSteamer 2.0# 百度# 蒸汽机2.0
    6个月前
    03960
    阿里云联合五所高校推出AI通识公益课,9月1日面向全国高校开放

    阿里云联合五所高校推出AI通识公益课,9月1日面向全国高校开放

    阿里云宣布,由阿里云、超星尔雅协同北京大学、南京大学、复旦大学、上海交通大学、浙江大学五所高校名师共同打造的AI通识公益系列课程「动手学AI:人工智能通识与实践」,将于9月1日正式向全国所有高校、所有...
    早报# AI通识公益课# 阿里云
    6个月前
    02340
    Gemini Live升级:视觉指导+多应用联动,打造更自然的AI助手体验

    Gemini Live升级:视觉指导+多应用联动,打造更自然的AI助手体验

    谷歌持续推进“通用AI助手”愿景,对Gemini Live进行三大核心升级:新增摄像头实时视觉指导、深度整合更多Google应用、优化音频交互体验,让助手不仅能“听”和“说”,还能“看见并联动”,进一...
    早报# Gemini Live# 谷歌
    6个月前
    01870
    Google Photos上线对话式编辑:用文字描述改图,C2PA凭证溯源AI编辑痕迹

    Google Photos上线对话式编辑:用文字描述改图,C2PA凭证溯源AI编辑痕迹

    谷歌为Google Photos带来全新编辑体验——对话式AI编辑功能,用户只需用文字或语音描述想要的效果,即可快速完成图像调整;同时,平台新增C2PA内容凭证支持,让AI编辑的图像来源与修改痕迹更透...
    早报# Google Photos# 对话式编辑
    6个月前
    03960
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    OpenClaw

    OpenClaw

    OpenClaw 是一个个人 AI 助手,可在您自己的设备上运行。它通过您已经使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及 BlueBubbles、Matrix、Zalo 和 Zalo Personal 等扩展渠道与您交流。它可以在 macOS/iOS/Android 上说话和聆听,并能渲染一个您控制的实时画布。网关只是控制平面——产品本身才是助手。
    查看完整榜单