百科 | 第47页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

港大、浙大联合快手提出Context-as-Memory：解决交互式长视频生成的场景一致性难题

香港大学、浙江大学与快手可灵团队的研究人员，针对当前交互式长视频生成中“场景易断裂、历史上下文难复用”的痛点，提出 Context-as-Memory（上下文即记忆）方法。该方法通过将历史帧直接作为...

新技术 # Context-as-Memory # 场景一致性

6个月前

02950

DuPO框架：通过双学习和偏好优化的方法，使大语言模型能够在没有标注数据的情况下进行自我验证和优化

字节跳动Seed团队和南京大学的研究人员推出DuPO框架，它通过双学习（dual learning）和偏好优化（preference optimization）的方法，使大语言模型（LLMs）能够在没...

新技术 # DuPO框架 # 大语言模型

6个月前

01770

北卡教堂山分校新研究：GPT-5、Gemini-2.5-Pro等顶级多模态大语言模型，竟难区分图像90°与270°旋转

北卡罗来纳大学教堂山分校的研究团队，针对多模态大语言模型（MLLMs）的空间视觉推理能力展开专项测试——聚焦“图像旋转角度识别”任务（判断图像是否旋转0°、90°、180°、270°）。 GitHub...

新技术 # RotBench # 多模态大语言模型 # 空间视觉推理能力

6个月前

01480

Cursor Agent接入Linear：从问题跟踪到代码提交，无需切换工具即可完成开发闭环

Cursor正式推出与Linear的集成功能——现在，开发者可直接在Linear（项目管理工具）中触发Cursor后台代理，自动处理错误修复、功能构建、用户反馈响应等开发任务，无需在“问题跟踪”与“编...

早报 # Cursor Agent # Linear

6个月前

04470

谷歌发布新款Gemini教育工具：覆盖教、学全场景，免费开放且强化数据安全

在今年的国际教育技术学会（ISTE）大会上，谷歌针对教育场景推出全新人工智能解决方案，围绕“教育者提效”与“学生赋能”两大核心，升级Gemini系列工具，同时强化数据安全与责任管控，适配不同规模教育机...

早报 # Gemini教育工具 # 谷歌

6个月前

01820

谷歌Pixel 10推出Pixel Journal：设备端AI助写日记，支持情绪记录与隐私锁定

在Pixel 10系列发布会上，谷歌正式推出全新日记应用 Pixel Journal，距离苹果2023年随iOS 17推出Journal应用约两年。这款应用以“设备端AI辅助创作”为核心，支持添加多维...

早报 # Pixel 10 # Pixel Journal # 谷歌

6个月前

03570

谷歌AI模式全球扩展：新增餐厅预订代理功能，支持个性化搜索

谷歌宣布对其“AI模式”进行两项核心升级：一是将该功能扩展至180个新国家（暂支持英语），此前仅覆盖美国、英国、印度；二是新增代理预订、个性化搜索及协作分享功能，进一步提升搜索的实用性与定制化体验。其...

早报 # AI模式 # 谷歌

6个月前

02460

智谱AI发布AutoGLM 2.0：全球首个手机Agent免费开放，云端运行不占本地资源

智谱AI正式推出 AutoGLM 2.0，定位“全球首个手机Agent”，面向所有用户免费开放。新版本以“Agent + 云手机 + 云电脑”为技术底座，让AI在云端独立运行，完全不占用本地设备资源...

早报 # AutoGLM 2.0 # 智谱AI

6个月前

01790

百度蒸汽机2.0 上线：首次实现多人有声视频一体化生成

百度正式发布 MuseSteamer 2.0 —— 其音视频一体化生成模型的重大升级版本，在行业内首次实现多人有声视频的端到端联合生成。这意味着，用户只需输入一段文字描述，系统即可自动生成包含多个角...

早报 # MuseSteamer 2.0 # 百度 # 蒸汽机2.0

6个月前

03960

阿里云联合五所高校推出AI通识公益课，9月1日面向全国高校开放

阿里云宣布，由阿里云、超星尔雅协同北京大学、南京大学、复旦大学、上海交通大学、浙江大学五所高校名师共同打造的AI通识公益系列课程「动手学AI：人工智能通识与实践」，将于9月1日正式向全国所有高校、所有...

早报 # AI通识公益课 # 阿里云

6个月前

02340

Gemini Live升级：视觉指导+多应用联动，打造更自然的AI助手体验

谷歌持续推进“通用AI助手”愿景，对Gemini Live进行三大核心升级：新增摄像头实时视觉指导、深度整合更多Google应用、优化音频交互体验，让助手不仅能“听”和“说”，还能“看见并联动”，进一...

早报 # Gemini Live # 谷歌

6个月前

01870

Google Photos上线对话式编辑：用文字描述改图，C2PA凭证溯源AI编辑痕迹

谷歌为Google Photos带来全新编辑体验——对话式AI编辑功能，用户只需用文字或语音描述想要的效果，即可快速完成图像调整；同时，平台新增C2PA内容凭证支持，让AI编辑的图像来源与修改痕迹更透...

早报 # Google Photos # 对话式编辑

6个月前

03960

加载更多

百科

港大、浙大联合快手提出Context-as-Memory：解决交互式长视频生成的场景一致性难题

DuPO框架：通过双学习和偏好优化的方法，使大语言模型能够在没有标注数据的情况下进行自我验证和优化

北卡教堂山分校新研究：GPT-5、Gemini-2.5-Pro等顶级多模态大语言模型，竟难区分图像90°与270°旋转

Cursor Agent接入Linear：从问题跟踪到代码提交，无需切换工具即可完成开发闭环

谷歌发布新款Gemini教育工具：覆盖教、学全场景，免费开放且强化数据安全

谷歌Pixel 10推出Pixel Journal：设备端AI助写日记，支持情绪记录与隐私锁定

谷歌AI模式全球扩展：新增餐厅预订代理功能，支持个性化搜索

智谱AI发布AutoGLM 2.0：全球首个手机Agent免费开放，云端运行不占本地资源

百度蒸汽机2.0 上线：首次实现多人有声视频一体化生成

阿里云联合五所高校推出AI通识公益课，9月1日面向全国高校开放

Gemini Live升级：视觉指导+多应用联动，打造更自然的AI助手体验

Google Photos上线对话式编辑：用文字描述改图，C2PA凭证溯源AI编辑痕迹

YouMind

OpenClaw（Clawdbot/Moltbot）

CutCut

Fogsight (雾象)

Skills.sh

OpenClaw

百科

网址

YouMind

OpenClaw（Clawdbot/Moltbot）

CutCut

Fogsight (雾象)

Skills.sh

OpenClaw