博客 | 第28页 | SD百科导航

Anthropic 计划在印度设办公室，寻求与信实工业合作

Anthropic 正式启动其在印度的本地化布局。据 TechCrunch 报道，公司联合创始人兼 CEO Dario Amodei 本周访问印度，计划于班加罗尔设立首个南亚办公室，并探索与印度最大企...

早报 # Anthropic # Claude # 信实工业

2个月前

0580

StreamDiffusionV2：支持多显卡的实时视频生成系统

由加州大学伯克利分校、麻省理工学院、斯坦福大学、德克萨斯大学奥斯汀分校与 First Intelligence 联合研发的 StreamDiffusionV2 正式开源。这是一个面向交互式直播场景的实...

视频模型 # StreamDiffusionV2

2个月前

01330

谷歌将 AI Plus 套餐与搜索 AI 模式扩展至数十个新国家

继上月在印度尼西亚推出平价 AI 订阅服务后，谷歌正式宣布将 AI Plus 套餐推广至 36 个新增国家和地区。此次扩展后，该服务已在全球 77 个国家上线。与此同时，谷歌还宣布其基于 Ge...

早报 # Google AI Plus

2个月前

0590

使用 Nano Banana 的 4 个技巧：精准编辑、一致生成与应用构建

自 2025 年 8 月底发布以来，Google DeepMind 推出的新型图像生成与编辑模型 Nano Banana 已在 Gemini 应用中支持超过 50 亿次图像创作。它并非简单的文生图工具...

提示词 # nano-banana # 谷歌

2个月前

01290

对话 Google 技术专家：什么是“氛围编程”？

AI 正在改变我们构建数字产品的方式。如今，即使没有编程背景，你也可以通过自然语言描述一个想法，快速生成网页原型或小型应用。这种新兴实践被称为 “氛围编程”（Vibe Coding）。为了更深入理解...

科普 # Vibe Coding # 氛围编程

2个月前

0650

谷歌将 AI 编程工具 Opal 扩展至 15 个新国家

谷歌正式将其 AI 驱动的无代码应用构建工具 Opal 推向全球更多地区。继今年 7 月在美国首发后，这款由 Google Labs 开发的实验性工具现已在加拿大、印度、日本、韩国、越南、印度尼西亚...

早报 # Opal # 谷歌

2个月前

0920

谷歌推出新型 AI 模型Gemini 2.5 Computer Use，可操作浏览器完成网页任务

谷歌发布一款名为 Gemini 2.5 Computer Use 的新型 AI 模型，能够通过浏览器窗口执行点击、滚动、输入文本等交互操作，帮助用户在那些没有开放 API 的网站上自动完成任务。这项...

多模态模型 # Gemini 2.5 Computer Use # 谷歌

2个月前

01130

Apriel-1.5-15B-Thinker：用中期训练提升多模态推理效率

在大模型竞赛普遍追求参数规模和算力投入的背景下，一个名为 Apriel-1.5-15B-Thinker 的新开源模型带来了不同的思路：它不依赖强化学习或偏好优化，也不从零训练，而是通过精心设计的中期训...

大语言模型 # Apriel-1.5-15B-Thinker

2个月前

0920

微软测试 Edge 与 Copilot 深度集成：AI 将能使用你的浏览器个人资料

微软正在为 Windows 11 上的 Microsoft Edge 测试一项重要的新功能：让 Copilot（现称 Copilot in Windows）更深入地接入用户的浏览器环境。最新发现显...

早报 # Copilot # Edge # 微软

2个月前

0590

ComfyUI-FSampler ：通过 Epsilon 外推实现高效采样加速

开发者obisin打造的 FSampler 的新插件已上线，为 ComfyUI 用户提供了一种无需训练、不依赖特定模型的扩散模型采样加速方案。它通过预测每一步的噪声（epsilon），减少对主模型的调...

插件 # ComfyUI-FSampler # 采样加速

2个月前

01400

Self-Forcing++：一种无需长视频训练即可生成高质量长视频的新方法

近年来，扩散模型在图像和短片视频生成方面取得了突破性进展。然而，当扩展到长视频生成（如数十秒甚至数分钟）时，现有方法普遍面临一个核心问题：质量随长度增加而显著下降。这主要源于两个限制：计算成本高...

新技术 # Self Forcing # 字节跳动

2个月前

01500

小红书开源 FireRedChat：一个完整、可控的全双工语音交互系统

在智能助手和客户服务场景中，用户希望与AI的对话像人与人交流一样自然——可以随时插话、打断、继续，而系统能即时响应。要实现这种体验，需要真正的全双工语音交互能力。然而，现有方案存在明显短板：端到端...

语音模型 # FireRedChat # 小红书

2个月前

01920

加载更多

Anthropic 计划在印度设办公室，寻求与信实工业合作

StreamDiffusionV2：支持多显卡的实时视频生成系统

谷歌将 AI Plus 套餐与搜索 AI 模式扩展至数十个新国家

使用 Nano Banana 的 4 个技巧：精准编辑、一致生成与应用构建

对话 Google 技术专家：什么是“氛围编程”？

谷歌将 AI 编程工具 Opal 扩展至 15 个新国家

谷歌推出新型 AI 模型Gemini 2.5 Computer Use，可操作浏览器完成网页任务

Apriel-1.5-15B-Thinker：用中期训练提升多模态推理效率

微软测试 Edge 与 Copilot 深度集成：AI 将能使用你的浏览器个人资料

ComfyUI-FSampler ：通过 Epsilon 外推实现高效采样加速

Self-Forcing++：一种无需长视频训练即可生成高质量长视频的新方法

小红书开源 FireRedChat：一个完整、可控的全双工语音交互系统

人生 K 线

Fogsight (雾象)

朱雀大模型检测

新PDF Craft

ITELLOU

Google AI Studio

网址

人生 K 线

Fogsight (雾象)

朱雀大模型检测

新PDF Craft

ITELLOU

Google AI Studio