Anthropic 推出百万 tokens 上下文:Claude Sonnet 4 支持 75 万字输入Anthropic 正在将其 AI 模型的上下文窗口推向新高度。近日,公司宣布其主力模型 Claude Sonnet 4 现已支持 100 万个 tokens 的上下文长度,相当于可一次性处理 75 ...早报# Anthropic# Claude Sonnet 46个月前04170
v0.app 正式上线:从创意到全栈应用,一个提示即可部署一个想法,如何最快变成一个真实可用的应用? 过去,这需要产品经理写文档、设计师画原型、工程师写前后端代码。而现在,只需一个自然语言提示,v0.app 就能自动生成完整的全栈应用程序——包括用户界面、内...早报# v0.app6个月前05400
OPPO 发布 OAgents:一个模块化、可复现的基础智能体框架随着“智能体(Agentic AI)”成为 AI 发展的重要方向,各类框架层出不穷。然而,当前研究普遍存在评估标准不一、实现细节不透明、结果难以复现等问题,导致不同系统之间缺乏公平比较的基础。 为应对...新技术# OAgents# OPPO# 智能体框架6个月前01700
在 Windows 上使用 WSL 和 ROCm 运行 ComfyUI:AMD 显卡用户指南如果你使用的是 AMD Radeon™ 显卡,现在也可以在 Windows 上高效运行基于 PyTorch 的 AI 工作流,例如 ComfyUI。通过 Windows Subsystem for L...教程# AMD 显卡# ComfyUI# ROCm6个月前07470
字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准在信息过载的时代,获取“更多”并不等于“更有效”。真正制约效率的,往往不是找不到某个具体答案,而是面对海量目标时的系统性整理能力——比如,为一个行业筛选出上百家公司数据,或从成千上万条招聘信息中精准匹...新技术# WideSearch# 字节跳动# 智能体评估基准6个月前04820
用AI把孩子的日常变成专属故事书:谷歌 Gemini全新功能Storybook 使用指南每个有孩子的家庭,或许都经历过这样的时刻: 晚上关灯前,翻开一本绘本,轻声讲述一个冒险故事; 孩子指着主角问:“这个小朋友,是不是有点像我?” 你笑着回答:“是啊,就像你一样勇敢。” 现在,这个“像我...教程# Gemini# Storybook# 谷歌6个月前03760
阿里发布 Wan2.2-I2V-Flash:更快、更稳、更可控的图生视频模型阿里通义大模型团队宣布,Wan2.2-I2V-Flash 正式上线。这款轻量级图生视频(Image-to-Video)模型,在保持高画质与强控制力的同时,实现了生成速度与性价比的显著跃升。 它不是对前...早报# Wan2.2-I2V-Flash7个月前06260
Agentic Web:通过AI智能体(AI Agents)来构建下一代互联网上海交通大学、香港科技大学(广州)、利物浦大学、加州大学伯克利分校、上海创新学院、加州大学戴维斯分校、弗吉尼亚理工大学和伦敦大学学院的研究人员发布Agentic Web(智能体网络),它探讨了如何通过...新技术# Agentic Web7个月前01400
NXN Labs推出新型虚拟试穿框架Voost:通过一个统一的扩散变换器同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能NXN Labs推出新型虚拟试穿框架Voost,通过一个统一的扩散变换器(Diffusion Transformer)同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能。 项目主页...新技术# Voost# 虚拟试穿7个月前03190
LaTCoder:将网页设计图像自动转换为代码华中科技大学和重庆大学的研究人员提出了一种名为 LaTCoder 的新方法,将网页设计图像自动转换为代码(即设计到代码,design-to-code)。这种方法通过引入“布局即思考”(Layout-a...新技术# LaTCoder7个月前02720
微软测试 Copilot Creator Gallery:一个 Sora 风格的 AI 内容发现与再创作平台据 TestingCatalog 最新发现,微软正在内部测试一项名为 Copilot Creator Gallery 的新功能。这是一项专为创作者设计的内容浏览与再创作平台,采用类似 OpenAI S...早报# Copilot Creator Gallery# 微软7个月前02150
萨姆·奥尔特曼回应 GPT-5 上线问题:路由器故障、GPT-4o 恢复可能与“图表罪行”在 GPT-5 发布后的第二天,OpenAI 首席执行官萨姆·奥尔特曼及其团队参加了 Reddit 的 AMA(“问我任何问题”)活动,直面用户对新模型的质疑与反馈。 从“为什么 GPT-5 显得更笨...早报# GPT-5# 萨姆·奥尔特曼7个月前02540