小马良

帅气的我简直无法用语言描述!
科幻作家与动漫展向 AI 说“不”:创意社区的边界正在收紧

科幻作家与动漫展向 AI 说“不”:创意社区的边界正在收紧

过去几个月,生成式 AI 在创意领域的扩张遭遇了来自核心文化圈层的明确抵制。美国科幻与奇幻作家协会(SFWA)和圣地亚哥国际动漫展(San Diego Comic-Con)相继调整规则,全面禁止 AI...
4天前
0130
ChatGPT 被发现引用 AI 生成内容:Grokipedia 成为 GPT-5.2 的“冷门知识”来源

ChatGPT 被发现引用 AI 生成内容:Grokipedia 成为 GPT-5.2 的“冷门知识”来源

据《卫报》报道,OpenAI 最新模型 GPT-5.2 在回答某些冷门或边缘性问题时,被发现直接复述 Grokipedia(由埃隆·马斯克旗下 xAI 推出的全 AI 生成在线百科)的内容。这一现象引...
5天前
0100
Odyssey 推出交互式世界模型Odyssey-2 Pro,支持实时模拟与多端集成

Odyssey 推出交互式世界模型Odyssey-2 Pro,支持实时模拟与多端集成

今天,Odyssey 正式推出 Odyssey-2 Pro——目前最强大的通用世界模型——以及配套的 开发者 API。Odyssey表示,这标志着世界模型领域迎来了自己的 “GPT-2 时刻”:一个可...
6天前
0490
谷歌、OpenAI 和 Anthropic 正用《宝可梦》测试 AI 的真实能力

谷歌、OpenAI 和 Anthropic 正用《宝可梦》测试 AI 的真实能力

在众多衡量 AI 性能的基准测试中,一个看似“非正式”的实验正在引发关注:让大模型玩《宝可梦·蓝》——这款 1996 年发布的经典 RPG 游戏,正成为评估 AI 推理、规划与长期决策能力的新试验场...
6天前
0100
Ollama 新增 launch 命令:一键启动编程智能体,无需配置

Ollama 新增 launch 命令:一键启动编程智能体,无需配置

Ollama 最新发布的 v0.15+ 版本 引入了一个全新命令:ollama launch。该命令旨在简化主流 AI 编程工具(如 Claude Code、OpenCode、Codex 等)的启动流...
6天前
0150
Gemini 推出免费 SAT 模拟测试:AI 生成试卷、自动评分并提供解析

Gemini 推出免费 SAT 模拟测试:AI 生成试卷、自动评分并提供解析

谷歌近日为 Gemini AI 平台上线了一项新功能:免费的 SAT 模拟考试服务。用户只需输入“我想参加一次 SAT 模拟考试”,即可触发一个完整的交互式考试界面——包含可点击的选项、自动评分、题目...
6天前
0170
VibeComfy:让 Claude Code 理解并编辑 ComfyUI 工作流的 CLI 工具集

VibeComfy:让 Claude Code 理解并编辑 ComfyUI 工作流的 CLI 工具集

VibeComfy 是一套专为 Claude Code(或其他 LLM 智能体)设计的命令行工具,用于解析、分析、修改 ComfyUI 工作流 JSON 文件。它的目标很明确:降低 AI 智能体与 C...
1周前
0180
微软开源 VibeVoice-ASR:支持60分钟长音频的端到端语音转写模型

微软开源 VibeVoice-ASR:支持60分钟长音频的端到端语音转写模型

微软正式开源 VibeVoice-ASR——一款面向真实场景的统一语音识别模型。它能单次处理长达60分钟的连续音频,并输出包含说话人身份、精确时间戳与文本内容的结构化转录结果,同时支持用户注入自定义热...
1周前
090
谷歌 AI 模式新增“个人智能”:可调用 Gmail 与相册数据提供定制回复

谷歌 AI 模式新增“个人智能”:可调用 Gmail 与相册数据提供定制回复

谷歌正在为其 AI 搜索功能 AI 模式(AI Overviews)引入一项名为 “个人智能”(Personal Intelligence)的新能力。该功能允许 AI 在用户授权的前提下,安全地访问其...
1周前
0110
Qwen3-TTS 全家桶开源:支持音色克隆、创造与多语言拟人语音

Qwen3-TTS 全家桶开源:支持音色克隆、创造与多语言拟人语音

在语音生成技术快速迭代的当下,开发者与用户对高保真、可定制、低延迟的语音合成方案需求日益迫切。阿里Qwen项目组推出的 Qwen3-TTS 开源全家桶,凭借音色克隆、音色创造、拟人化语音生成与自然语言...
1周前
0730