新DeepSeek低调发布DeepSeek-V3-0324,性能超过Claude Sonnet 3.5,可在消费级硬件部署
DeepSeek在昨晚悄悄地发布了一款新的大语言模型——DeepSeek-V3-0324。这款模型不仅因其出色的能力在AI行业掀起波澜,更因其独特的部署方式引发了广泛关注。该模型已经在Hugging ...
新OpenAI宣布领导层调整:萨姆·奥尔特曼转向技术核心
在本周一,OpenAI宣布了一项重要的高管层调整,旨在优化公司的运营结构并强化其技术方向。此次变动中,首席执行官萨姆·奥尔特曼的角色将更加专注于指导公司的研究和产品开发工作,而首席运营官布拉德·莱特卡...
新OpenAI升级ChatGPT高级语音模式对话体验:减少打断、支持暂停思考
在本周一,OpenAI宣布了针对其AI语音助手功能——高级语音模式(Advanced Voice Mode)的重要更新。这次更新主要集中在改善用户体验方面,特别是减少了用户在使用语音助手时被打断的情况...
新引发AI热潮的CNN模型AlexNet源代码发布
在2025年3月21日,谷歌与计算机历史博物馆(CHM)联合宣布,他们已经发布了2012年革命性卷积神经网络(CNN)模型AlexNet的源代码。这款由多伦多大学的研究人员开发的模型,通过其在图像识别...
新阿里通义实验室开源32B参数的多模态模型 Qwen2.5-VL-32B-Instruct
今年一月底,阿里通义实验室推出了 Qwen2.5-VL 系列模型,凭借其卓越的性能和广泛的应用潜力,迅速获得了社区的广泛关注和积极反馈。在此基础上,团队通过强化学习持续优化模型,并于近期开源了备受期待...
新阿里巴巴推出全身虚拟形象解决方案TaoAvatar:在AR设备上实时运行一个会说话的全身虚拟人
阿里巴巴的研究人员推出一种名为 TaoAvatar 的技术,用于创建逼真的、全身的、会说话的虚拟形象(avatar),并能够在增强现实(AR)设备上实时运行。TaoAvatar 基于 3D 高斯点绘制...
新个性化图像生成和编辑方法SISO:适合在只有单张主题图像的情况下使用
巴伊兰大学和英伟达的研究人员推出一种无需训练的方法SISO,用于从单张主题图像进行个性化图像生成和编辑。SISO 是一种无需训练的方法,通过优化与输入主题图像的相似度分数来实现图像的个性化生成和编辑。...
新ComfyUI Pause Workflow Node:为复杂工作流添加灵活暂停功能
在使用 ComfyUI 进行生成任务时,尤其是处理复杂工作流时,能够随时暂停并检查生成结果是非常重要的。ComfyUI Pause Workflow Node 正是为了满足这一需求而设计的。它允许你在...
新Roboflow开源基于Transformer的实时目标检测模型 RF-DETR
Roboflow 近日正式发布了 RF-DETR,一种基于Transformer的实时目标检测模型。RF-DETR 在多个现实世界数据集上的表现超越了所有现有的目标检测模型,并且是首个在 COCO 数...
新谷歌推出 Gemini 实时 AI 视频功能,让智能助手的交互体验更加直观和便捷
谷歌的 Gemini 现在已经为部分 Google One AI Premium 订阅者带来了全新的实时 AI 视频功能,让智能助手的交互体验更加直观和便捷。 Gemini Live 的新功能 屏幕读...