非自回归扩散框架的动态帧化身DAWN:根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频中国科学技术大学和科大讯飞研究院的研究人员推出新框架DAWN,它能够根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频。这项技术的核心在于使用非自回归(NAR)扩散模型来一次性生成动态长度的...新技术# DAWN# 头部动画1年前04430
Jina AI推出新型文本嵌入模型 jina-embeddings-v3:专为多语言数据和长文本检索任务优化Jina AI推出文本嵌入模型 jina-embeddings-v3,这是一个具有 5.7 亿参数的新型文本嵌入模型,它在多语言数据和长上下文检索任务上实现了最先进的性能,支持的最大上下文长度达到 8...新技术# jina-embeddings-v3# 文本嵌入模型1年前04410
LM Arena 被指控操纵 AI 基准测试,缺乏公正性和透明性一项由 Cohere、斯坦福大学、麻省理工学院和 Ai2 研究人员联合发布的新研究,指责热门 AI 基准测试平台 LM Arena(Chatbot Arena 的背后组织)帮助少数顶级 AI 实验室通...早报# LM Arena8个月前04380
新型图像到视频生成技术OSV:可以将单张图像仅仅一步内生成高质量视频复旦大学、香港科技大学、香港中文大学和腾讯优图实验室的研究人员推出新型图像到视频生成技术OSV,可以将单张图像转换成视频。这项技术的目标是能够快速生成高质量的视频内容,而不需要复杂的多步骤处理。例如...新技术# OSV1年前04380
图像编辑框架InstantDrag:通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速首尔国立大学和浦项科技大学的研究人员推出图像编辑框架InstantDrag,它能够让用户通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速。例如,你有一张图片,你想要移动图片中的某个部...新技术# InstantDrag# 图像编辑1年前04380
ElevenLabs发布全球首个AI“狗语”TTS模型Text To Bark,开启跨物种沟通新时代?ElevenLabs于4月1日一本正经的宣布推出全球首个为狗开发的AI文本转语音模型:Text To Bark,号称标志着人类与宠物之间的沟通进入了一个全新的时代。 用户只需输入一条消息,选择狗狗的品...早报# ElevenLabs# Text To Bark# 狗语9个月前04370
图像匹配框架MINIMA:解决跨视图和跨模态的情况下,多模态感知中的图像匹配问题华中科技大学和武汉大学的研究人员推出一个统一的图像匹配框架MINIMA,即模态不变图像匹配。这项研究旨在解决多模态感知中的图像匹配问题,特别是在跨视图和跨模态的情况下。例如,在自动驾驶中,需要将可见光...新技术# MINIMA# 图像匹配框架11个月前04370
警惕!谷歌 Gemini CLI 存在高危漏洞,可能被用于静默窃取敏感信息一款旨在提升开发效率的 AI 编码工具,也可能成为攻击者入侵系统的跳板。 谷歌于 2025 年 6 月推出的 Gemini CLI——一款集成其最先进 Gemini 2.5 Pro 模型的命令行代码助...早报# Gemini CLI# 谷歌5个月前04360
用ChatGPT生成个性化微信表情包,简单几步教你玩转创意表达GPT4o的原生图像生成功能,让ChatGPT再次成为网络热点,它允许用户通过简单的文本提示创建高质量图像。从吉卜力风格的壁纸到复杂的图像编辑,这一功能为创意表达带来了无限可能。 目前,ChatGPT...教程# ChatGPT# 微信表情包8个月前04360
Meta推出个性化图像生成模型Imagine yourself:根据参考照片,生成遵循特定文字描述的新图像,而且不需要对每个新用户进行单独调整Meta旗下GenAI团队推出个性化图像生成模型Imagine yourself,与传统的基于调整的个性化技术不同,Imagine yourself作为一个无需调整的模型运行,使得所有用户都能利用共享...新技术# Imagine yourself# Meta1年前04350
OpenAI新推理模型o3和o4-mini:性能提升,幻觉问题却更严重OpenAI最近推出的o3和o4-mini AI模型在性能上展现了许多突破性进展,尤其是在编码和数学任务中表现优异。然而,这些新模型的“幻觉”问题——即编造不存在的事实或内容——却比以往的模型更加严重...早报# o3# o4-mini# OpenAI8个月前04340
谷歌用AI重构航班搜索,推“航班优惠”功能直面反垄断与竞争压力谷歌周四宣布推出一项由人工智能驱动的新功能——航班优惠(Flight Deals),旨在帮助用户通过自然语言查询,发现更便宜、更灵活的旅行选择。这一更新将AI深度整合进其核心的旅行搜索服务,但同时也让...早报# 航班优惠# 航班搜索# 谷歌4个月前04330