百科 | 第67页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

Hugging Face 推出开源替代方案 Open Deep Research，挑战 OpenAI 的 Deep Research

在 OpenAI 发布其多步骤研究工具 Deep Research 后不到一天，Hugging Face 迅速推出了名为 Open Deep Research 的开源项目。这一举动不仅展示了 Hugg...

10个月前

03270

ChatGPT移动应用收入突破20亿美元，领跑AI助手赛道

根据应用市场分析机构 Appfigures 的最新数据，自2023年5月上线以来，ChatGPT 的 iOS 与 Android 移动应用全球消费者支出已达到 20亿美元。这一数字不仅标志着其在移动...

早报 # ChatGPT

4个月前

03260

DEER：让大模型推理更高效，动态提前退出的新方法

近年来，大型推理语言模型（LRLM）如 DeepSeek-R1 和 GPT-O1 的发展显著提升了复杂问题的解决能力。这些模型通过延长推理过程中“思维链”（Chain of Thought, CoT...

新技术 # DEER # 大模型推理

8个月前

03260

Runway 发布新一代视频生成模型 Gen-4，聚焦图像生成视频与世界一致性

AI 初创公司 Runway 于周一正式发布其新一代生成式 AI 模型 Gen-4，声称这是有史以来最高保真度的视频生成模型之一。Gen-4 已经向 Runway 的个人付费和企业客户推出，其强大的功...

早报 # Gen-4 # Runway # 视频生成模型

9个月前

03260

用于类别无关的姿态估计新型框架EdgeCape

特拉维夫大学的研究人员推出新型框架EdgeCape，它用于类别无关的姿态估计（Category-Agnostic Pose Estimation, CAPE）。EdgeCape能够通过单一模型在多样化...

新技术 # EdgeCape # 姿态估计

1年前

03260

专门为I2V模型量身定制的大规模数据集TIP-I2V：包含了超过170万独特的用户提供的文本和图像提示

AI驱动的视频生成领域正在迅速发展，图像到视频（I2V）模型因其视觉一致性和增强的可控性而处于前沿。然而，一个显著的差距一直存在：缺乏专门的数据集来理解图像到视频提示的独特需求。为了填补这一空白，悉尼...

新技术 # TIP-I2V # 图生视频模型

1年前

03260

Perplexity旗下 AI 浏览器 Comet 正式免费向所有人开放

AI 搜索公司 Perplexity 宣布，其自研浏览器 Comet 即日起对所有用户免费开放，不再需要订阅门槛和邀请码。此前，这款浏览器仅限于每月 200 美元的 Perplexity Max 用...

早报 # Comet # Perplexity

3个月前

03250

长上下文调优训练范式LCT：通过将预训练的单镜头视频扩散模型扩展到场景级视频生成，以生成具有视觉和动态一致性的多镜头视频内容

香港中文大学和字节跳动的研究人员提出了一种名为 Long Context Tuning（LCT，长上下文调优）的训练范式，通过将预训练的单镜头视频扩散模型扩展到场景级视频生成，以生成具有视觉和动态一致...

新技术 # LCT # 训练范式 # 长上下文调优

9个月前

03250

谷歌回应 AI 搜索争议：总点击量稳定，但“一些网站”已受影响

“AI 搜索正在杀死出版商”——这是过去一年中频繁出现的论断。多项第三方研究指出，随着谷歌在搜索结果页引入“AI 概述（AI Overviews）”和对话式功能，用户点击外部网站的次数显著减少。对此...

早报 # Google # 谷歌

5个月前

03240

谷歌Bug大放送：免费领取一年Gemini Advanced和2TB云端存储

近日，谷歌的一项活动出现了意外漏洞，原本仅限美国学生的 Gemini Advanced 会员计划现在对任何人开放。通过切换到美国IP地址，用户可以免费领取一年的 Gemini Advanced 高级...

早报 # Gemini Advanced # 谷歌

8个月前

03240

视频分词器VidTok：用于将视频内容编码成紧凑的潜在标记

微软研究院、上海交通大学和北京大学的研究人员推出视频分词器VidTok，它是一个多功能且开源的工具，用于将视频内容编码成紧凑的潜在标记（latent tokens）。VidTok在连续和离散标记化方面...

新技术 # VidTok # 视频分词器

1年前

03240

基于扩散模型的面部匿名化技术：匿名化后的面部与原始照片无缝融合，使其非常适合各种现实世界应用

特伦托大学、奥卢大学和新加坡国立大学的研究人员推出一种基于扩散模型的面部匿名化技术，旨在简化面部匿名化流程，同时保留原始图像中的面部表情、头部姿势、眼神方向和背景元素等关键细节。这种方法有效地掩盖了身...

新技术 # 面部匿名化技术

1年前

03240

加载更多

百科

Hugging Face 推出开源替代方案 Open Deep Research，挑战 OpenAI 的 Deep Research

ChatGPT移动应用收入突破20亿美元，领跑AI助手赛道

DEER：让大模型推理更高效，动态提前退出的新方法

Runway 发布新一代视频生成模型 Gen-4，聚焦图像生成视频与世界一致性

用于类别无关的姿态估计新型框架EdgeCape

专门为I2V模型量身定制的大规模数据集TIP-I2V：包含了超过170万独特的用户提供的文本和图像提示

Perplexity旗下 AI 浏览器 Comet 正式免费向所有人开放

长上下文调优训练范式LCT：通过将预训练的单镜头视频扩散模型扩展到场景级视频生成，以生成具有视觉和动态一致性的多镜头视频内容

谷歌回应 AI 搜索争议：总点击量稳定，但“一些网站”已受影响

谷歌Bug大放送：免费领取一年Gemini Advanced和2TB云端存储

视频分词器VidTok：用于将视频内容编码成紧凑的潜在标记

基于扩散模型的面部匿名化技术：匿名化后的面部与原始照片无缝融合，使其非常适合各种现实世界应用

人生 K 线

Fogsight (雾象)

朱雀大模型检测

新PDF Craft

Tripo

ITELLOU

百科

网址

人生 K 线

Fogsight (雾象)

朱雀大模型检测

新PDF Craft

Tripo

ITELLOU