百科 | 第49页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

新型个性化图像生成方法Infinite-ID：保持特定身份特征的同时，根据用户的文本描述生成高质量的图像

来自中国科学技术大学和悉尼大学的研究人员推出新型个性化图像生成方法Infinite-ID，它能够在保持特定身份特征的同时，根据用户的文本描述生成高质量的图像。这是一个全新的ID-语义解耦范式，专门用于...

新技术 # Infinite-ID # 个性化图像生成

2年前

05160

Character.AI 全新升级：角色会演戏、能直播，创作者迎来多模态时代

Character.AI 近日发布了一系列重磅新功能，标志着平台从最初的 1:1 文本聊天，正式迈向一个更丰富、更沉浸式的多模态创作时代。此次更新源于用户对更深层次互动与创作自由的期待，旨在为创作者提...

早报 # Character.AI

8个月前

05150

AI开盒？OpenAI最新模型可以通过照片进行“反向位置搜索”

一种令人担忧的新趋势正在社交媒体上迅速传播：人们利用最新版本的ChatGPT（尤其是o3和o4-mini模型）通过照片进行“反向位置搜索”，从而识别照片中显示的具体地点。这种能力不仅引发了对隐私安全的...

早报 # AI开盒 # o3 # o4-mini

12个月前

05150

日本东映动画全面拥抱AI，未来将贯穿动画制作全流程

在宣布投资日本顶尖AI技术公司Preferred Networks（PFN）后，东映动画的AI战略逐渐浮出水面。这一合作不仅标志着东映动画在动画制作领域加速引入人工智能，也展现了其对未来动画行业的深远...

早报 # AI # 东映动画

11个月前

05140

Anthropic 推出 Claude Max 订阅计划，价格在 100 至 200 美元/月之间

Anthropic 于周三推出了一款名为“Claude Max”的全新订阅层，价格在 100 至 200 美元/月之间，为 Claude AI 助手提供更高的使用限制。这一新计划的推出正值许多现有 C...

早报 # Anthropic # Claude # Claude Max

1年前

05140

什么是推理模型？推理模型的优缺点，为什么科技公司都在推出推理模型？

随着 AI 技术的快速发展，各大科技公司纷纷推出具备“推理”能力的新一代模型。此前 DeepSeek 的 R1 模型也以推理能力作为其「先进模型」的标杆。那么，推理模型到底有何优势？为什么包括 Ope...

科普 # Anthropic # Claude 3.7 Sonnet # DeepSeek-R1

1年前

05140

基于扩散模型的2D虚拟试穿框架OutfitAnyone：通过上传自己的照片和想要试穿的衣服图片，就能在线看到衣服穿在自己身上的样子

阿里巴巴和中国科学技术大学的研究人员推出新的虚拟试穿技术OutfitAnyone，它是一个基于扩散模型的2D虚拟试穿框架。Outfit Anyone 通过利用双流条件扩散模型解决了这些局限性，使其能够...

新技术 # OutfitAnyone # 虚拟试穿

2年前

05140

百度宣布文心大模型 4.5 系列将于6月30日起正式开源，并推出多项 AI 开放政策

今日，百度宣布将在未来几个月内陆续推出文心大模型 4.5 系列，并将于 6 月 30 日起正式开源。这一举措标志着百度在 AI 领域的进一步开放和创新。文心大模型 4.5 系列与开源计划模型选择...

早报 # 文心大模型 4.5 # 百度

1年前

05120

谷歌nano-banana模型落地在即：Flow将添文本转图像功能，同步优化创作者工作流

随着谷歌nano-banana模型的发布预期逐渐升温，其生态落地布局也在稳步推进——这款模型不仅计划集成到Gemini、Whisk等现有工具中，最新迹象显示，它还将登陆创意平台Flow，为其带来全新的...

早报 # nano-banana # 谷歌

8个月前

05110

xAI 发布 Grok 4.1：免费向所有用户开放，推理/创意/共情能力全面升级

xAI 正式发布新一代大模型 Grok 4.1，现已在 grok.com、X 平台及 iOS/Android 移动应用全面上线，向所有用户免费开放（含免费账户），支持手动选择或自动模式默认部署。该模型...

早报 # Grok 4.1 # xAI

5个月前

05100

视觉模型PLLaVA：能够理解视频中的内容，包括动作、场景、人物穿着等，并能够生成详细描述这些内容的字幕

来自新加坡国立大学、纽约大学和字节跳动的研究人员推出用于视频密集字幕生成的先进模型PLLaVA（Pooling LLaVA），此模型的主要功能是能够理解视频中的内容，包括动作、场景、人物穿着等，并能够...

新技术 # PLLaVA # 视觉模型

2年前

05090

新型框架GVGEN：根据文本描述直接生成三维模型

来自上海AI研究所、清华大学、上海交通大学、浙江大学和VAST的研究团队推出新型框架GVGEN，它能够根据文本描述直接生成三维模型。与现有的3D生成方法相比，GVGEN在定性和定量评估中均表现出卓越的...

新技术 # GVGEN # 三维模型

2年前

05090

加载更多

百科

新型个性化图像生成方法Infinite-ID：保持特定身份特征的同时，根据用户的文本描述生成高质量的图像

Character.AI 全新升级：角色会演戏、能直播，创作者迎来多模态时代

AI开盒？OpenAI最新模型可以通过照片进行“反向位置搜索”

日本东映动画全面拥抱AI，未来将贯穿动画制作全流程

Anthropic 推出 Claude Max 订阅计划，价格在 100 至 200 美元/月之间

什么是推理模型？推理模型的优缺点，为什么科技公司都在推出推理模型？

基于扩散模型的2D虚拟试穿框架OutfitAnyone：通过上传自己的照片和想要试穿的衣服图片，就能在线看到衣服穿在自己身上的样子

百度宣布文心大模型 4.5 系列将于6月30日起正式开源，并推出多项 AI 开放政策

谷歌nano-banana模型落地在即：Flow将添文本转图像功能，同步优化创作者工作流

xAI 发布 Grok 4.1：免费向所有用户开放，推理/创意/共情能力全面升级

视觉模型PLLaVA：能够理解视频中的内容，包括动作、场景、人物穿着等，并能够生成详细描述这些内容的字幕

新型框架GVGEN：根据文本描述直接生成三维模型

S.H.I.T

ljg-skills

Tripo

pure-genealogy

诗一

Qwen Chat

百科

网址

S.H.I.T

ljg-skills

Tripo

pure-genealogy

诗一

Qwen Chat