SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2628 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    微软生成式AI模型WHAMM,让你现在可以在浏览器中玩实时AI渲染的《雷神之锤2》

    微软生成式AI模型WHAMM,让你现在可以在浏览器中玩实时AI渲染的《雷神之锤2》

    微软昨天推出了一项令人瞩目的技术——WHAMM(World and Human Action MaskGIT Model),这是一个专门用于实时游戏的生成式AI模型。为了展示其强大功能,微软选择了28...
    早报# WHAMM# 微软# 雷神之锤2
    1年前
    05030
    Poe 推出新功能Poe Apps,用户可创建和共享自定义 AI 驱动的AI应用

    Poe 推出新功能Poe Apps,用户可创建和共享自定义 AI 驱动的AI应用

    Quora 旗下的 Poe 平台,作为汇集众多 AI 模型的中心枢纽,近日推出了一项新功能——Poe Apps。这项功能允许用户在任意模型组合的基础上构建可视化界面,从而创建自定义的应用程序。通过这一...
    早报# Poe# Poe Apps# Quora
    1年前
    05030
    微软亚洲研究院推出新框架VASA-1:基于一张静态图片和一个语音音频片段,实时生成逼真的会说话的面孔

    微软亚洲研究院推出新框架VASA-1:基于一张静态图片和一个语音音频片段,实时生成逼真的会说话的面孔

    微软亚洲研究院推出新框架VASA-1,它可以根据单张静态图像和语音音频片段,生成具有吸引力的视觉情感技能(VAS)的虚拟角色栩栩如生的说话面孔。这个技术的核心在于它能够精确地捕捉到人脸的微妙动态和头部...
    新技术# VASA-1
    2年前
    05030
    群核科技发布新一代空间大模型:SpatialLM 1.5 与 SpatialGen 正式亮相

    群核科技发布新一代空间大模型:SpatialLM 1.5 与 SpatialGen 正式亮相

    在首届技术开放日(TechDay)上,群核科技正式推出空间大模型体系的两大核心更新——新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,并明确了后续开源节奏。作为业界首个...
    早报# SpatialGen# SpatialLM 1.5# 群核科技
    8个月前
    05000
    为了AI的“福祉”?Anthropic 让 Claude 能主动结束有害对话

    为了AI的“福祉”?Anthropic 让 Claude 能主动结束有害对话

    Anthropic宣布,其最新一代大模型 Claude Opus 4 和 4.1 获得了一项新能力:在极端情况下,主动终止与用户的对话。 这并非因为用户“说错话”,而是当对话持续涉及严重滥用内容——如...
    早报# Anthropic# Claude
    8个月前
    05000
    谷歌自主编码智能体 Jules 正式开放公测:写代码也能“异步执行”

    谷歌自主编码智能体 Jules 正式开放公测:写代码也能“异步执行”

    谷歌正式宣布其自主编码智能体 Jules 进入公开测试阶段,向全球支持 Gemini 模型的地区全面开放。 与传统代码补全工具不同,Jules 不是辅助你写代码,而是代替你写代码。它是一个真正意义上的...
    早报# Jules# 编码智能体# 谷歌
    11个月前
    04990
    新型参考式人类图像补全框架CompleteMe:通过参考图像来补全被遮挡或缺失的人类图像区域,同时保留独特的细节信息

    新型参考式人类图像补全框架CompleteMe:通过参考图像来补全被遮挡或缺失的人类图像区域,同时保留独特的细节信息

    加州大学默塞德分校和Adobe Research的研究人员推出新型参考式人类图像补全框架CompleteMe,旨在通过参考图像来补全被遮挡或缺失的人类图像区域,同时保留独特的细节信息,如特定的服装图案...
    新技术# CompleteMe
    11个月前
    04990
    Google Vids更新:AI化身功能正式上线,同步推出免费消费者版本

    Google Vids更新:AI化身功能正式上线,同步推出免费消费者版本

    去年面向Google Workspace生产力套件推出的视频编辑器Google Vids,近日迎来重要更新:不仅新增AI化身、自动转录修剪、图像到视频等实用功能,还首次推出免费的消费者版本。此次调整既...
    早报# Google Vids# 视频编辑器# 谷歌
    8个月前
    04980
    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    在信息过载的时代,获取“更多”并不等于“更有效”。真正制约效率的,往往不是找不到某个具体答案,而是面对海量目标时的系统性整理能力——比如,为一个行业筛选出上百家公司数据,或从成千上万条招聘信息中精准匹...
    新技术# WideSearch# 字节跳动# 智能体评估基准
    8个月前
    04980
    帧感知视频扩散模型FVDM:时间步向量化方法,提高了视频生成任务的质量和灵活性

    帧感知视频扩散模型FVDM:时间步向量化方法,提高了视频生成任务的质量和灵活性

    香港城市大学、大湾区大学、国防科技大学、香港中文大学和岭南大学的研究人员推出了一种新的视频扩散模型,称为帧感知视频扩散模型(Frame-Aware Video Diffusion Model,简称FV...
    新技术# FVDM# 帧感知视频扩散模型
    2年前
    04980
    自适应投影引导APG:不牺牲图像质量的前提下,使用更高的指导尺度,从而生成更丰富、更真实的图像

    自适应投影引导APG:不牺牲图像质量的前提下,使用更高的指导尺度,从而生成更丰富、更真实的图像

    苏黎世联邦理工学院和迪士尼研究的研究人员推出自适应投影引导(APG),保留了CFG提高质量的优势,同时允许使用更高的引导比例而不产生过饱和。APG易于实现,并且实际上不会给采样过程带来额外的计算开销...
    新技术# APG# 自适应投影引导
    2年前
    04970
    E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型

    E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型

    Snap和东北大学的研究人员推出E2GAN,这是一种用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型。简单来说,E2GAN的目标是让计算机能够通过学习大量图像数据,快速生成或编辑出符合特...
    新技术# E2GAN# 生成对抗网络(GAN)模型
    2年前
    04970
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    ljg-skills

    ljg-skills

    李继刚(知名设计师、提示词工程师)将其沉淀已久的思维模型与创作工作流,封装为一套专为 Claude Code 设计的自定义技能集 —— ljg-skills。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    BuildCores

    BuildCores

    BuildCores 是一款集 3D 组装预览、智能兼容性检测、全球比价 于一体的在线装机工具。无论你是首次装机的新手,还是追求极致性能的发烧友,都能在手机或电脑上轻松规划、验证并优化你的 PC 配置。
    查看完整榜单