SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2628 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型

    E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型

    Snap和东北大学的研究人员推出E2GAN,这是一种用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型。简单来说,E2GAN的目标是让计算机能够通过学习大量图像数据,快速生成或编辑出符合特...
    新技术# E2GAN# 生成对抗网络(GAN)模型
    2年前
    04970
    EvolveDirector 框架:通过使用公开可用的资源来训练一个能够与高级文生图模型相媲美的模型

    EvolveDirector 框架:通过使用公开可用的资源来训练一个能够与高级文生图模型相媲美的模型

    近年来,生成模型在生成高质量图像方面取得了显著进展,但大多数模型依赖于专有的高质量数据集,并且有些模型保留了其参数,只提供可访问的应用程序编程接口(APIs)。这限制了这些模型在下游任务中的应用。为了...
    新技术# EvolveDirector# 文生图模型
    1年前
    04960
    3D网格模型生成框架AToM

    3D网格模型生成框架AToM

    来自Snap、沙特阿卜杜拉国王科技大学、多伦多大学的研究人员推出一款3D模型生成框架AToM(Amortized Text-to-Mesh),AToM的核心特点是能够同时优化多个文本提示(prompt...
    新技术# 3D网格模型# AToM
    2年前
    04960
    Manus 可能并非中国的第二个“DeepSeek 时刻”

    Manus 可能并非中国的第二个“DeepSeek 时刻”

    科技媒体 TechCrunch报道:上周,一个名为Manus的“代理式”AI平台以预览形式发布,引发了巨大的关注和炒作。Hugging Face的产品负责人称Manus为“我尝试过的最令人印象深刻的A...
    早报# DeepSeek# Manus
    1年前
    04950
    一位参与 GPT-4.5 研发的加拿大籍OpenAI 研究员绿卡申请被拒

    一位参与 GPT-4.5 研发的加拿大籍OpenAI 研究员绿卡申请被拒

    近日,一位参与 GPT-4.5 研发的 OpenAI 研究员 Kai Chen 的绿卡申请被拒,引发了科技界和移民政策领域的广泛关注。这一事件不仅揭示了当前美国移民政策对外籍高技能人才的限制,也再次引...
    早报# GPT-4.5# OpenAI# 绿卡
    12个月前
    04920
    用于视觉配音的先进框架PersonaTalk:实现高保真和个性化的视觉配音

    用于视觉配音的先进框架PersonaTalk:实现高保真和个性化的视觉配音

    在音频驱动的视觉配音中,合成准确的口型同步同时保持和突出说话者的“个性”是一个巨大的挑战。现有方法往往未能捕捉到说话者的独特说话风格或保留面部细节。为了解决这一问题,字节跳动提出了 PersonaTa...
    新技术# PersonaTalk# 视觉配音
    1年前
    04920
    新型框架FreeTraj:在视频扩散模型中实现无需调整参数的轨迹控制

    新型框架FreeTraj:在视频扩散模型中实现无需调整参数的轨迹控制

    南洋理工大学、 香港科技大学和腾讯人工智能实验室的研究人员推出新型框架FreeTraj,它用于在视频扩散模型中实现无需调整参数的轨迹控制。简而言之,FreeTraj允许用户在生成视频时精确控制视频中对...
    新技术# FreeTraj# 轨迹控制
    2年前
    04910
    谷歌正在测试Gem分享功能,Gemini用户或将很快能共享自定义Gem

    谷歌正在测试Gem分享功能,Gemini用户或将很快能共享自定义Gem

    谷歌正悄然推进其Gemini生态系统的扩展,近期在Gemini网页界面的更新中,开发人员发现了一个令人兴奋的新功能——Gem分享按钮。这一功能的出现表明,谷歌可能很快允许用户将其自定义Gem(类似于O...
    早报# Gem# Gemini# 谷歌
    11个月前
    04900
    如何将 Copilot 设置为 Edge 新标签页?超实用教程来了!

    如何将 Copilot 设置为 Edge 新标签页?超实用教程来了!

    微软 Edge 浏览器的 Copilot 功能正在不断拓展其应用场景。目前,微软正在试验一项新功能,允许用户将 Copilot 设置为 Edge 的新标签页。这一改变为用户提供了更便捷的交互体验,相比...
    早报# Copilot# Edge
    12个月前
    04900
    ElevenLabs发布全球首个AI“狗语”TTS模型Text To Bark,开启跨物种沟通新时代?

    ElevenLabs发布全球首个AI“狗语”TTS模型Text To Bark,开启跨物种沟通新时代?

    ElevenLabs于4月1日一本正经的宣布推出全球首个为狗开发的AI文本转语音模型:Text To Bark,号称标志着人类与宠物之间的沟通进入了一个全新的时代。 用户只需输入一条消息,选择狗狗的品...
    早报# ElevenLabs# Text To Bark# 狗语
    1年前
    04900
    新型条件图像生成模型BiGR:不仅能创作出高质量的图像,还能理解和识别图像中的内容

    新型条件图像生成模型BiGR:不仅能创作出高质量的图像,还能理解和识别图像中的内容

    香港大学、香港科技大学、云天励飞和香港中文大学的研究人员介绍了一种名为BiGR(Binary Generative Representation)的新型条件图像生成模型。BiGR 使用紧凑的二进制潜在...
    新技术# BiGR# 条件图像生成模型
    1年前
    04900
    ElevenLabs 发布 Eleven v3(Alpha 版),迄今最具表现力的TTS模型

    ElevenLabs 发布 Eleven v3(Alpha 版),迄今最具表现力的TTS模型

    在语音合成技术不断进化的今天,ElevenLabs 正式推出了其最新一代文本转语音模型 —— Eleven v3(Alpha 版)。该版本在情感表达、对话自然度和多语言支持方面实现了重大突破,被誉为目...
    早报# Eleven v3# ElevenLabs# TTS模型
    10个月前
    04890
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    pure-genealogy

    pure-genealogy

    pure-genealogy是一个完全开源、深度中文化、支持多维可视化的现代化家族族谱管理系统。它不仅是一个工具,更是一种数字家史的载体。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    ljg-skills

    ljg-skills

    李继刚(知名设计师、提示词工程师)将其沉淀已久的思维模型与创作工作流,封装为一套专为 Claude Code 设计的自定义技能集 —— ljg-skills。
    查看完整榜单