关于

SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。不仅提供Stable Diffusion、ComfyUI、Fooocus、Flux等热门工具的详细教程和丰富资源,还为您带来行业最新进展与趋势解读。无论您是初学者还是资深创作者,都能在这里快速找到所需信息,开启AI创作之旅

由于本人使用的是Windows电脑,所以本站教程以Windows平台为主,本人电脑配置如下:

  • CPU:英特尔13代酷睿i5-13490F
  • 内存:64G
  • 显卡:英伟达GeForce RTX 4070

目前在AI绘画方面,日常使用Fooocus进行生图,简单高效;新模型与复杂生图使用ComfyUI与Stable Diffusion web UI。

 

Open ASR 排行榜

Open ASR 排行榜

Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
VideoTutor

VideoTutor

VideoTutor 是一款 AI 驱动的教育工具,专注于生成学习视频,它提供定制的 AI 解释视频和 24/7 AI 教师支持,覆盖数学、科学和语言等主题。它适合 K-12 学生自主学习,但具体效果可能因用户而异。
TTSMaker

TTSMaker

TTSMaker是一款在线文本转语音工具,也称为AI语音生成器,它可以将文本转换为音频,并且可以播放或下载音频文件。
BabelDOC

BabelDOC

BabelDOC 是新一代智能 PDF 翻译工具,采用先进的排版保持技术,为您提供专业级的双语对照翻译体验。无论是前沿学术论文,还是商业分析报告,BabelDOC 都能帮您轻松跨越语言藩篱,同时完美呈现原文档的精致排版。
Whisk

Whisk

Whisk 是谷歌最新的 Google Labs 实验,允许用户通过输入或创建传达主题、场景和风格的图像,轻松组合并重新混合这些元素,生成独一无二的作品。Whisk 结合了 Imagen 3 的图像生成能力和 Gemini 的视觉理解和描述能力,使用户能够以有趣的新方式探索创意。
Poe

Poe

Poe 不仅仅是一个聊天应用,它是一个集成了多模型互动、自定义应用创建和多样化工具的综合性平台。无论是希望通过多种 AI 模型解决问题的用户,还是希望探索 AI 创造力的开发者,Poe 都提供了丰富的可能性。
查看完整榜单