SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2247 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    OpenAI 的 o3 模型运行成本可能比最初估计的更高

    OpenAI 的 o3 模型运行成本可能比最初估计的更高

    当 OpenAI 在去年 12 月推出其 o3“推理”模型时,它与 ARC-AGI 的创建者合作,通过这一基准测试来展示 o3 的强大能力。然而,几个月后,随着测试结果的修订,o3 的运行成本似乎比最...
    早报# o3# OpenAI
    9个月前
    02720
    字节跳动推出基于DiT模型的人类图像动画框架DreamActor-M1:实现整体性、表现力和鲁棒性的人类图像动画生成

    字节跳动推出基于DiT模型的人类图像动画框架DreamActor-M1:实现整体性、表现力和鲁棒性的人类图像动画生成

    字节跳动推出一个基于DiT模型的人类图像动画框架DreamActor-M1,实现整体性(holistic)、表现力(expressive)和鲁棒性(robust)的人类图像动画生成。该框架通过混合引导...
    新技术# DiT模型# DreamActor-M1# 字节跳动
    9个月前
    02760
    大语言模型真的具备推理能力吗?——RoR-Bench研究揭示真相

    大语言模型真的具备推理能力吗?——RoR-Bench研究揭示真相

    随着大语言模型(LLMs)在各种任务上的表现越来越接近人类水平,人们开始质疑这些模型是否真的具备人类意义上的推理能力,还是仅仅是在重复训练过程中见过的解决方案。 论文:https://arxiv.or...
    新技术# 大语言模型# 推理能力
    9个月前
    02370
    ElevenLabs发布全球首个AI“狗语”TTS模型Text To Bark,开启跨物种沟通新时代?

    ElevenLabs发布全球首个AI“狗语”TTS模型Text To Bark,开启跨物种沟通新时代?

    ElevenLabs于4月1日一本正经的宣布推出全球首个为狗开发的AI文本转语音模型:Text To Bark,号称标志着人类与宠物之间的沟通进入了一个全新的时代。 用户只需输入一条消息,选择狗狗的品...
    早报# ElevenLabs# Text To Bark# 狗语
    9个月前
    04440
    阿里云联合国家天文台发布国际首个太阳大模型“金乌”,太阳耀斑预报准确率超91%

    阿里云联合国家天文台发布国际首个太阳大模型“金乌”,太阳耀斑预报准确率超91%

    阿里云今日宣布,与国家天文台联合发布了国际首个太阳大模型——“金乌”。这一模型基于通义千问系列开源模型打造,目前在M5级太阳耀斑预报上的准确率超过91%,达到了该级别太阳预报的最高水平。这一成果标志着...
    早报# 太阳耀斑# 金乌# 阿里云
    9个月前
    02510
    微软将AI功能扩展至配备英特尔和AMD处理器的Copilot+ PC

    微软将AI功能扩展至配备英特尔和AMD处理器的Copilot+ PC

    微软正加速推进其AI技术在更广泛设备上的应用,特别是针对配备英特尔和AMD处理器的Copilot+ PC。这次更新最引人注目的是实时字幕功能的全面开放,该功能支持将音频实时翻译为英语字幕,覆盖了数十种...
    早报# AMD# Copilot+PC# 微软
    9个月前
    02950
    OpenAI因容量问题暂停Sora新用户视频生成功能

    OpenAI因容量问题暂停Sora新用户视频生成功能

    OpenAI正在努力解决其生成式AI媒体工具套件Sora的容量问题,这一问题源于其上周推出的病毒式图像生成功能带来的巨大流量。 暂停新用户视频生成功能 周一,OpenAI在其支持页面发布通知,宣布暂时...
    早报# OpenAI# Sora# 萨姆·奥尔特曼
    9个月前
    01910
    OpenAI完成400亿美元融资,估值飙升至3000亿美元,未来计划曝光

    OpenAI完成400亿美元融资,估值飙升至3000亿美元,未来计划曝光

    OpenAI在周一宣布完成了一轮规模惊人的融资,这不仅是公司发展的重要里程碑,也标志着人工智能领域进入了一个新的阶段。根据公司发布的博客文章,OpenAI在本轮中募集了400亿美元,投后估值达到了30...
    早报# ChatGPT# OpenAI# 星际之门
    9个月前
    02570
    OpenAI的图像生成器功能正式向所有用户开放,免费用户每天可生成三张图像

    OpenAI的图像生成器功能正式向所有用户开放,免费用户每天可生成三张图像

    OpenAI的图像生成器功能正式向所有用户开放了!这一消息由OpenAI首席执行官萨姆·奥尔特曼在其X平台帖子中宣布。此前,该功能仅限于ChatGPT的付费用户使用,如今普通用户也能体验到这一强大的工...
    早报# OpenAI# 图像生成
    9个月前
    02410
    海螺语音海外版MiniMax Audio发布全新模型Speech-02 :超现实 TTS,多语言无缝切换

    海螺语音海外版MiniMax Audio发布全新模型Speech-02 :超现实 TTS,多语言无缝切换

    海螺语音海外版 MiniMax Audio 发布了全新的 Speech-02 模型,这一创新的文本转语音(TTS)技术能够将任何文件或 URL 瞬间转化为逼真的音频。无论是创建有声书、播客,还是为电影...
    百科# MiniMax Audio# Speech-02# TTS
    9个月前
    05330
    OpenAI计划在未来几个月未开源一款推理大模型

    OpenAI计划在未来几个月未开源一款推理大模型

    OpenAI 计划在未来几个月内发布其首个“开放”语言模型,这是自 GPT-2 以来的又一重大举措。这一计划的披露基于该公司在其网站上发布的反馈表,邀请“开发者、研究人员和更广泛的社区成员”参与其中...
    早报# OpenAI# 开源模型# 萨姆·奥尔特曼
    9个月前
    03020
    ChatGPT 即将更新:推理滑块、记忆功能与语音输入等功能

    ChatGPT 即将更新:推理滑块、记忆功能与语音输入等功能

    OpenAI 正在为其网络应用准备一系列更新,提升用户体验并增强 ChatGPT 的功能。这些更新包括改进的记忆功能、通知 feed、语音输入功能以及推理滑块,以下是详细内容: 改进的记忆功能:让对话...
    早报# ChatGPT# 推理滑块# 记忆功能
    9个月前
    02790
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Poe API

    Poe API

    Quora 旗下的 AI 聚合平台 Poe 正式推出 开发者 API,允许开发者通过统一接口,调用平台上超过 100 款文本、图像、语音和视频生成模型。
    Mixup

    Mixup

    由前谷歌员工团队创立的Things, Inc.公司(曾开发3D设计应用Rooms)推出了新项目:一款名为Mixup的趣味AI照片编辑器。这款仅限iOS的应用允许任何人使用“配方”创建AI生成的新照片——这些配方类似于Mad Libs风格的填空式提示词,可结合你的照片、文字或草图使用。
    NaturalReader

    NaturalReader

    NaturalReader 是一款功能强大、易于使用的文本转语音工具,适合各种场景下的阅读需求。无论您是希望节省时间的学生、需要无障碍支持的读者,还是寻求高质量语音内容的创作者,NaturalReader 都能为您提供卓越的体验。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    查看完整榜单