SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    大语言模型

    共 303 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    腾讯推出新一代快思考模型混元 Turbo S

    腾讯推出新一代快思考模型混元 Turbo S

    腾讯混元团队发布了其自研的快思考模型 Turbo S ,并在腾讯云官网上架,开发者和企业用户可通过 API 调用体验。同时,该模型从今天起在腾讯元宝平台灰度上线,供广大用户体验。 GitHub:htt...
    大语言模型# 混元 Turbo S# 腾讯
    1年前
    02840
    微软发布 Phi 系列两款新模型:Phi-4-multimodal 和 Phi-4-mini

    微软发布 Phi 系列两款新模型:Phi-4-multimodal 和 Phi-4-mini

    微软在今天宣布推出 Phi 系列小型语言模型(SLM)的两款新成员——Phi-4-multimodal 和 Phi-4-mini。这两款模型旨在为开发者提供更强大的 AI 功能,分别在多模态处理和文本...
    大语言模型# Phi-4-mini# Phi-4-multimodal# 微软
    1年前
    04540
    Anthropic推出首款“混合推理模型”Claude 3.7 Sonnet和代理编码工具Claude Code

    Anthropic推出首款“混合推理模型”Claude 3.7 Sonnet和代理编码工具Claude Code

    Anthropic在今天推出全新模型Claude 3.7 Sonnet,号称业界首个“混合AI推理模型”。它不仅能实时回答问题,还能像人类一样“深度思考”,提供更精准的答案!用户可以自由选择让模型“思...
    大语言模型# Anthropic# Claude 3.7 Sonnet# Claude Code
    1年前
    03550
    月之暗面发布Moonlight:使用 Muon 优化器训练的混合专家 (MoE) 模型

    月之暗面发布Moonlight:使用 Muon 优化器训练的混合专家 (MoE) 模型

    月之暗面(Moonshot AI)和加州大学洛杉矶分校的研究团队联合发布了 Moonlight,这是一款基于 Muon 优化器训练的混合专家(MoE)模型。该模型包含两种配置:一种具有 30 亿激活参...
    大语言模型# Moonlight# Moonshot AI# Muon 优化器
    1年前
    02350
    不影响性能!Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

    不影响性能!Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

    R1 1776是Perplexity基于DeepSeek-R1推出的无审查版本,该模型号称提供公正、准确和真实的信息,同时保持高推理能力。目前,用户可以在 HuggingFace 上下载该模型,或者通...
    大语言模型# DeepSeek-R1# Perplexity# R1 1776
    1年前
    07560
    卷麻了!阿里在除夕夜推出超大规模的 MoE 模型 Qwen2.5-Max

    卷麻了!阿里在除夕夜推出超大规模的 MoE 模型 Qwen2.5-Max

    过去,有一种观点认为,持续增加数据规模和模型参数可能是通向人工通用智能(AGI)的一条可行路径。然而,无论是对于稠密模型还是MoE(Mixture of Experts)模型而言,整个大模型社区在训练...
    大语言模型# MoE# Qwen2.5-Max# 阿里
    1年前
    03090
    艾伦AI研究所推出Tülu 3 405B:超越 DeepSeek V3 的性能表现

    艾伦AI研究所推出Tülu 3 405B:超越 DeepSeek V3 的性能表现

    艾伦AI研究所在成功推出Tülu 3之后,又在昨天宣布推出Tülu 3 405B——这是首次将完全开放的后训练方法应用于最大规模的开放权重模型。此次发布不仅展示了艾伦AI研究所在大规模参数模型上的可扩...
    大语言模型# Tülu 3# Tülu 3 405B# 艾伦AI研究所
    1年前
    02800
    法国AI初创企业Mistral发布高效模型 Mistral Small 3:24亿参数的模型特别针对延迟进行了优化

    法国AI初创企业Mistral发布高效模型 Mistral Small 3:24亿参数的模型特别针对延迟进行了优化

    法国AI初创公司Mistral最近发布了其最新的人工智能模型——Mistral Small 3。这款拥有24亿参数的模型特别针对延迟进行了优化,并根据Apache 2.0许可证开放源代码。Mistra...
    大语言模型# Mistral# Mistral Small 3
    1年前
    02770
    阿里通义团队推出Qwen2.5-1M:支持100万Token上下文的开源大语言模型

    阿里通义团队推出Qwen2.5-1M:支持100万Token上下文的开源大语言模型

    阿里通义团队于两个月前升级了 Qwen2.5-Turbo,使其支持最多一百万个Tokens的上下文长度。1月27日,通义团队正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。以下是本次...
    大语言模型# Qwen2.5-1M
    1年前
    02670
    深度求索发布开源推理大语言模型DeepSeek-R1,性能对标 OpenAI o1 正式版

    深度求索发布开源推理大语言模型DeepSeek-R1,性能对标 OpenAI o1 正式版

    幻方量化旗下的AI公司深度求索(DeepSeek)今日正式发布了其最新的大语言模型DeepSeek-R1,并同步开源了模型权重。这一举措旨在通过提供高性能的开源解决方案,推动人工智能领域的发展。 地址...
    大语言模型# DeepSeek# DeepSeek-R1# 深度求索
    1年前
    03510
    Jina AI推出一款1.5B参数的小型语言模型ReaderLM-v2:专注于将原始HTML高效准确地转换为Markdown或JSON格式

    Jina AI推出一款1.5B参数的小型语言模型ReaderLM-v2:专注于将原始HTML高效准确地转换为Markdown或JSON格式

    ReaderLM-v2 是由Jina AI开发的一款1.5B参数的小型语言模型,专注于将原始HTML高效准确地转换为Markdown或JSON格式。这款第二代模型在长上下文处理能力和多语言支持方面有了...
    大语言模型# ReaderLM-v2
    1年前
    03470
    微软正式开源了Phi-4:拥有140亿参数的小型语言模型

    微软正式开源了Phi-4:拥有140亿参数的小型语言模型

    去年12月,微软推出了其Phi系列的最新成员——Phi-4,该模型在解决数学问题等方面展现了显著的进步。这些进步主要得益于训练数据质量的提升,特别是采用了高质量的合成数据集和人类生成的内容数据集。然而...
    大语言模型# Phi-4# 微软
    1年前
    03040
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    BuildCores

    BuildCores

    BuildCores 是一款集 3D 组装预览、智能兼容性检测、全球比价 于一体的在线装机工具。无论你是首次装机的新手,还是追求极致性能的发烧友,都能在手机或电脑上轻松规划、验证并优化你的 PC 配置。
    pure-genealogy

    pure-genealogy

    pure-genealogy是一个完全开源、深度中文化、支持多维可视化的现代化家族族谱管理系统。它不仅是一个工具,更是一种数字家史的载体。
    ljg-skills

    ljg-skills

    李继刚(知名设计师、提示词工程师)将其沉淀已久的思维模型与创作工作流,封装为一套专为 Claude Code 设计的自定义技能集 —— ljg-skills。
    查看完整榜单