大语言模型

共 24 篇网址

排序

发布更新浏览点赞

Fogsight (雾象)

雾象是一款由大语言模型（LLM）驱动的动画引擎 agent 。用户输入抽象概念或词语，雾象会将其转化为高水平的生动动画。

022,6531

AI视频 # Fogsight # 动画生成引擎 # 大语言模型

awesome-LLM-resources

awesome-LLM-resources

号称是全世界最好的LLM资料总结（多模态生成、Agent、辅助编程、AI审稿、数据处理、模型训练、模型推理、o1 模型、MCP、小语言模型、视觉语言模型）

0430

爱学习 # 大语言模型

Next AI Draw.io

Next AI Draw.io

Next AI Draw.io 是一个基于 Next.js 的 Web 应用，将大语言模型（LLM）与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表，无需手动拖拽。

01,3690

AI小应用 # draw.io # Next AI Draw.io # 大语言模型

PokerBattle

PokerBattle.ai 是一个让多个大语言模型（LLM）在真实德州扑克规则下自主对战的实验平台。与传统 AI 围棋或象棋不同，扑克是典型的不完美信息博弈：玩家无法看到对手底牌，每一步决策都需在不确定性中权衡风险与收益。

0970

基准测试 # PokerBattle # 大语言模型 # 德州扑克

MCPMark

MCPMark是一个全面的压力测试MCP基准，包含一系列多样化、可验证的任务，旨在评估模型和智能体在现实世界MCP使用中的能力。MCPMark将持续更新新兴的MCP服务器，以跟上充满活力的生态系统步伐！

01310

基准测试 # MCP # MCPMark # 大语言模型

Rust LLM from Scratch

Rust LLM from Scratch

Rust LLM from Scratch是一个完全使用纯 Rust 实现的、没有外部机器学习框架的大语言模型。从头构建，仅使用 ndarray 进行矩阵运算。

02370

AI工具 # Rust # RustGPT # 大语言模型

NoCode-bench

NoCode-bench 的结果或许让人失望，但也正是这种“真实感”使其成为推动技术发展的关键一步。当 AI 能稳定地将一句“增加导出功能”转化为正确、可测、可部署的代码时，那才是无代码开发真正成熟的时刻。在此之前，我们仍需脚踏实地，用像 NoCode-bench 这样的基准，一步步丈量差距，逼近目标。

02370

基准测试 # AI 编程助手 # NoCode-bench # 大语言模型

Droidrun

DroidRun 是一个强大的框架，通过大语言模型（LLM）代理控制 Android 和 iOS 设备。它允许使用自然语言命令实现设备交互的自动化。

01080

AI工具 # DroidRun # 大语言模型 # 自动化框架

llm.pdf

llm.pdf 不是为了替代现有的 LLM 部署方式，而是对“计算载体边界”的一次有趣探索。它证明了 PDF 这种看似静态的文档格式，也能成为完整 AI 推理的容器。

02700

AI工具 # llm.pdf # 大语言模型

C.O.R.E

C.O.R.E 代表了一种全新的 AI 记忆范式：不是简单的信息存储，而是动态、可追溯、可共享的知识图谱。它不仅提升了 AI 助手的理解力与响应质量，也为开发者和企业提供了前所未有的上下文管理能力。

01530

实用工具 # C.O.R.E # 共享记忆 # 大语言模型

Yupp

Yupp正式推出人类评估系统，邀请使用者协助评估全球逾 500 个大语言模型，包括 ChatGPT、Claude、Gemini、DeepSeek、Grok 及 Llama 等，也涵盖了必须付费订阅的各种 Pro 与 Max 模型，并根据使用者的回馈制定 Yupp AI VIBE排行榜。

05110

基准测试 # Yupp # 大语言模型

UQLM

UQLM 是一个用于大型语言模型（LLM）幻觉检测的 Python 库，采用最先进的不确定性量化技术。UQLM 提供了一套响应级评分器，用于量化大型语言模型（LLM）输出的不确定性。每个评分器返回一个介于 0 和 1 之间的置信度得分，得分越高表示错误或幻觉的可能性越低。

04640

AI工具 # UQLM # 大语言模型 # 幻觉

ContextGem

ContextGem 是一款强大且易用的文档分析工具，特别适合需要深度阅读和精准提取信息的场景。通过减少开发复杂度和提高自动化水平，它让用户能够专注于核心业务逻辑，而不是繁琐的技术细节。

03880

AI工具 # ContextGem # 大语言模型 # 文档解析

Unsloth AI

Unsloth 通过 Dynamic 2.0 Quants 和 Qwen3 支持等最新技术，显著提升了 LLM 训练的效率和可访问性。未来计划包括 MultiGPU 支持扩展、自动优化器开发，以及更多模型和硬件的支持，持续推动 AI 训练的民主化。

04400

AI工具 # Unsloth AI # 大语言模型

大模型显存与性能计算器

LLM 显存与性能计算器是一款实用工具，能够帮助用户快速评估不同大语言模型的显存需求和推理性能。无论你是研究人员还是开发者，都可以利用这一工具优化模型部署方案，确保在有限硬件资源下实现最佳性能。

04320

AI小应用 # 大语言模型 # 显存 # 模型

Raycast AI

Raycast AI 是 Raycast 应用程序中的一个功能，将AI能力整合到 macOS 系统，允许用户通过启动器与 AI 模型交互，如回答问题或生成文本。它适合提升生产力。Raycast AI 提供免费和付费两种使用方式，免费版有 50 条消息限制，付费版（Pro + 高级 AI）提供无限消息和更多模型。

05170

AI工具 # Raycast # Raycast AI # 大语言模型

Cohere

Cohere 是一家专注于企业 AI 解决方案的领先公司，其产品和服务通过 Command、Embed 和 Rerank 模型为企业提供强大的 NLP 工具。

03230

AI助手 # Cohere # Command # 大语言模型

unsloth

Unsloth是一个专注于优化大语言模型（LLMs）微调的开源框架，专为优化大型语言模型（LLMs）的微调而设计。它声称比其他方法提供显著的速度和内存改进，使更多用户能够在各种硬件上使用 LLMs。

05110

AI工具 # Unsloth # 大语言模型 # 模型微调

Firecrawl

Firecrawl能够将整个网站转换为干净、适合LLM（大语言模型）使用的Markdown或结构化数据。通过单一API实现网页的抓取、爬取和提取，非常适合希望通过网络数据增强其LLM应用的AI公司。

06080

实用工具 # Firecrawl # Markdown # 大语言模型

Privacy AI Chat Assistant

Privacy AI Chat Assistant

Privacy AI Chat Assistant 是一款功能强大且注重隐私的 AI 聊天应用，特别适合需要离线运行 AI 模型的用户。它的本地处理能力、丰富的模型选择以及简洁直观的设计，使其成为保护隐私和提升生产力的理想工具。

03100

AI助手 # AI模型 # DeepSeek-R1 # Privacy AI Chat Assistant

On-Device AI

On-Device AI 为苹果用户提供了一种全新的 AI 使用方式，无需网络连接，即可随时随地享受 AI 的强大功能。它不仅保护了您的隐私，还通过本地运行提升了性能和效率。

05580

AI助手 # AI模型 # On-Device AI # 大语言模型

The Ultra-Scale Playbook

The Ultra-Scale Playbook

Hugging Face旗下的Nanotron团队近期推出了一本免费、开源的综合性书籍——《Ultrascale-Playbook》。这本书旨在为读者提供关于如何在大规模GPU集群上高效训练大语言模型的全面指导，涵盖了分布式/并行化技术以及低级优化技巧。

01,2630

实用工具 # The Ultra-Scale Playbook # 大语言模型 # 模型训练

DeepSeek

DeepSeek 的出现标志着中国在AI领域的一次重要突破，其推出的推理模型 DeepSeek-R1 不仅引发了全球关注，还对技术、政治和财经领域产生了深远影响。

05560

AI助手 # DeepSeek # DeepSeek-R1 # 大语言模型

LMArena

Chatbot Arena是一个开放平台，专注于通过人类偏好评估大型语言模型（LLMs）的性能。该平台由加州大学伯克利分校的SkyLab和LMSYS研究团队开发，旨在为LLMs提供一个公正、透明的评估环境。

04850

基准测试 # Chatbot Arena # LMArena # 大语言模型