Fogsight (雾象)雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。013,2331AI视频# Fogsight# 动画生成引擎# 大语言模型
Next AI Draw.ioNext AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。05320AI小应用# draw.io# Next AI Draw.io# 大语言模型
PokerBattlePokerBattle.ai 是一个让多个大语言模型(LLM)在真实德州扑克规则下自主对战的实验平台。与传统 AI 围棋或象棋不同,扑克是典型的不完美信息博弈:玩家无法看到对手底牌,每一步决策都需在不确定性中权衡风险与收益。0270基准测试# PokerBattle# 大语言模型# 德州扑克
MCPMarkMCPMark是一个全面的压力测试MCP基准,包含一系列多样化、可验证的任务,旨在评估模型和智能体在现实世界MCP使用中的能力。MCPMark将持续更新新兴的MCP服务器,以跟上充满活力的生态系统步伐!0550基准测试# MCP# MCPMark# 大语言模型
Rust LLM from ScratchRust LLM from Scratch是一个完全使用纯 Rust 实现的、没有外部机器学习框架的大语言模型。从头构建,仅使用 ndarray 进行矩阵运算。02100AI工具# Rust# RustGPT# 大语言模型
NoCode-benchNoCode-bench 的结果或许让人失望,但也正是这种“真实感”使其成为推动技术发展的关键一步。当 AI 能稳定地将一句“增加导出功能”转化为正确、可测、可部署的代码时,那才是无代码开发真正成熟的时刻。在此之前,我们仍需脚踏实地,用像 NoCode-bench 这样的基准,一步步丈量差距,逼近目标。01480基准测试# AI 编程助手# NoCode-bench# 大语言模型
DroidrunDroidRun 是一个强大的框架,通过大语言模型(LLM)代理控制 Android 和 iOS 设备。它允许使用自然语言命令实现设备交互的自动化。0870AI工具# DroidRun# 大语言模型# 自动化框架
llm.pdfllm.pdf 不是为了替代现有的 LLM 部署方式,而是对“计算载体边界”的一次有趣探索。它证明了 PDF 这种看似静态的文档格式,也能成为完整 AI 推理的容器。02430AI工具# llm.pdf# 大语言模型
C.O.R.EC.O.R.E 代表了一种全新的 AI 记忆范式:不是简单的信息存储,而是动态、可追溯、可共享的知识图谱。它不仅提升了 AI 助手的理解力与响应质量,也为开发者和企业提供了前所未有的上下文管理能力。01340实用工具# C.O.R.E# 共享记忆# 大语言模型
YuppYupp正式推出人类评估系统 ,邀请使用者协助评估全球逾 500 个大语言模型,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok 及 Llama 等,也涵盖了必须付费订阅的各种 Pro 与 Max 模型,并根据使用者的回馈制定 Yupp AI VIBE排行榜。03010基准测试# Yupp# 大语言模型
UQLMUQLM 是一个用于大型语言模型(LLM)幻觉检测的 Python 库,采用最先进的不确定性量化技术。UQLM 提供了一套响应级评分器,用于量化大型语言模型(LLM)输出的不确定性。每个评分器返回一个介于 0 和 1 之间的置信度得分,得分越高表示错误或幻觉的可能性越低。02660AI工具# UQLM# 大语言模型# 幻觉
ContextGemContextGem 是一款强大且易用的文档分析工具,特别适合需要深度阅读和精准提取信息的场景。通过减少开发复杂度和提高自动化水平,它让用户能够专注于核心业务逻辑,而不是繁琐的技术细节。03480AI工具# ContextGem# 大语言模型# 文档解析
Unsloth AIUnsloth 通过 Dynamic 2.0 Quants 和 Qwen3 支持等最新技术,显著提升了 LLM 训练的效率和可访问性。未来计划包括 MultiGPU 支持扩展、自动优化器开发,以及更多模型和硬件的支持,持续推动 AI 训练的民主化。02890AI工具# Unsloth AI# 大语言模型
大模型显存与性能计算器LLM 显存与性能计算器 是一款实用工具,能够帮助用户快速评估不同大语言模型的显存需求和推理性能。无论你是研究人员还是开发者,都可以利用这一工具优化模型部署方案,确保在有限硬件资源下实现最佳性能。03490AI小应用# 大语言模型# 显存# 模型
Raycast AIRaycast AI 是 Raycast 应用程序中的一个功能,将AI能力整合到 macOS 系统,允许用户通过启动器与 AI 模型交互,如回答问题或生成文本。它适合提升生产力。Raycast AI 提供免费和付费两种使用方式,免费版有 50 条消息限制,付费版(Pro + 高级 AI)提供无限消息和更多模型。03540AI工具# Raycast# Raycast AI# 大语言模型
CohereCohere 是一家专注于企业 AI 解决方案的领先公司,其产品和服务通过 Command、Embed 和 Rerank 模型为企业提供强大的 NLP 工具。03030AI助手# Cohere# Command# 大语言模型
unslothUnsloth是一个专注于优化大语言模型(LLMs)微调的开源框架,专为优化大型语言模型(LLMs)的微调而设计。它声称比其他方法提供显著的速度和内存改进,使更多用户能够在各种硬件上使用 LLMs。 03060AI工具# Unsloth# 大语言模型# 模型微调
FirecrawlFirecrawl能够将整个网站转换为干净、适合LLM(大语言模型)使用的Markdown或结构化数据。通过单一API实现网页的抓取、爬取和提取,非常适合希望通过网络数据增强其LLM应用的AI公司。03780实用工具# Firecrawl# Markdown# 大语言模型
Privacy AI Chat AssistantPrivacy AI Chat Assistant 是一款功能强大且注重隐私的 AI 聊天应用,特别适合需要离线运行 AI 模型的用户。它的本地处理能力、丰富的模型选择以及简洁直观的设计,使其成为保护隐私和提升生产力的理想工具。02600AI助手# AI模型# DeepSeek-R1# Privacy AI Chat Assistant
On-Device AIOn-Device AI 为苹果用户提供了一种全新的 AI 使用方式,无需网络连接,即可随时随地享受 AI 的强大功能。它不仅保护了您的隐私,还通过本地运行提升了性能和效率。04140AI助手# AI模型# On-Device AI# 大语言模型
The Ultra-Scale PlaybookHugging Face旗下的Nanotron团队近期推出了一本免费、开源的综合性书籍——《Ultrascale-Playbook》。这本书旨在为读者提供关于如何在大规模GPU集群上高效训练大语言模型的全面指导,涵盖了分布式/并行化技术以及低级优化技巧。01,1470实用工具# The Ultra-Scale Playbook# 大语言模型# 模型训练
DeepSeekDeepSeek 的出现标志着中国在AI领域的一次重要突破,其推出的推理模型 DeepSeek-R1 不仅引发了全球关注,还对技术、政治和财经领域产生了深远影响。04590AI助手# DeepSeek# DeepSeek-R1# 大语言模型
LMArenaChatbot Arena是一个开放平台,专注于通过人类偏好评估大型语言模型(LLMs)的性能。该平台由加州大学伯克利分校的SkyLab和LMSYS研究团队开发,旨在为LLMs提供一个公正、透明的评估环境。04480基准测试# Chatbot Arena# LMArena# 大语言模型