浙江大学发布“浙大先生”,可使用满血版DeepSeek V3和R1模型浙江大学于2月14日正式发布了深度融合智能体“浙大先生”(chat.zju.edu.cn)。该平台本地化部署了DeepSeek V3和R1模型,并基于CARSI资源共享平台,全面覆盖教学、科研和生活等...早报# Deepseek V3# DeepSeek-R1# 浙大先生10个月前03950
基于Llama 3 + Deepseek V3的React应用开发平台Deepseek ArtifactsDeepseek Artifacts 是一个基于当前最强大的AI开源模型的AI编程工具,帮助开发者快速构建React应用。它使用了Llama-3.1-70B、Llama 3.1 405B等先进的AI模...工具# Deepseek Artifacts# Deepseek V311个月前03790
百度发布文心大模型 4.5 Turbo 和 X1 Turbo:性能超GPT4 o,价格低于DeepSeek-V3在刚刚落幕的 Create 2025 开发者大会 上,百度发布了一系列重磅 AI 技术成果,展示了其在人工智能领域的技术实力与商业化落地能力。从性能与成本双突破的文心大模型 4.5 Turbo 和 X...早报# Deepseek V3# X1 Turbo# 文心大模型 4.5 Turbo8个月前02790
大语言模型架构对比:从 DeepSeek-V3 到 Kimi K2,现代大语言模型架构设计一览大语言模型(LLM)发展至今,虽然基础架构仍沿袭 GPT 系列的 Transformer 范式,但在细节设计上已发生显著变化。本文将从架构角度出发,对比 2025 年主流模型的设计趋势,包括注意力机制...科普# Deepseek V3# Kimi K2# 大语言模型架构5个月前02030
DeepSeek低调发布DeepSeek-V3-0324,性能超过Claude Sonnet 3.5,可在消费级硬件部署DeepSeek在昨晚悄悄地发布了一款新的大语言模型——DeepSeek-V3-0324。这款模型不仅因其出色的能力在AI行业掀起波澜,更因其独特的部署方式引发了广泛关注。该模型已经在Hugging ...早报# DeepSeek# Deepseek V3# DeepSeek-V3-03249个月前01960