AI21开源大语言模型Jamba 1.6系列,适合企业私有部署AI21 正式发布开源模型Jamba 1.6 系列,专为企业私有部署设计,兼具卓越性能和数据安全性。 模型地址:https://huggingface.co/collections/ai21labs...大语言模型# AI21# Jamba 1.6# 大语言模型9个月前03600
阿里巴巴提出START:显著提升大语言模型推理能力的创新工具在大语言模型的发展中,尽管在理解和生成类人文本方面取得了显著进展,但在处理复杂推理任务时,尤其是需要多步计算或逻辑分析的任务,这些模型往往表现不佳。传统的思维链(Chain of Thought, C...新技术# START# 大语言模型# 推理9个月前02170
Prompt-to-Leaderboard (P2L):为特定使用场景量身定制的大语言模型排行榜LMArena 推出了 Prompt-to-Leaderboard(P2L),这是一种创新方法,旨在通过自然语言提示生成针对特定使用场景的实时大语言模型(LLM)排行榜。P2L 的核心思想是训练一个大...大语言模型# P2L# 大语言模型9个月前03930
清华大学与瑞莱智慧联合团队推出RealSafe-R1:基于 DeepSeek R1 的安全优化大语言模型随着大语言模型(LLMs)在各个领域的广泛应用,其安全性问题日益受到关注。尽管这些模型在性能上表现出色,但在面对恶意查询和越狱攻击时,仍存在一定的风险。为了应对这一挑战,清华大学与瑞莱智慧联合团队推出...新技术# DeepSeek-R1# RealSafe-R1# 大语言模型10个月前04150
强化学习新范式OREAL:基于结果奖励的强化学习(RL)提升大语言模型在数学推理任务中的表现上海AI实验室、上海交通大学、香港中文大学和InnoHK的研究人员提出基于结果奖励的强化学习新范式OREAL,通过基于结果奖励的强化学习(RL)提升大语言模型(LLMs)在数学推理任务中的表现。该框架...新技术# OREAL# 大语言模型# 强化学习10个月前03490
端到端的训练框架Mimir:通过大语言模型增强文本到视频生成蚂蚁集团和清华大学的研究人员提出了Mimir,这是一个端到端的训练框架,旨在解决当前视频扩散模型在文本理解方面的不足,并充分利用大语言模型(LLMs)的强大文本处理能力。Mimir通过引入精心设计的标...新技术# Mimir# 大语言模型1年前02910
一站式大语言模型平台AnyChat,为开发者提供灵活性AnyChat是一款新工具,旨在通过将多个领先的大语言模型(LLMs)统一在一个界面下,为开发者提供前所未有的灵活性。这款工具由AI社区的知名人物、Gradio的机器学习增长负责人Ahsen Khal...工具# AnyChat# 大语言模型1年前04630
苹果推出基于最优传输理论的通用框架ACT:用于控制大型生成模型的生成过程大型生成模型(如大语言模型LLMs和文本到图像扩散模型T2Is)的能力不断增强,但其日益广泛的部署也引发了对可靠性和安全性的担忧。为了解决这些问题,研究人员提出了通过引导模型激活来控制模型生成的方法...新技术# ACT# 大语言模型# 文生图模型1年前04990
结合了大语言模型与文生图模型的新框架SGEdit:用于基于场景图的精确和灵活的图像编辑场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容,还能作为图像编辑的有效接口,极大提升了编辑工作的准确性和灵活性...新技术# SGEdit# 图像编辑# 大语言模型1年前04210
新型图像生成模型家族LlamaGen:将大语言模型(Llama)应用到视觉图像生成领域香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen,将大语言模型(Llama)中原用于文本生成的“下一个令牌预测”范式应用到了视觉图像生成领域。LlamaGen是对传统自回归模型在图...新技术# LlamaGen# 图像生成# 大语言模型2年前06540
如何在本地安装及使用Ollama,轻松玩转本地大语言模型在《打造本地专属GPT!使用这些软件轻松运行开源大语言模型》这篇文章里,已经向大家介绍了Ollama这款软件,Ollama可以在本地机器上部署和管理大语言模型,Ollama 提供了简单的命令行界面(C...工具# Llama 3# Ollama# Phi-32年前01,1460
新框架VSP-LLM:通过观察视频中人的嘴型来理解和翻译说话内容这篇论文介绍了一个名为VSP-LLM(Visual Speech Processing incorporated with LLMs)的新框架,它结合了视觉语音处理和大语言模型(LLMs),以提高视觉...新技术# VSP-LLM# 大语言模型# 视觉语音翻译2年前06770