大语言模型

排序

发布更新浏览点赞

谷歌发布 Gemma 3：您可以在单个 GPU 或 TPU 上运行的最强大模型

谷歌在今天宣布推出 Gemma 3，声称这是目前可以在单个 GPU 上运行的最强大的 AI 模型。这款全新升级的“开放”AI 模型不仅能够处理文本，还能解读图像和短视频，进一步拓展了其应用场景。 Ge...

早报 # Gemma 3 # Gemmaverse # 大语言模型

1年前

03250

AI21开源大语言模型Jamba 1.6系列，适合企业私有部署

AI21 正式发布开源模型Jamba 1.6 系列，专为企业私有部署设计，兼具卓越性能和数据安全性。模型地址：https://huggingface.co/collections/ai21labs...

大语言模型 # AI21 # Jamba 1.6 # 大语言模型

1年前

05350

阿里巴巴提出START：显著提升大语言模型推理能力的创新工具

在大语言模型的发展中，尽管在理解和生成类人文本方面取得了显著进展，但在处理复杂推理任务时，尤其是需要多步计算或逻辑分析的任务，这些模型往往表现不佳。传统的思维链（Chain of Thought, C...

新技术 # START # 大语言模型 # 推理

1年前

02330

Prompt-to-Leaderboard (P2L)：为特定使用场景量身定制的大语言模型排行榜

LMArena 推出了 Prompt-to-Leaderboard（P2L），这是一种创新方法，旨在通过自然语言提示生成针对特定使用场景的实时大语言模型（LLM）排行榜。P2L 的核心思想是训练一个大...

大语言模型 # P2L # 大语言模型

1年前

05460

清华大学与瑞莱智慧联合团队推出RealSafe-R1：基于 DeepSeek R1 的安全优化大语言模型

随着大语言模型（LLMs）在各个领域的广泛应用，其安全性问题日益受到关注。尽管这些模型在性能上表现出色，但在面对恶意查询和越狱攻击时，仍存在一定的风险。为了应对这一挑战，清华大学与瑞莱智慧联合团队推出...

新技术 # DeepSeek-R1 # RealSafe-R1 # 大语言模型

1年前

05590

强化学习新范式OREAL：基于结果奖励的强化学习（RL）提升大语言模型在数学推理任务中的表现

上海AI实验室、上海交通大学、香港中文大学和InnoHK的研究人员提出基于结果奖励的强化学习新范式OREAL，通过基于结果奖励的强化学习（RL）提升大语言模型（LLMs）在数学推理任务中的表现。该框架...

新技术 # OREAL # 大语言模型 # 强化学习

1年前

04400

端到端的训练框架Mimir：通过大语言模型增强文本到视频生成

蚂蚁集团和清华大学的研究人员提出了Mimir，这是一个端到端的训练框架，旨在解决当前视频扩散模型在文本理解方面的不足，并充分利用大语言模型（LLMs）的强大文本处理能力。Mimir通过引入精心设计的标...

新技术 # Mimir # 大语言模型

1年前

02990

一站式大语言模型平台AnyChat，为开发者提供灵活性

AnyChat是一款新工具，旨在通过将多个领先的大语言模型（LLMs）统一在一个界面下，为开发者提供前所未有的灵活性。这款工具由AI社区的知名人物、Gradio的机器学习增长负责人Ahsen Khal...

工具 # AnyChat # 大语言模型

1年前

04810

苹果推出基于最优传输理论的通用框架ACT：用于控制大型生成模型的生成过程

大型生成模型（如大语言模型LLMs和文本到图像扩散模型T2Is）的能力不断增强，但其日益广泛的部署也引发了对可靠性和安全性的担忧。为了解决这些问题，研究人员提出了通过引导模型激活来控制模型生成的方法...

新技术 # ACT # 大语言模型 # 文生图模型

1年前

05070

结合了大语言模型与文生图模型的新框架SGEdit：用于基于场景图的精确和灵活的图像编辑

场景图提供了一种结构化、层次化的图像表示方式，其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容，还能作为图像编辑的有效接口，极大提升了编辑工作的准确性和灵活性...

新技术 # SGEdit # 图像编辑 # 大语言模型

1年前

04680

新型图像生成模型家族LlamaGen：将大语言模型（Llama）应用到视觉图像生成领域

香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen，将大语言模型（Llama）中原用于文本生成的“下一个令牌预测”范式应用到了视觉图像生成领域。LlamaGen是对传统自回归模型在图...

新技术 # LlamaGen # 图像生成 # 大语言模型

2年前

06770

如何在本地安装及使用Ollama，轻松玩转本地大语言模型

在《打造本地专属GPT！使用这些软件轻松运行开源大语言模型》这篇文章里，已经向大家介绍了Ollama这款软件，Ollama可以在本地机器上部署和管理大语言模型，Ollama 提供了简单的命令行界面（C...

工具 # Llama 3 # Ollama # Phi-3

2年前

01,1600

加载更多