强化学习新范式OREAL:基于结果奖励的强化学习(RL)提升大语言模型在数学推理任务中的表现 上海AI实验室、上海交通大学、香港中文大学和InnoHK的研究人员提出基于结果奖励的强化学习新范式OREAL,通过基于结果奖励的强化学习(RL)提升大语言模型(LLMs)在数学推理任务中的表现。该框架... 新技术# OREAL# 大语言模型# 强化学习 6天前0240
端到端的训练框架Mimir:通过大语言模型增强文本到视频生成 蚂蚁集团和清华大学的研究人员提出了Mimir,这是一个端到端的训练框架,旨在解决当前视频扩散模型在文本理解方面的不足,并充分利用大语言模型(LLMs)的强大文本处理能力。Mimir通过引入精心设计的标... 新技术# Mimir# 大语言模型 3个月前01110
一站式大语言模型平台AnyChat,为开发者提供灵活性 AnyChat是一款新工具,旨在通过将多个领先的大语言模型(LLMs)统一在一个界面下,为开发者提供前所未有的灵活性。这款工具由AI社区的知名人物、Gradio的机器学习增长负责人Ahsen Khal... 工具# AnyChat# 大语言模型 3个月前02540
苹果推出基于最优传输理论的通用框架ACT:用于控制大型生成模型的生成过程 大型生成模型(如大语言模型LLMs和文本到图像扩散模型T2Is)的能力不断增强,但其日益广泛的部署也引发了对可靠性和安全性的担忧。为了解决这些问题,研究人员提出了通过引导模型激活来控制模型生成的方法,... 新技术# ACT# 大语言模型# 文生图模型 4个月前02190
结合了大语言模型与文生图模型的新框架SGEdit:用于基于场景图的精确和灵活的图像编辑 场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容,还能作为图像编辑的有效接口,极大提升了编辑工作的准确性和灵活性... 新技术# SGEdit# 图像编辑# 大语言模型 4个月前02080
新型图像生成模型家族LlamaGen:将大语言模型(Llama)应用到视觉图像生成领域 香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen,将大语言模型(Llama)中原用于文本生成的“下一个令牌预测”范式应用到了视觉图像生成领域。LlamaGen是对传统自回归模型在图... 新技术# LlamaGen# 图像生成# 大语言模型 9个月前04560
如何在本地安装及使用Ollama,轻松玩转本地大语言模型 在《打造本地专属GPT!使用这些软件轻松运行开源大语言模型》这篇文章里,已经向大家介绍了Ollama这款软件,Ollama可以在本地机器上部署和管理大语言模型,Ollama 提供了简单的命令行界面(C... 工具# Llama 3# Ollama# Phi-3 10个月前08780
新框架VSP-LLM:通过观察视频中人的嘴型来理解和翻译说话内容 这篇论文介绍了一个名为VSP-LLM(Visual Speech Processing incorporated with LLMs)的新框架,它结合了视觉语音处理和大语言模型(LLMs),以提高视觉... 新技术# VSP-LLM# 大语言模型# 视觉语音翻译 1年前04620
谷歌推出新一代开源模型Gemma,轻量级高性能,助力AI创新 谷歌推出开源模型Gemma,这是一款轻量级、先进的开源模型,供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸,能够在不同的设备类型上运行,包括笔记本电脑... 大语言模型# Gemma# 大语言模型# 谷歌 2周前05160
视觉-语言适配器PaLM2-VAdapter:将传统的视觉编码器和大语言模型结合起来 PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型,以提高它们之间的协同工作效果。 论文 它能够有效地将传统的视觉编码器(vision encoders)和大语言模型(LL... 新技术# PaLM2-VAdapter# 大语言模型# 视觉编码器 1年前06740
LoRA:为解决大语言模型微调而开发 微软的研究人员于2021年推出LoRA(Low-Rank Adaptation of Large Language Models,大语言模型的低阶适应),这是为解决大语言模型微调而开发的一项技术,用于... 新技术# Lora# 大语言模型# 微软 1年前04020
新型图像生成技术StrokeNUWA:利用大语言模型生成矢量图形 StrokeNUWA是一种新型图像生成技术,用于仅通过大语言模型(LLM)生成矢量图形,无需依赖专门的视觉模块。 论文 该方法的关键创新在于利用矢量图形固有的视觉语义,将矢量图形编码为"笔画"标记,这... 新技术# LLM# StrokeNUWA# 大语言模型 1年前04630