大语言模型

排序

发布更新浏览点赞

如何在本地安装及使用Ollama，轻松玩转本地大语言模型

在《打造本地专属GPT！使用这些软件轻松运行开源大语言模型》这篇文章里，已经向大家介绍了Ollama这款软件，Ollama可以在本地机器上部署和管理大语言模型，Ollama 提供了简单的命令行界面（C...

工具 # Llama 3 # Ollama # Phi-3

2年前

01,1600

视觉-语言适配器PaLM2-VAdapter：将传统的视觉编码器和大语言模型结合起来

PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型，以提高它们之间的协同工作效果。论文它能够有效地将传统的视觉编码器（vision encoders）和大语言模型（LL...

新技术 # PaLM2-VAdapter # 大语言模型 # 视觉编码器

2年前

08960

谷歌推出新一代开源模型Gemma，轻量级高性能，助力AI创新

谷歌推出开源模型Gemma，这是一款轻量级、先进的开源模型，供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸，能够在不同的设备类型上运行，包括笔记本电脑...

大语言模型 # Gemma # 大语言模型 # 谷歌

1年前

07310

新框架VSP-LLM：通过观察视频中人的嘴型来理解和翻译说话内容

这篇论文介绍了一个名为VSP-LLM（Visual Speech Processing incorporated with LLMs）的新框架，它结合了视觉语音处理和大语言模型（LLMs），以提高视觉...

新技术 # VSP-LLM # 大语言模型 # 视觉语音翻译

2年前

07050

Cohere 推出了 Command A：高性能、低计算需求的大语言模型，为企业量身定制

今天，Cohere 推出了 Command A，一款专为企业设计的新型先进生成模型，旨在满足企业对快速、安全和高质量 AI 的高要求。Command A 在性能、效率和企业级功能上表现出色，是市场上最...

大语言模型 # Cohere # Command A # 企业

1年前

06990

新型图像生成模型家族LlamaGen：将大语言模型（Llama）应用到视觉图像生成领域

香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen，将大语言模型（Llama）中原用于文本生成的“下一个令牌预测”范式应用到了视觉图像生成领域。LlamaGen是对传统自回归模型在图...

新技术 # LlamaGen # 图像生成 # 大语言模型

2年前

06770

ComfyUI GeminiOllama Extension：将大语言模型及多种图像处理工具集成到 ComfyUI 中

ComfyUI GeminiOllama Extension是一款ComfyUI插件，此插件将 Google 的 Gemini API、OpenAI（ChatGPT）、Anthropic 的 Clau...

插件 # ComfyUI GeminiOllama Extension # 大语言模型

12个月前

06620

新型图像生成技术StrokeNUWA：利用大语言模型生成矢量图形

StrokeNUWA是一种新型图像生成技术，用于仅通过大语言模型（LLM）生成矢量图形，无需依赖专门的视觉模块。论文该方法的关键创新在于利用矢量图形固有的视觉语义，将矢量图形编码为"笔画"标记，这...

新技术 # LLM # StrokeNUWA # 大语言模型

2年前

06580

新型视觉模型训练方法SynCLR：完全从生成模型中学习，不需要任何真实数据

来自谷歌和MIT的研究人员提出一种新型视觉模型训练方法SynCLR，它完全从生成模型中学习，而不需要任何真实数据。 GitHub 论文 SynCLR的核心思想是利用大语言模型（LLMs）生成大量的图像...

新技术 # SynCLR # 大模型 # 大语言模型

2年前

06260

LoRA：为解决大语言模型微调而开发

微软的研究人员于2021年推出LoRA（Low-Rank Adaptation of Large Language Models，大语言模型的低阶适应），这是为解决大语言模型微调而开发的一项技术，用于...

新技术 # Lora # 大语言模型 # 微软

2年前

05990

字节跳动推出VAPO框架：让大语言模型在复杂推理任务中更高效

字节跳动Seed研究团队发布了一项名为 VAPO 的强化学习训练框架。这一框架专为提升大语言模型（LLM）在复杂、冗长任务中的推理能力而设计，特别是在数学推理和长链推理（Long Chain-of-T...

新技术 # VAPO # 大语言模型 # 字节跳动

12个月前

05880

MemOS：为大语言模型设计的长期记忆操作系统

MemOS 是由记忆张量科技联合上海交通大学、同济大学、浙江大学、北京大学等多所高校及研究机构联合开源的一项突破性研究成果——专为大语言模型（LLMs）设计的长期记忆操作系统。项目主页：https...

大语言模型 # MemOS # 大语言模型

9个月前

05740

加载更多