对研究人员而言,撰写论文只是第一步。在会议展示阶段,如何将复杂的研究内容浓缩成一张信息清晰、视觉美观、叙事连贯的学术海报,是一项耗时且需要设计经验的任务。
尽管已有自动化工具尝试解决这一问题,但大多数方法仅关注内容迁移,忽视了排版逻辑、视觉层次与美学一致性,导致生成结果仍需大量人工调整——这不仅削弱了效率优势,也限制了其实际可用性。
为突破这一瓶颈,来自石溪大学、纽约大学、不列颠哥伦比亚大学、浙江大学和加州大学洛杉矶分校的研究团队提出了 PosterGen ——一个基于大语言模型(LLM)的多智能体框架,旨在模拟专业海报设计师的工作流程,从内容组织到视觉呈现全流程自动化生成高质量学术海报。
- 项目主页:https://y-research-sbu.github.io/PosterGen
- GitHub:https://github.com/Y-Research-SBU/PosterGen
- Demo:https://huggingface.co/spaces/Y-Research-Group/PosterGen
该系统不仅能准确提取论文核心信息,还能遵循设计原则完成布局规划与风格设计,最终输出可直接用于会议展示的成品海报,大幅减少人工干预。

为什么自动做海报这么难?
学术海报不同于普通PPT或文档,它需要在有限空间内实现三个目标:
- 语义保真:准确传达研究动机、方法、结果与结论;
- 叙事清晰:引导观众按逻辑顺序理解内容(如“问题—方法—结果”);
- 视觉友好:通过排版、色彩、留白等设计手段提升可读性与吸引力。
现有工具往往只解决第一点,而将后两点留给用户手动完成。根本原因在于:设计不是装饰,而是一种结构化决策过程。
PosterGen 的核心思路是:将专业设计师的思维过程拆解为多个可执行的智能体模块,通过协作完成端到端生成。
系统架构:四个智能体,各司其职

PosterGen 采用四阶段多智能体架构,每个智能体专注于特定任务,并嵌入相应的设计原则作为约束条件:
1. 解析器与策展智能体(Parser & Curator Agent)
- 功能:读取输入论文(PDF),提取文本段落、图表、公式等关键元素。
- 创新点:使用“ABT叙事结构”(Assertion-But-Therefore)组织内容流:
- Assertion:我们做了什么?
- But:遇到了什么挑战?
- Therefore:我们如何解决并得出结论?
- 输出:结构化的故事板(Storyboard),定义各部分内容的逻辑顺序。
这一结构确保海报具备清晰的叙事主线,避免信息堆砌。
2. 布局智能体(Layout Agent)
- 功能:将故事板映射为空间布局。
- 设计约束:
- 采用三栏式布局,符合人类自然阅读习惯;
- 引入类CSS的盒模型(Box Model)管理元素间距与对齐;
- 动态计算每个模块高度,避免内容溢出或空白过多。
- 输出:带有位置、尺寸、层级关系的布局方案。
3. 风格智能体(Stylist Agents)
- 包含两个子模块,分别处理视觉与文字表现:
颜色智能体(Color Agent)
- 分析论文主题与图表色调,生成主色+辅色+强调色的协调配色方案;
- 遵循对比度标准,确保文字可读性。
字体智能体(Typography Agent)
- 构建三级排版体系:
- 标题(大字号、加粗)
- 小节标题(中等字号)
- 正文(清晰易读字体)
- 控制行距、段间距,增强信息层级。
4. 渲染器(Renderer)
- 接收所有元数据(内容、位置、样式),调用
python-pptx生成标准 PPTX 文件; - 支持导出为高分辨率 PNG,适配打印与数字展示需求。
整个流程无需人工干预,平均生成时间在2分钟以内。
评估方式:用视觉-语言模型打分
传统评估多依赖人工评分,成本高且主观性强。为此,团队提出一种基于视觉-语言模型(VLM)的自动化评分机制,作为“虚拟专家评审”。
该机制从两个维度评估生成海报:
1. 内容质量
- 是否完整覆盖论文关键信息?
- 叙事是否连贯?有无事实错误?
- 文本密度是否适中?有无信息过载?
2. 设计质量
- 布局平衡:元素分布是否均匀,有无严重偏重?
- 可读性:字体大小、颜色对比是否利于远距离阅读?
- 美学一致性:配色、字体、图标风格是否统一?
- 设计原则应用:是否体现对齐、邻近、重复、对比四大基本原则?
VLM 被提示以“专业设计师”身份打分,结果与人工评估高度相关(ρ > 0.85)。
实验结果:内容不丢,设计更优
在多个真实论文数据集上的测试表明,PosterGen 在保持内容保真度的同时,显著提升了设计质量。
| 指标 | PosterGen 表现 |
|---|---|
| 内容准确性 | 与人工设计相当,优于基线方法12.3% |
| 布局合理性 | VLM评分提升21.6% |
| 风格一致性 | 配色与字体协调性得分提高28.4% |
| 整体美学 | 平均得分领先现有方法近两个等级 |
尤其在跨领域论文(如生物信息学、机器人学)上,PosterGen 展现出良好的泛化能力,生成的海报可直接用于会议张贴,仅需极少量调整。
此外,在用户调研中,87%的参与者认为 PosterGen 生成的海报“接近或优于自己手工制作的初稿”。















