自动化学术推广系统AutoPR:让学术推广自动化,精准触达目标受众

大语言模型2个月前发布 小马良
36 0

学术研究的价值不仅在于成果本身,更在于被广泛知晓与合理应用。如今,同行评审研究数量持续激增,学者们愈发依赖社交平台发现前沿成果,而作者们也需投入大量精力推广研究,以维持学术可见度与引用率。

哈尔滨工业大学、中南大学、香港大学和字节跳动的研究人员联合推出自动推广(AutoPR)方案,核心是将学术论文转化为忠实于原文、吸引力强且发布时机恰当的面向公众的内容。为支撑这一研究,团队同步发布了PRBench多模态基准数据集,并提出PRAgent模块化代理框架,让学术推广实现高效自动化与可衡量的效果提升。

自动化学术推广系统AutoPR:让学术推广自动化,精准触达目标受众

核心亮点速览

  • AutoPR 任务:聚焦学术论文到通道感知推广内容的自动转化,重点优化保真度、对齐性与参与度三大核心指标。
  • PRBench 基准:收录512个专家精选的论文-推广帖子对,配备加权事实检查清单与人类偏好判断,为方案评估提供标准化依据。
  • PRAgent 框架:创新三阶段代理工作流,相比传统LLM与规则基线,实现观看时间提升604%、点赞数提升438%的显著成效。

PRBench:学术推广的标准化评估基准

要衡量自动化学术推广的效果,需要一套覆盖科学传播全生命周期的评估体系。PRBench通过专家精选的评分维度,从保真度、对齐度、参与度三个核心轴对推广内容进行全面评估,每个子分数均由三名训练有素的标注者分配,分歧通过协调统一,确保评估结果的可靠性。

1. 保真度:确保内容准确忠实

核心是检验推广帖子是否与源论文保持一致,避免信息失真:

  • 作者与标题准确性:验证论文归属是否正确,确保研究人员与论文标题得到准确突出。
  • 加权事实检查清单:依据专家编写的声明要点评分,重点关注高权重的科学贡献是否被完整覆盖。

2. 对齐度:适配平台规则与传播策略

判断推广内容是否符合目标平台的传播惯例,提升可发现性:

  • 上下文相关性:检查内容的语气、节奏和专业术语使用,是否契合目标受众的认知习惯。
  • 视觉-文本整合:评估标题与图像的搭配效果,是否能相互强化,适配平台信息流展示逻辑。
  • 标签与提及策略:审查标签选择是否合理,能否有效驱动内容被目标受众检索发现。
  • 平台兴趣:通过成对比较,判断哪类帖子更受平台原生受众偏好。

3. 参与度:增强内容吸引力与说服力

测试推广内容能否引发目标受众的主动参与:

  • 参与钩子强度:评估内容开头是否具备足够吸引力,能否快速抓住受众注意力。
  • 逻辑吸引力:衡量叙述的清晰度与流畅性,确保受众能轻松理解研究核心。
  • 视觉吸引力:评估配图的原创性与信息密度,是否能辅助传递核心研究内容。
  • 行动号召分数:检查内容是否能引导读者采取有意义的后续行动(如查阅原文、参与讨论等)。
  • 专业兴趣与更广泛兴趣:通过成对比较,分别衡量内容对专家受众与公众受众的吸引力。
自动化学术推广系统AutoPR:让学术推广自动化,精准触达目标受众

PRAgent:三阶段实现高效自动化学术推广

PRAgent是AutoPR方案的核心执行框架,通过模块化代理协作,分三个阶段完成学术推广内容的自动化生成与优化,全程减少人工干预,提升推广效率。

第一阶段:内容提取

对长篇学术论文进行分层解析与浓缩,提炼核心观点、研究方法与关键结果,同时将论文中的视觉元素(如图表、示意图)与核心标题进行精准配对,为后续内容生成奠定基础。

第二阶段:多代理合成

由专业代理团队协同工作:一部分代理负责起草逻辑连贯的叙述内容,确保研究成果的完整呈现;另一部分代理专注分析视觉元素的表达效果,并优化内容语气,使其既专业又具可读性,最终形成出版级别的输出内容。

第三阶段:平台特定适应

通过协调代理,针对不同社交平台的传播规范与用户偏好,定制专属推广策略:包括优化内容开头的吸引力钩子、筛选精准标签、调整叙述节奏,最大化内容在目标平台的覆盖范围与传播效果。

自动化学术推广系统AutoPR:让学术推广自动化,精准触达目标受众

评估结果:成效显著,优势突出

团队通过PRBench基准测试与RedNote平台10天真实部署验证,全面评估了AutoPR方案的性能,结果显示其优势明显。

1. 传统LLM在学术推广中的局限性

直接使用前沿LLM生成学术推广内容,仍存在三大核心问题:

  • 事实差距明显:数值、方法论和术语错误占比超90%,难以精准保留论文的核心贡献。
  • 参与策略单一:反复使用通用钩子,未针对目标受众定制,逻辑与视觉吸引力不足。
  • 平台适配不足:生成标签与专家标签的Jaccard相似度仅为0.0347,与学术社区的发现机制契合度低。

2. PRAgent框架的性能提升

  • 跨模型普遍适用:在12个竞争性LLM骨干上均实现性能提升,至少增加7.15个百分点,使用GPT-5-mini时提升超20点,平均分数达到70年代中高位。
  • 三阶段协同增效:消融实验显示,平台适应阶段将对齐度从71.36提升至79.38,结构化内容提取将保真度从66.38提升至70.76,每个阶段均为整体效果提供关键支撑。
  • 真实场景表现优异:在RedNote平台的测试中,PRAgent驱动的账户相比直接使用GPT-5的基线账户,总观看时间增加604%,个人资料访客增加575%,点赞、保存和分享数据持续领先,且两者消耗的模型预算相同,验证了框架设计的高效性。
  • 用户偏好度高:与人类作者生成的内容相比,AutoPR生成的内容在用户偏好研究中胜出比例高达64.8%。
© 版权声明

相关文章

暂无评论

none
暂无评论...