VideoRAG

当前的大语言模型（LLMs）在处理短视频时已表现出强大能力，但面对数小时甚至跨集的长视频（如讲座系列、纪录片、剧集），它们往往力不从心——上下文窗口有限、计算成本高、跨场景语义断裂。 GitHub：h...

2个月前

0350