
新neTV
neTV 是一个轻量级、自托管的 Web 界面,专为播放 IPTV 流而设计。它不提供任何内容,只负责播放你已有的 IPTV 源——无论是 Xtream Codes API 还是 M3U 播放列表。
如果你正在从事自然语言处理、机器学习或语料库构建工作,YouTube 是一个丰富的真实语言来源。然而,手动收集视频字幕和相关信息既耗时又低效。
为此,开发者kaya70875推出了 YTFetcher ——一款基于 Python 的开源工具,支持从 YouTube 频道批量提取视频字幕及其结构化元数据,包括标题、发布日期、描述和缩略图链接。

整个流程自动化,适用于需要大规模文本数据的研究者、开发者和数据工程师。
| 功能 | 说明 |
|---|---|
| 📝 批量获取字幕 | 支持从单个或多个视频提取自动字幕(auto-generated)或上传字幕(manual captions) |
| 🧾 提取完整元数据 | 包括视频标题、描述、发布时间、观看次数、视频ID 和缩略图 URL |
| 💾 多格式导出 | 可将结果保存为 CSV、TXT 或 JSON 文件,便于后续分析与建模 |
| ⚡ 异步抓取 | 使用异步请求提升获取效率,减少等待时间 |
| 🖥️ 命令行接口 | 提供 CLI 操作方式,易于集成到脚本或自动化流程中 |
该工具基于 youtube-transcript-api 和 pytube 等库构建,无需官方 YouTube Data API 密钥即可运行(但需注意使用合规性)。







