AI Video Transcriber 一键视频转文字,30+ 平台可用,离线免费!
前段时间看到个有意思的现象,好多人收藏了一堆 YouTube 教学视频、B 站 up 主讲座。
但想要找出来时,只能凭记忆翻来翻去,而且想快速定位到视频某句话或某个概念,更是麻烦,总不能一条一条视频观看。
直到最近,在 GitHub 上看到一个叫 AI Video Transcriber 的开源工具,专门可以用来解决这个问题。
它能把 YouTube、TikTok、B 站等 30 多个平台的视频,直接一键转成文字稿。
还能用 AI 自动修正错字、补全句子、智能分段,甚至能生成多个语言摘要。
相当于把视频内容整理成一份可读性不错的文档,后面我们想找什么样的内容,直接搜关键词就行了。
多平台视频支持
支持 30 多个视频平台,包括 YouTube、TikTok、B 站这些常用的,甚至还支持 Facebook、Instagram 等等。
只需要把视频链接粘贴到输入框,一键就能进行视频文字转录,完全不用操心其它。
离线转录,隐私有保障
其次它转录功能用的是 Faster-Whisper 模型,完全可以在本地电脑离线运行使用。
视频下载和语音转文字的过程都在本地完成,不会把你的音频传到外部服务器。
同时支持 5 种不同大小的 Whisper 模型,从 tiny(39M) 到 large(1550M),可以根据自己的硬件配置来选。
AI 文字优化
接着转录出来的文字会经过 AI 处理,自动修正口语化表达里的错字、补全不完整的句子。
甚至还能根据内容智能分段,这样看起来就不是一大坨文字堆在一起,阅读体验会好很多。
多语言智能摘要
转录完之后,还可以选择生成中文、英文、日文等多种语言的摘要。
如果你选的摘要语言跟视频原语言不一样,它会自动调用 GPT-4o 进行翻译,这个还挺方便的。
除了以上视频转录、优化、总结一条龙服务外,该工具还有很多实用功能,比如:
实时进度跟踪:处理过程中能看到实时进度,从下载视频、提取音频、转录、优化到生成摘要,每一步都有显示。
手机端友好:界面做了移动端适配,在手机上用也挺方便的。
文件导出:转录稿、翻译稿、摘要都能下载成 Markdown 格式,想怎么用都行。
安装和使用
项目提供了 Docker 和本地安装两种方式,推荐使用 Docker 安装,只需要简单三步即可:
1、克隆项目到本地,复制环境变量模板文件;
2、在 .env 文件里填上你的 OpenAI API Key(这个是生成摘要用的);
3、运行 docker-compose up -d 启动服务。
之后打开浏览器访问 http://localhost:8000 就能用了。
使用流程也很直接,粘贴视频链接、选择摘要语言、点开始,然后就能看到实时进度,最后查看和下载结果。
写在最后
如果你平时会看不少教学视频、讲座、播客这类内容,想快速找到某个知识点或者整理成文字笔记,这个工具真的好用。
而且转录功能完全离线运行,隐私方面不用担心,转录准确度主要看视频音质和选择的模型大小,清晰的音频配合 medium 或 large 模型效果会更好。
不过需要注意的是,AI 文字优化和摘要功能需要 OpenAI API Key,会产生一定费用。
如果不需要这些功能,也可以只用基础的转录功能,这样就完全免费了,只是拿到的是 Whisper 原始输出的文字稿,没有优化和摘要。
总的来说,作为一个开源工具,它把视频转文字这件事做得还算完整。支持的平台够多,功能也比较实用,有这方面需求的可以试试看。
GitHub 项目地址:https://github.com/wendy7756/AI-Video-Transcriber
转自:https://mp.weixin.qq.com/s/A3cJ0CzyWqILULTXeYpNxA


共有 0 条评论