蛐蛐 (QuQu) 忍不住想打赏开发者!完爆各种付费软件!

前言

作为一个重度懒癌患者,信奉的人生第一准则就是:
能动嘴的,就绝不动手!
所以手机上基本都是用的语音转文字输入,爽得飞起~

但每次想在电脑上找一个同样省心省力的工具时,都感觉像是在粪坑里淘金。

要么就是贵得离谱,要么就是识别率跟“人工智障”似的,折腾半天下来,手动打字的效率都比它高!
就在我心灰意冷,准备向键盘投降的时候。没想到还真让我发现了一个“金子”。

它就是:🦗,一款AI模型加持下的智能语言工作流!

蛐蛐 (QuQu)

蛐蛐是一个AI加持的免费开源语音智能转文字软件。在它之前,圈子里最出名的扛把子叫 Wispr Flow。
而「蛐蛐」则完全可以当做是它的“中文版”,不仅做到了完全免费,而且所有数据都在你自己的电脑上跑,安全又省心!

虽然口号喊得山响,但作为被“人工智障”们反复折磨过的老病号,我可没那么容易相信。

我决定先试试它的基础功能,给它念一段长句子 👇
关于下个季度的市场推广策略,我认为我们应该重点关注社交媒体渠道的精准投放,同时结合线上线下的联动活动,以确保能够最大限度地覆盖我们的目标用户群体。

确实有点东西,连标点符号都安排得明明白白。最关键的是,我这边话音刚落,那边字就蹦出来了,还挺跟嘴。
这都要得益于阿里巴巴的 Paraformer 模型,对中文的语境理解可以说是相当到位。这个AI模型让蛐蛐变成了最能听懂“中国宝宝体质”的音转文字软件

无论我们说的话里有多少黑话、名梗,它都能原封不动地识别出来。
我跟你们说,今天这个Bug真是绝绝子,搞得我头都大了,我真的会谢,整个就是一个大写的栓Q。

最后一点也是我最喜欢它的一点。
我们平时说话,难免会带一些“嗯、啊、那个”的口头禅,或者中途说错话再修正。以前的语音软件会把这些都记下来,后期整理很麻烦。
而蛐蛐的AI优化功能就能很好地解决这个问题。
嗯……那个,我们会议定在,呃,周三下午…啊不对不对,是周四,周四下午三点,地点就在那个……三号会议室。

我原以为屏幕上会是一堆需要修改的文字。结果,它直接给了我一个干净的版本 👇

这个功能真的非常实用。它让你在想到什么就说什么的同时,不用担心输出的文字乱七八糟。你只管自由表达,它会帮你整理好。

当然说了这么多还没有讲最最关键的一点,那就是如何使用蛐蛐

不过莫理在这里还是强烈建议用方案二,使用系统Python。莫理在使用方案一的时候遇到了各种各样的问题
这几样都装好后,我们就可以正式开始了。全程复制粘贴,别有压力

# 1. 克隆项目
git clone https://github.com/yan5xu/ququ.git
cd ququ

# 2. 安装 Node.js 依赖
pnpm install

# 3. 创建虚拟环境 (推荐)
python3 -m venv .venv
source .venv/bin/activate  # Linux/macOS
# .venv\Scripts\activate   # Windows

# 4. 安装 Python 依赖
pip install funasr modelscope torch torchaudio librosa numpy

# 5. 下载 FunASR 模型
python download_models.py

# 6. 启动应用!
pnpm run dev

当所有的命令都结束后,蛐蛐就会直接出现在你的桌面上。现在,基础的语音转文字功能已经可以用了

这样,「蛐蛐」就能连接到大语言模型,成为一个真正懂你、能帮你整理思路的AI智能语音助手了。

从此键盘就是路人 图片
开源地址:https://github.com/yan5xu/ququ

转自:https://mp.weixin.qq.com/s/5dW7LkbCkXEf72K6sqKpYQ

文章版权归原作者所有或来自互联网,未经允许请勿转载。如有侵权请联系我删除,谢谢!
THE END
分享
二维码
打赏
< <上一篇
下一篇>>
文章目录
关闭
目 录