蛐蛐 (QuQu) 忍不住想打赏开发者!完爆各种付费软件!
前言
作为一个重度懒癌患者,信奉的人生第一准则就是:
能动嘴的,就绝不动手!
所以手机上基本都是用的语音转文字输入,爽得飞起~
但每次想在电脑上找一个同样省心省力的工具时,都感觉像是在粪坑里淘金。
要么就是贵得离谱,要么就是识别率跟“人工智障”似的,折腾半天下来,手动打字的效率都比它高!
就在我心灰意冷,准备向键盘投降的时候。没想到还真让我发现了一个“金子”。
它就是:🦗,一款AI模型加持下的智能语言工作流!
蛐蛐 (QuQu)
蛐蛐是一个AI加持的免费开源语音智能转文字软件。在它之前,圈子里最出名的扛把子叫 Wispr Flow。
而「蛐蛐」则完全可以当做是它的“中文版”,不仅做到了完全免费,而且所有数据都在你自己的电脑上跑,安全又省心!
虽然口号喊得山响,但作为被“人工智障”们反复折磨过的老病号,我可没那么容易相信。
我决定先试试它的基础功能,给它念一段长句子 👇
关于下个季度的市场推广策略,我认为我们应该重点关注社交媒体渠道的精准投放,同时结合线上线下的联动活动,以确保能够最大限度地覆盖我们的目标用户群体。
确实有点东西,连标点符号都安排得明明白白。最关键的是,我这边话音刚落,那边字就蹦出来了,还挺跟嘴。
这都要得益于阿里巴巴的 Paraformer 模型,对中文的语境理解可以说是相当到位。这个AI模型让蛐蛐变成了最能听懂“中国宝宝体质”的音转文字软件
无论我们说的话里有多少黑话、名梗,它都能原封不动地识别出来。
我跟你们说,今天这个Bug真是绝绝子,搞得我头都大了,我真的会谢,整个就是一个大写的栓Q。
最后一点也是我最喜欢它的一点。
我们平时说话,难免会带一些“嗯、啊、那个”的口头禅,或者中途说错话再修正。以前的语音软件会把这些都记下来,后期整理很麻烦。
而蛐蛐的AI优化功能就能很好地解决这个问题。
嗯……那个,我们会议定在,呃,周三下午…啊不对不对,是周四,周四下午三点,地点就在那个……三号会议室。
我原以为屏幕上会是一堆需要修改的文字。结果,它直接给了我一个干净的版本 👇
这个功能真的非常实用。它让你在想到什么就说什么的同时,不用担心输出的文字乱七八糟。你只管自由表达,它会帮你整理好。


# 1. 克隆项目
git clone https://github.com/yan5xu/ququ.git
cd ququ
# 2. 安装 Node.js 依赖
pnpm install
# 3. 创建虚拟环境 (推荐)
python3 -m venv .venv
source .venv/bin/activate # Linux/macOS
# .venv\Scripts\activate # Windows
# 4. 安装 Python 依赖
pip install funasr modelscope torch torchaudio librosa numpy
# 5. 下载 FunASR 模型
python download_models.py
# 6. 启动应用!
pnpm run dev
当所有的命令都结束后,蛐蛐就会直接出现在你的桌面上。现在,基础的语音转文字功能已经可以用了
这样,「蛐蛐」就能连接到大语言模型,成为一个真正懂你、能帮你整理思路的AI智能语音助手了。
从此键盘就是路人 图片
开源地址:https://github.com/yan5xu/ququ
转自:https://mp.weixin.qq.com/s/5dW7LkbCkXEf72K6sqKpYQ


共有 0 条评论