习惯了语音输入后,再也不想打字了
2026年4月4日 · 5505 字 · 11 分钟 · #好玩系列
开启口喷时代把,本文主要分享我为什么会使用语音输入法?为什么会选择 Typeless?现在给我带来了哪些正向的反馈。
我最早使用语音输入法是在 2024 年,当时微信输入法上线了语音输入功能,那个时候的功能还相对比较简单,只要我进行输入,它就会把我想说的内容原封不动地转写出来,当时的核心要求就是准确度高。
但是我发现对语音输入的使用场景稍有限,大多数时候,都是在不方便打字的时候回复消息,或者面对相对熟悉的人时才会用,还不敢全面使用,因为总觉得对方的阅读体验可能不太好。
应该是从去年开始,随着 AI Agent 的发展,现在语音输入法也在慢慢爆火。到现在为止,之前在 Twitter 上看到,已经有几十款与语音输入相关的产品出现。对于编码和写作来说,「口喷」真的是一个非常方便的输入方式,它不需要码字,只需要表达自己的想法即可。
我在上一篇文章里提到,我最近变化就是开始深度尝试使用语音输入法。市面上的产品很多,我就不再过多赘述。今天主要是想分享一下,语音输入法是什么,我为什么要用语音输入法,以及语音输入法在现阶段给我带来了哪些正反馈。
第一部分:语音输入法是什么
由于我在 2024 年的时候养成了一个坏习惯,不太喜欢在记录时添加图片。文字可以相对准确地描述信息,再加上稍微做一下检索,就能够方便地找到对应的产品,所以我不想在内容中放入太多图片。
语音输入法操作是最简单的,只要打开输入法,点击语音输入按钮就可开始说了。估计我们所有人都用过,在微信聊天窗口支持语音输入,我们可以将微信的语音输入看作是最早的雏形,而现在的语音输入法发展极快,现在的输入法已经非常完善了。
现在,电脑和手机上都有很多此类产品。因为我使用的是 iOS,目前使用的是Typeless,先后用过微信输入法、豆包输入法、闪电说;不考虑其他因素,豆包语音的准确度确实比微信更高,尽管我们多次在微信输入法内群反馈,目前准确度依旧一般。
语音输入的打字效率要比文字输入更快。无论你是双拼还是五笔,应该都没有语音输入快,毕竟你还需要敲键盘,我只需要正常说话就行,而且还能自动加上标点符号,比我专业。比较惭愧的是,我到现在为止都没有习惯双拼。
它会促使我减少在表达过程中的一些陋习。虽然是语音输入,但是最终呈现的方式是文字,所以需要注意一些书面表达。类似“然后,接着,然后”这种口头习惯,一旦通过文字的形式呈现出来就会很不雅,所以在开始进行语音输入的时候,就会先有几秒钟想一下自己准备说什么。
针对长文本回复,语音输入后转文字要比文字输入后更方便调整。这个有点反常识,因为文字输入后调整看起来更快,但我自己实际用下来发现,语音转文字之后调整内容确实更快一些,这个主要场景是写日记的时候。
当然,语音输入也有一些很难解决的毛病。比如同音字很难识别出来,常见的就是“他她它”,但我想说“它”的时候就比较难,需要结合上下文才能理解,此外还有“的得地”。还有中英文混输也很难,这里面还包括拼音。若是英文,需要对单词发音相对准确;若是拼音,就需要后续直接调整。(截止2024年的使用体验)
直到我现在用到了一款叫作 Typeless 的软件,大概是从 2026 年 1 月份年后开始深度使用(设置为默认输入法)。这款软件的好处在于你不需要设置任何模型,打开就开始说,说完之后,它会对内容进行简单的处理,去掉一些错误的词汇或语气词。
**真正感受语音输入法的魅力是电脑端。**正常逻辑下,Mac 的输入法切换键是固定的快捷键,语音输入通常只是输入法中的一种模式。但 Typeless 不一样,它是一个单独的 App,授权之后可以在任意窗口通过快捷键直接调用,它不需要切换输入法,不影响当前的文本输入流,还可以实现一边说话一边打字。
这种体验非常棒,Typeless 给我的体验非常出色,我体验下来,最核心的两点优势就在于自动去语气词和实时纠错与重构。 自动去语气词是它的第一步,能让表达更准确。实时纠错与重构则更有意思,说话和打字不一样,说话时想法很快。如果我突然发现前面说错了,我可以直接跟 Typeless 说,我前面有一段说错了,你帮我纠正一下。它并不会把这句指令直接转成文字,而是会根据我的指令,直接把我前面的内容修改正确。
这就是 AI 让语音输入法变得好用的最核心原因。
当然,它也会有一些不太好的地方。比如网络要求,由于是国外的软件,它对网络环境有一定要求。我不太清楚它底层使用的是什么模型,但说完内容后,通常会有 1-2 秒的加载延迟;再比如价格较高,这个软件的费用比较贵。它早期的限额是每周 4000 字,当时为了够用,我分别在电脑和手机上各登录了一个账号。因为这两个账号的信息不互通,所以我每周相当于有 8000 字的额度。最近两周,官方把限额改成了每周 8000 字,于是我切回了一个账号。但即便如此,我发现额度仍然不够用。比如这周才到周二,我就已经说了 6000 多字,那剩下的半周该怎么办呢?
所以我在这周选择了付费。它的原价是每年 998 元,但如果你有学生证或者通过其他方式,可以拿到五折优惠。我收到的邮件显示,这个五折优惠的有效期长达 8 年。最后我花了 400 多元买了一年。我觉得这个价格对于提升效率来说是非常划算的,它让我更愿意、也更容易去进行内容输出了。
关于什么是语音输入法以及 Typeless 的一些简单介绍,这部分就 OK;因为 Typeless 是我常用核心的软件,我就不再去说别的哪些软件好,哪些软件不好了,萝卜青菜,各有所爱,感兴趣自行了解即可。
第二部分:我为什么要用语音输入法
最直观的一个原因,就是我发现语音输入会让我的输出变得非常高效。我只需要负责说就可以。不需要去想我这个组织语言对不对,这个想法 OK 不 OK 等等。因为我的核心目的是为了表达我的需求,表达我的想法。
在表达我的需求和想法的时候,我不需要有太多的影响因素在。比如说打字的时候,有可能打字打不出来或者说不对;然后有可能我想到了很多很多内容,但是我打字的话就很慢。这个效率的过程我是有点难以接受的。所以我就希望以不停下来的方式一直说,这样我的注意力就不会被打断。我就可以通过语音的方式,不需要先审查自己的表达,也不需要把一句话说得是不是很漂亮。最核心的是记录和让这段内容留下来。
举一个场景,比如我在写日记的时候,以前我可能会去想,我今天大概的日记大纲要怎么写,内容要怎么写,我是不是这么写不合适,我还有哪些没想到的。但我最近写日记,可以在打开日记软件和语音输入法 Typeless 之后,从头说到尾。说完之后可能就是一千字,我能快速地把这一天回忆的内容和想法都写进去。哪怕针对一个主题去描述和书写,我也能很快地将想法呈现出来。它不需要有太多的修饰,Typeless 就会把我的想法进行整理,输出的内容几乎 90% 都能满足我的需要了。
再有一个场景,我最近在 Coding 的投入会比较多,在描述需求和想法的时候,我并没有太多地去逐一整理。我只要知道提示词的框架是怎样的,知道我的想法内容是什么,它的边界、标准、背景等信息,我就可以通过这样一套框架去描述我的需求。
打开 Coding 软件,它能自动生成文件夹,自动进行编码。我再去修饰和调整,比如样式不对、逻辑不对,我同样可以通过这种语音表达方式,很快地描述出修改内容。但如果一旦去打字,我的效率就会很慢。所以,对于效率的追求,是我在用语音输入法当中一个很核心的点。
第二个原因在于,我的普通话和英语发音中的一些单词都不够标准,但是我希望输出是准确的。如果我去打字,或者在这个过程中,我可以通过 Typeless 帮我做一些修正,让我的内容尽可能表达正确。比如 Claude Code,就是一个很常见的情况(容易识别为 Cloud Code)。打字时有些英文单词很长,我没办法快速打出来。比如谷歌的那个编码软件 Antigravity,它就很长,去记这个单词很难记。
如果用语音输入,我只需要把我大概意思正常说出来就好了,我的输入法会自动帮我进行校正,让单词变得正确,它也会让我的语言格式更加准确。这种体验是在传统的文本输入过程中所没有的。
第三个原因,是我发现语音输入法有一个功能,叫做“输入历史”,也就是进行语音输入时,所有说的话都会被记下来。
以 Typeless 为例,这些数据是存在本地的。我在电脑中写了一个 Skills 脚本,用来读取并解析本地数据,进而生成我想要的内容。目前这个 Skills 已经发布了,感兴趣的话可以去尝试一下。这个功能的价值在于帮我做了很好的语料积累。传统的文字输入,内容发出后,只存在于你和对方的聊天记录或特定的记录文档中。语音输入法则更像一个记录工具。虽然不是所有软件都有,但我用的这款可以把我所有说的话,可能是一句话,也可能只是一个词,全部记下来。
这些导出的语料对我来说非常有价值。在 AI 时代,我更重视个人原始语料的积累。把这些内容拿到后再喂给 AI,它会帮我理解我之前说过的内容。我过往的一些经历、思考和想法都会被重新翻寻出来,这非常有意思。
语音输入除了是一个更快的输入方式,它其实还在放大我原本就有的思考方式。因为它更接近我自己,更接近我真实的表达方式。它不会让我在进行记录和表达的时候被结构绑住,也不会让我去考虑太多的修辞。它能把我原本那些零散的想法先记录下来,让这些碎片变成素材。然后这些素材就自然而然地成了一种记录方式。后续我会把这些记录转化成可以复用的、属于我自己的数据资产。
第三部分:语音输入法带给我的正反馈有哪些?
很重要的一个正反馈其实是 AI 给我的。它能让我了解自己在语音输入或思考问题时,表达方式上存在哪些问题。这主要依赖于我记录下来的内容,我将这些内容提供给 AI 进行分析。
我把 Typeless 的记录导了出来。虽然这个账号导出的内容只有 300 多条,并不完整,因为早期我没发现可以设置为全部保存历史记录,而且这只是我家里的电脑,我最核心的记录其实更多分布在手机和公司的电脑上,公司那边更多是工作内容,但我今天还是把家里电脑导出的这 300 多条信息给到了 ChatGPT,让它帮我进行整理。
我问了 ChatGPT 几个问题。如:我需要了解我的表达逻辑是什么,我所关注的核心主题大概有哪些,对此有哪些建议,以及对对于我的表达方式有哪些改进建议。
在看完这份整理后的报告,发现它与我的实际情况吻合程度非常高,差不多在 90% 以上。
ChatGPT说:
1,从表达方式上看,你有几个比较稳定的特征。第一,你天然是目标导向的,表达往往不是为了抒情,而是为了推进事情,哪怕是闲聊,最后也会落到怎么做、放哪里、如何调用、怎样更高效上。第二,你很在意结论优先、重点突出,也天然反感过度冗余和形式化的罗列,所以你会反复强调减少有序列表,更多用段落把意思讲完整。第三,你习惯边说边校准,发现偏了就立刻修正,这说明我的判断并不慢,反而很快,只是很多时候快于表达本身。
2,这也恰好说明,你的表达能力其实有明显优势。 一个是抽象能力强,很多生活或工作里的小问题,你会自然上升到原则层。另一个是校准能力强,你通常知道“不对”具体不对在哪,不只是模糊地不满意。再一个是你对“有用”很敏感,知道什么信息值得长期保留,什么只是当下噪音。这类能力放在语音输入里反而更容易被看见,因为语音保留的是原始思路,而不是事后加工过的体面。
3,当然,也有值得改进的地方。最主要的一点,是你常常把思考过程说得比最终指令更长。这样做的好处是真实,坏处是容易让协作者先接住枝叶,错过主干。所以后续你更适合做一个小调整,先讲结论,再讲标准,最后补背景。 比如先说你要什么,再说做到什么算完成,最后再补充你为什么在意这个。这样不会损失你的思考密度,反而能让别人更快进入你的轨道。
4,另一点是,你可以把那些高频出现的价值判断,慢慢沉淀成固定词库,比如准确第一、结论优先、减少冗余、真正痛点、可持续、经济效应、社会效应。等这些词越来越稳定,你的表达就会更像你自己,也更容易被 AI 和记忆系统持续继承。
语音输入法给我的正反馈,已经不只是“说得更快”这么简单了。它让我更接近自己,也让我更容易看见自己。它保留了我的原始判断,也暴露了我真正重要的东西。后续要做的,就是让这种真实更早收束,更容易复用。这样,表达就不只是输出,它会慢慢变成我自己的方法论。
从这个角度看,语音输入法确实已经不只是一个输入工具。它一方面提高了我的效率,另一方面也帮我完成了语料积累、表达校准和思维复盘。在 AI 时代,这件事情的意义会越来越大。因为你留下来的每一段原始表达,未来都有可能成为理解你、辅助你、继承你思考方式的一部分。
由于 Typeless 的手机和电脑目前都不支持导出历史记录,电脑端我是用自己写的一个 Skill 来完成的,但手机端目前还不支持。我给他们提了反馈,他们给我的回复是会将此作为考虑因素之一。我也蛮期待他们后续能够优化完成,这样的话,我多个设备的信息就可以进行合并了。
还有一些习惯上的调整和变化。
在文字打字的时候,其实我们对声音以及对自己说话的语气不会有太多的感受。但语音输入的过程,会让我去理解和听到我表达的声音是否标准(特别是普通话,因为我的普通话肯定不是严格标准的)。
为了让准确度提高,我在说话的时候需要尽可能让表达更加符合上下文,更加准确。这样我在后续校验和调整的环节工作量就会降低,效果也会很好。因为打字是感受不到这个过程的,所以每一次语音输入,其实都是一次“微表达”的训练。
所以我现在会觉得,语音输入法,确实是 AI 时代非常强的工具。它让我更愿意表达,也更容易表达。更重要的是,它让我说出来的东西,不再只是飘过去的话,而是能留下来、被整理、被理解、被继续调用的内容。
题外话,前两天在一个群里看到大家对于 AI 生成的内容会有一些「争议」。其实这篇文章是我通过 Typeless 输入后得到的输出,并且我在这个基础上进行了结构和部分内容的微调,或者说进行了更符合我习惯的结构优化。但所有的内容都是语音输入的。那语音输入经过提示词(Prompt)微调之后,算不算 AI 生成的呢?我不知道,但这个事情确实没必要去过度考量和判断,因为我只需要让我的想法表达出来就好了。
作者:DemoChen
链接:https://demochen.com/posts/20260404/
声明:除非另有声明,本文均采用 CC BY-NC-ND 4.0
协议,转载请注明
赞助:若你觉得本文对你有启发,非常欢迎你成为我的 Sponsor ,感恩遇见