电话: 邮箱:

Z6·尊龙凯时「中国」官方网站 千问电脑版上线语音输入法:打工东说念主终于不错用嘴干活了

发布日期:2026-05-09 01:20 作者:admin 来源:未知 点击:121

Vibe Coding 火了之后,越来越多的东说念主选拔对着屏幕口述,而不是敲键盘,不少网友致使为此整出 AI 语音键盘。

本年 3 月,Anthropic 也给 Claude Code 加了语音模式,在终局输入 /voice,按住空格讲话,放手彭胀。很难想象,连「写代码」这种最依赖键盘输入的场景,都开动维持语音了。

既然写代码的东说念主都开动用嘴干活了,那我一个每天写著述、写决策、作念 PPT、整表格的打工东说念主,还在一个字一个字敲键盘,显著也不够高效,尤其是查数据要切三个页面,作念个讲演 PPT 要从找模板开动花三小时,整欢迎议纪要边听边记还漏一半。

究其原因,不是每个东说念主的理论抒发都那么好。哪怕也有一些 AI 输入法能解决,比如咱们之前先容过的 Typeless,每年光订阅费每年就得花 1000 块。

在信得过干活的电脑端,于今莫得和深度 AI 办公智商买通的语音进口。刚好,千问电脑版 / 网页版最近也上线了千问语音输入法,传奇奔着「用嘴干活」而来。并且千问电脑版如故全免费——不仅仅语音免费,它内置的通盘 AI 办公智商,所有这个词大开用。

别被输入法这个名字骗了

一开动,看到千问语音输入法这个名字,我下意志以为这便是一个识别准确率更好的 AI 输入法,扬弃我发现澈底不是一趟事。

千问语音输入法上手确凿莫得门槛。两个快捷键处罚一切,按住是语音输入,双击是让 AI 干活。Win 是右 Alt,Mac 是右 Command,你不错左证使用风气来建造唤起的快捷键。

你在 Word 里写文档也好,浏览器里看贵寓也好,钉钉里复书信也好,快捷键一按,语音进口浮出来。无谓切到千问客户端,无谓打开稀奇窗口。想问就问,想说就说。

千问语音输入法主要就两种使用姿势:按住开动语音输入,猜测什么奏凯说就行,千问帮你自动去涎水话、改革口误、生成结构化抒发。双击唤起语音指示,这时候你是在给 AI 派任务,比如查个东西、帮你复书信、生成文档。

打从一开动,它就不仅仅绸缪只作念一个「帮你打字更快」的输入法。你的嘴负责下达指示,它是一个核心接口,负责听懂、翻译、救援,让   AI   把活儿干完交给你。

讲话便是比打字好使

2026 年,我对一款语音输入法的要求,照旧远远不啻是识别准确率。「听得清」的逐字听写都是基操,更迫切的是相识我想抒发什么,再帮我组织好。

比如口述一段想法,它能保留我的意图,帮共事把妄言所有这个词过滤掉,口误也顺遂修正,吐出来出来的是干净、精粹、不错奏凯发出去的翰墨。

比如碰到决策延期这种事,也不错交给千问整理成一段暴露的书面抒发,而我只需要奏凯按住快捷键,随口反映给千问:

对于这个技俩的延期,我 ... 啊不合,我想说的是对于这个决策的调养,其实原定辩论是本周五委用,然则 ... 呃 ... 因为客户那边临时加了三个需求点,咱们评估了一下粗略需要多两天,是以 ... 不合,我的最终意思是:决策委用期间从本周五调养至下周三,原因是客户新增三个功能点,需要补充技艺评估,咱们容许下周三前一定提交第一版决策。

放手后扬弃就出来了,不错看到它自动删除通盘「啊不合」「呃」「然则」等口吻词,把我抒发的核心暴露整理了出来;对比老例的语音输入,只可逐字纪录,还要我方手动裁剪,千问语音输入法基本无需手动调养,就能奏凯发出去。

在一些更专科和复杂的技俩交流中,千问语音输入法就愈加实用了。

比如底下这个交流需求,提神看,我长按说了一大堆话后,终末还补了一句:将对于数据部分提前。

此次居品改版的核心宗旨是普及新用户的留存率。咱们在 onboarding 经由里加多了三个率领表情,把原来的五步走改成了三步走,还在每个节点加了程度指示。另外,咱们发现许多用户在第二步就流失了,是以把第二步的表单从 8 个字段缩减到 3 个必填字段。数据方面,改版后一周的留存率从 35% 普及到了 48%,次日留存普及了 12 个百分点。不外也有一个风险,便是表单精简后集聚的用户信息变少了,可能会影响后续精确保举的后果,这个需要合手续不雅察。终末是团队层面的融合,假想部在两周内出了两版决策,开荒部用了三天完成上线,全体节律如故很快的。嗯把数据那段放到最前边,然后分段给我

这里扬弃对比就更彰着了,只消千问听懂了「把数据那段放前边「」的指示,自动重排段落,我用嘴就完成了蓝本需要鼠标 + 键盘的操作。

▲   老例语音输入扬弃

▲   千问语音输入法扬弃

体验过程我还发现了一个让我惊喜的细节,千问语音输入法对于中英文夹杂的口述实质,识别超越到位。

这个函数的主要作用是处理用户登录时的 token 考证,最初会调用 validateToken 步履查抄 token 是否过时,淌若 expired 的话就复返 401,然后淌若是 valid 的话,再调用 getUserInfo 接口去拉取用户信息,终末把 userId 和 role 写进 session 内部。提神一下,这里有一个 edge case,便是当 token 是 refresh token 的时候,要走另外一条逻辑分支。

千问不单把通盘的英文术语都识别对了,并且还自动左证我的话分点输出,一目了然。

我还想共享一个对于实质创作家超越有匡助的用法,APPSO 每天早上都要开选题会,巨匠会有许多碎屑想法,一个热门表象、一个行业不雅察、一个趋势判断……

之前有些想法是散装的,不成体系,面前我不错奏凯在会上按住唤出千问语音输入法,让它将这些想法整理成大纲。比如这一大段我在会上对裁剪选题的反映认识,如下图所示:

轻放手后,一段防范的选题大纲就出来了,裁剪能稳稳接住我的反映,稍稍彭胀就能写出一篇深度分析稿件。终末的成文也附上给巨匠望望:苹果偷偷砍掉丐版 Mac mini,东说念主东说念主都要交「AI 税」的期间来了 。

单就语音输入这个维度,千问给我最大感受是,真就说多快多乱都不首要,归正输出的质地 AI 会兜底。

万物皆可 Vibe,一句话的事

语音输入仅仅第一步,千问语音输入法更大的价值是还能帮你干活。

上头提到了整理选题大纲,然后我就需要千里浸式写稿,但每次要查个数据和陈述,都得切到其他网页和期骗。这里千问语音输入法就很当然地出现了——它维持在职意软件、桌面全局唤起,无谓切换窗口,动动嘴就能奏凯查。

比如我在写一篇对于 OpenAI 的著述时,Z6·尊龙凯时「中国」官方网站刚好有一段要援用最近的融资金额和投资方。我双击唤起语音指示,说一句:「帮我找一下 OpenAI 最新融资布景。」

想考一两秒,千问小窗就奏凯弹出把防范扬弃发我了,我看着援用陆续写,心流就不会被打断。

假期刚纪念,一大堆使命等着鞭策,我需要整理一个暴露的周报,但又没期间徐徐敲字,于是双击并随口将把需求说了出来,内部夹杂着带着大宗理论抒发:

诶阿谁,我讲演下这周程度哈…… A 技俩面前跟进到第三阶段了,中间遭遇了供应商委用延长,粗略迟了三天,其后通过加班把程度赶纪念了…… B 技俩还在需求评审,居品那边原型图有点暗昧,约了下周一早上十点对都……下周还要央求两台测试服务器……你帮我整理为周报 word 文档,口吻专科极少,层次暴露。

此外,千问语音输入法还有一个更有利思的功能——帮你复书信。

我每天频频需要在微信、钉钉、飞书等各式技俩群里穿梭,回话各式音信。极度耗尽元气心灵,这时候我就能让千问让我的「嘴替」了。

比如假期还没过完就被共事催交著述,我就双击让它帮我来一段高情商回话。

▲   我无需给它先容布景,它就能左证屏幕实质补充陡立文,给我一个「颖悟」的回话

而在一些靠近客户或者更肃穆的样式里,我也不错双击让它给我拟一个多礼的回话。

这是因为千问语音输入法维持了「场景感知」。它自动识别你现时在什么期骗里,看到你屏幕上的实质,据此调养输出的作风。你无谓告诉它更多布景,它我方就能看懂。

下周要出差,我奏凯双击,在微信让它帮我左证聊天信息,整理成一个出行指南便签。

终末给我的这份出行指南,除了航班信息,还贴心性给我整理了待劳动项,并左证当地天气和交通情况给了我一些具体薄情,这对于频频出差的媒体东说念主来说十分友好。

开周会的时候我还发现了一个实用的小手段,会议开动,我双击两下唤起千问语音输入法,收尾后一句:「帮我把刚才的实质整理成会议纪要。」它就自动帮我整理好了。

这很合乎一些快速拉通的临时会议,无谓再单独打开会议纪录类的期骗,唾手双击随即记。

对着电脑讲话,活儿 AI 我方就干结束

别诬陷,对着电脑喊「帮我查贵寓」「写个邮件」,面前只可算 AI 的基本操作。

千问 电脑端此次信得过亮出的底牌,是把语音输入和 PPT 创作、AI 表格、文档处理等功能组合起来,这亦然信得过能帮打工东说念主达成「每天早放工一小时」的实费力能。

拿最折磨东说念主的 PPT 来说,千问不是去素材库里给你强迫烂大街的野生模板,而是奏凯用大模子的代码智商动态生成复杂排版。淌若你认为那处不够完好?奏凯多轮对话让它接着改,改到你惬意为止。

为了探探底,我先让它帮我作念个视频号运营课程 PPT,确凿在语音落地的一会儿,AI 就过问了光速消化模式:填充血肉、匹配逻辑一气呵成。

最令东说念主惊喜的是,千问对「图文穿插」的相识并非言传身教,而是左证据质深度匹配了各异化的版式,整份 PPT 拿出来,确凿便是不错奏凯委用的成稿。

这还没完,你还能一次性给千问喂最多 39 种不同表情的参考文献,让它自动梳理逻辑、索求要点,帮你省去了来往翻贵寓的坚苦。至于配图,它也能左证陡立文自动匹配,找不着合适的致使能就地给你生图,全程都不需要你切出界面去求援搜索引擎、或者下载下来用 office 处理。

表格处理方面,千问的 Excel Agent 主打一个高水准。

岂论是表情粗造的聊天截图、手写札记,如故大段的纯文本,丢给它就能快速生成圭臬的 Excel 表格。淌若后续还要算算增长率、画个趋势图,也无谓再去头疼何如写函数公式了,奏凯用当然语言派遣它就能处罚。

我试了一个稍稍有点复杂的需求:让它左证 2026 广州最新版初中英语讲义,把各句型的语法结构、时态变化和参考例句整理成 Excel 表格,表情要合乎一页纸打印,便捷拿来背诵。

换以前,这种事得我方一条条查贵寓、手动录入、再调表情,至少要折腾半小时。面前说一句话,它奏凯把表格生成好,列名、行距、例句填充,基本不需要再入手改。

文档处理这边,Word/PDF Agent 维持图文数据夹杂上传,能自动排版并输出奏凯可委用的文献。

更有利思的是,传完长文档你不需要我方去翻阅找要点,奏凯张嘴问,它就能快速定位给出谜底;想修改那处亦然一句话的事儿,省去了我方去对照原文献极少点改的坚苦。

我试着传了一份参差词语的条约 PDF,奏凯问它:「独家授权实质是哪些?」它并莫得傻傻地把全文复述一遍,而是精确定位到了授权条件,把独家限制、授权期限和截止事项一条条列得明判辨白。

面前,这个语音指示致使还能和 AI 写代码、手搓网页等任务助理功能组合使用,照这个架势下去,将来的办公形态,粗略果真便是「动动嘴皮子就把活儿干了」。

和 AI 讲话的东说念主,会比键盘打字的东说念主更早放工

用了一段期间千问语音输入法,我猜测一件事。

曩昔几年「AI 普及办公效用」喊得震天响,但大部分东说念主的体验是:我跟 AI 说了半天,它给我的东西根底不可用。然后就认为 AI 也不外如斯。

问题出在哪?出在交流方式上。你用键盘跟 AI 对话,40% 的元气心灵花在组织翰墨上,只剩 60% 在想你到底要什么。给出去的指示信息密度低、陡立文薄,AI 固然输出垃圾。这不是 AI 不行,是你喂给它的东西不行。

语音把这个死结解开了。讲话时你不会给我方设字数截止,细节会当然地冒出来,陡立文会自动变厚。它能把嘴里说出的当然语言需求梳理得井井有条,让   AI   精确彭胀。

纽约销售平台 Clay 的教养负责东说念主 Yash Tekriwal 提到,他用语音输入的速率是每分钟 205 个词,打字只消 110 到 120 个。但速率还不是最要津的,他发现口述的 prompt 质地更高。

AI 圈最近有个词超越火,叫 harness。它的意思粗略是:你有一匹马(AI 的智商),但你得有一套缰绳本事独霸它,让它往你要的场地跑。莫得 harness,马再结实也仅仅在原地打转。

千问电脑版的语音输入法便是这套 harness。

它诱导的一端是你的嘴,另一端是 AI 的全套办公智商:PPT、表格、文档、搜索、分析、表情移动。你说一句话,它把你的意图翻译成 AI 能彭胀的指示,然后救援对应的 Agent 去跑腿。它不是输入法,是缰绳。是你独霸 AI 办公智商的那套 harness。

而别的「带 AI 功能的输入法」解决的是什么?是进口问题,帮你找到 AI 在那处。千问解决的是独霸问题,帮你把 AI 的智商精确地用起来。一个是给你指路,一个是帮你套好缰绳奏凯开赴。差距就在这。

在 Agent 期间,语音本来是驱动   AI   使命的最当然和高效的方式。千问语音输入法,便是率先在桌面进口端出了这套 harness 的居品 ,这亦然为什么我期待,将来在更多终局上,能看到这种信得过能独霸 AI 的语音进口。

客岁这个时候,淌若你在办公室倏地对着电脑讲话,一次两次会被当成在打电话,三番五次就不禁让东说念主怀疑,使命压力是不是太大了,精神状况还好吗?

本年开动,那些对着电脑自言自语的,可能便是全公司最早放工 ( 摸鱼 ) 的东说念主。

附客户端下载地址:

https://www.qianwen.com/Z6·尊龙凯时「中国」官方网站download?ch=tongyi_redirect

网页版体验地址:

https://www.qianwen.com/

尊龙凯时中国官方入口
相关标签: 上线 语音 千问 电脑