最近写稿子有点累了,所以想偷点懒。能不能不用打字?只用语音来进行输入呢?现在就是用百度语音输入法进行本篇测试。测评的内容包括百度语音输入法现在的几项语音方面功能。本篇文章,测试的主要功能还是百度语音转文字或者相关的语音功能,至于输入、手写等功能暂时不测试。

我们看输入框语音输入的界面,其实很简单的。基本上功能就三个,而且每个小图标都可以精准地进行设置或者提升,这样日常输入过程就可以很方便快捷找到需要的功能。输入的语音按键不用繁琐的长按才能说话,持续说话、长语音也很合适(对于记录生活的语句、连续对话、撰文写稿特别适合)。

1、丰富语种 自由混输

丰富的语种功能可以让你在各种语言中进行语音转文字输入,这个AI大脑太灵活而且相当的智能,数了一下总共内含18种语种可供选择。日常我就使用普通话即可,对于其他群体可以自行选择方言,再复杂就是中英自由说这就不怕与老外交流出现尴尬场面;还有各种外语、翻译、文言文都可以找到,似乎百度已经囊括各种复杂的语音识别,看样模型做得很不错。

口说无凭,直接在便签里开始语音实测,前面两句尝试了中文转英文的效果,现在几点了?今天天气怎么样?似乎都是中学上英语课常用的语句,这时候既陌生又熟悉,这顺便还温故而知新了。后面几句就是随便测试了,也是数码爱好者比较关心的问题,我也想知道现在iPhone的价格是多少?看到很多人都在疯抢iPhone 11,看样价格很合适。但这里发现个问题,如果句子中间的单词iPhone肯定是拼写无误的,如果是iPhone在首字母意味着百度会自动大写,可能这就是书写的习惯吧。对于中英文混输,其实日常使用场景挺丰富的。

2、语音斗图 社交现做表情包

语音斗图,这下人人都会做表情包,而且是专属定制的。一开始笔者以为是百度有个表情包的库,通过百度语音进行搜索库里相关的图片然后发出来。原来我错了,百度语音斗图是直接将你的语音转换成对应文字放在图里面,然后进行各种文字、图片搭配供你选择的。

我觉着这么方便,直接不用文字介绍了,来个语音斗图热情的气氛就被烘托出来了。笔者正是渺渺望水,丝毫不差的就给你文字转换好然后融合到各种图片里,这才是真正的专属表情包,感觉每次都是不重复的。像我这个网名“渺渺望水”普通电脑输入法都要找很久。

再测试一下,也是现在很多消费者关心的问题,小米电视的价格多少?这个问号“?”都是语音斗图自动带上去的,这也太神奇了!像中间的表情包就特别有画面感,询问的口气还带入了一股苍凉,斗图的时候真的没怕过谁。看样以后什么的手机第三方表情包制作可以卸了,直接用这个不占空间还快捷。

3、更多设置 细节为你把控

因为场景复杂,就要考虑到更多细节,各种环境试过才能保证语音转文字的准确和高效。最左边的小图标点击即可进行更多语音设置,常见的个性化语音需要联系培养,百度语音的AI大脑肯定很有看头,建议长期登录使用。

更多设置:这种个性化语音长期智能效果更明显,长按空格语音输入、智能场景语音、极简语音模式都可以选择,实际按照个人所需就好,我是选择默认的。

长文本语音:一个人说话有多快,转文字就有多快。仅仅十秒就是一个挑战,手也释放了,直接像同声传译那样的效果,测试了百度长文本语音效果还是杠杠的。中间也出现了小问题,断句没有标点、第一个“长”说成了“常”,即使是识别率高达98%的能力也需要慢慢的成长和锻炼。输入法会自动识别环境,轻声识别意味着小声说话也能被识别、不用怕影响他人。

离线语音:这个就不用多说了,真的在没联网情况下使用。实测效果令人满意,离线语音没有网络也能识别这么高,是没有任何错误发生的。以后在各种杂乱环境下也不怕了,转文字不用流量还能轻松识别,算是少见的了!

其实此次还有个抢了智能录音笔的功能,语音速记这个功能直接可以进行现场录音转文字,不用手机本身的应用或者其他外在硬件了。在这个社交多元化的时代,语音以后是大趋势,无论是语音输入还是语音转文字,百度语音强大识别功能让交互变得更加自然和快捷,也照顾了各种群体上手简单方便。各位看官也可以尝试其他功能,测试到底准不准、强不强。

相关文章