此前大家推荐过 Bob 这款 macOS 上的翻译小工具,我自己也一直用到现在。Bob 还真算是个性鲜明,不仅名字完全看不出其功能属性,连 logo 也是如此另类,有人觉得很 Q 很萌,也有人会觉得很出戏。最近突然意识到 Bob 停留在 0.4.0 版本已经很久没有更新了,原来是在内测新的版本……

注:本文主要介绍新版本中的新特性,部分使用方式和习惯上可直接参考之前的文章。

除了LOGO「太萌」,这款翻译小工具真没啥缺点

关于 LOGO 的问题

直接说好了,新的版本(0.5.0 beta)中开发者 Ripper 依然没有更换 logo,还是那个大头娃娃,可能他的名字就叫 Bob。

不过隐约中我感觉 Ripper 已经在为新的 logo 做准备了,菜单栏展示的图标已经可以更改,预置的三个图标除了大头娃娃之外,其它两个都比较正常了,而且还支持自定义。

唯一砍掉了的,菜单栏图标不再支持隐藏了……

其实如果只是因为 logo 在启动台中太过突兀,大可自己只做一个心仪替换掉。

支持更多翻译 API,需申请个人密钥

好了,言归正传。新的测试版还是做了比较多的改动,除了刚提到的菜单栏图标等细节问题上,最核心的还是还是丰富了翻译功能,接入了更多的翻译 API 支持,同时还支持多家 OCR 识别和语音合成。

这里还是需要提醒一下,直接从现在的 0.4.0 版本切换到新的版本,可能会有些不大习惯。Bob 0.5.0 beta 删除了原有的翻译功能,更改为自定义添加翻译 API,总共支持多达六种主流的翻译服务,默认只保留百度免费翻译。

因此要使用测试版或者未来正式版推出之后,先看完本文再决定是否要升级。目前还无法确定,新版本推出之后旧版本是否可以正常使用。

虽然免费的百度翻译可用性还不错,但我还是建议添加多几种翻译 API,日常使用多作比较,能够达到更好地翻译理解效果。测试版已经支持多达六种翻译服务,除了有道翻译和搜狗翻译没有免费额度之外,其他都有最低 50 万字符/月的翻译额度,对于个人使用来说绰绰有余。

我曾使用多家翻译服务,在部分场景下腾讯翻译君个人觉得翻译更精准,由此我曾向 Ripper 建议添加支持,竟然在测试版以这种方式实现了。申请各家翻译 API 密钥也并不麻烦,添加一次便可永久保留使用。

这段时间使用测试版,除了保留原有的百度翻译之外,还自行添加腾讯翻译君、彩云小译、谷歌翻译这三种个人觉得不错的服务。其中唯独申请谷歌翻译 API 密钥比较麻烦,一个是因为在外网,另一个是必须绑定支持外币支付的信用卡。好在 Bob 0.5.0 支持添加谷歌翻译插件,来补充谷歌翻译功能,并且和 0.4.0 版本一样,支持选择国内和国际两种接口。

从划词到翻译,快捷键操作下,整个过程还是那么行云流水。不同翻译服务的结果并列展开,更加直观,不需要再像之前一样只能单一选择,不过这带来的弊端就是,如果翻译的对象比较长,那么全部展开的话整个窗口就会比较长,过于占用空间。

Ripper 想必也是考虑到了这一点,因此你可以在设置中对窗口宽度高度进行调节限制,能够适应每个人的使用需求。

所有的窗口都支持折叠/展开,默认是全部展开的,内容复制和朗读和之前版本一样得到了保留。这一点会在后面的 OCR 和语音合成功能再提及。

此外,如果对于翻译服务有一定的优先级排序,可以在设置中拖动调整翻译服务的顺序,这个顺序即对应的是翻译结果窗口的排序。

截图翻译也是 OCR 文字识别利器

上一次介绍 Bob 的时候我就强烈推荐过,由于 Bob 支持截图翻译,也因此能够作为不错的 OCR 文字识别工具使用。在新版本中,Bob 也将文字识别功能单独拿出来进行了扩展,同样支持添加多种 OCR 识别服务。

默认预置一种百度智能云通用 OCR 识别服务,这是截图翻译所必须的。使用起来精准度也非常高,如果没有特殊需求其实也不用再添加其他的 OCR 服务。

和翻译 API 一样,部分 OCR 服务都是有一定免费额度的,默认的百度智能云通用 OCR 免费额度高达 50000 次/天,如果 Bob 用户量大起来,可能会出现服务异常,建议大家可以申请私人 API 添加,包括腾讯云的几种 OCR 识别,个人使用的话免费额度也是绰绰有余。

不过假如你已经添加过一些翻译的 API 密钥的话,也可以同时复制到 OCR 识别功能中。以腾讯云为例,你可以同时为一个用户授权多个权限,这样同一份密钥可以同时具备翻译、OCR 以及语音合成多个功能。

出于安全考虑,建议每个人保管好自己的密钥,防止泄露后被滥用导致扣费。

从 OCR 识别的准确度上来说,百度、腾讯这些大厂都还是比较厉害的,毕竟目前而言文字识别这种需要大规模数据来机器学习训练的已经不是什么高深技术了。实测中英混合识别率也比较高,但一些特殊符号会出现错误。

不过也存在一些比较糟糕的情况,如果截图区域存在大量代码类,可能会被识别为其它语种,导致 OCR 识别结果几乎完全错乱,我曾咨询过开发者 Ripper,他表示目前语种识别还存在一些 bug,可能与这个有关。

语音合成似乎不是我想的那样

最初看到 Bob 测试版中将语音合成也独立出来了,我天真地以为可以将文本识别成语音导出音频文件,原来只是用于朗读功能。

划词/截图翻译的文本和翻译结果都支持朗读,显然这功能更适合用于单词翻译中,比较方便听取单词标准读音。

语音合成功能预置 Apple 语音合成,使用苹果自带的语音合成器,可以离线使用的。声音效果大概就是经常在某音视频听到的那种吧。第三方也只能添加腾讯云语音合成,因此我建议大家可以申请一个腾讯云的 API 密钥,这样可以同时授权使用翻译、OCR 识别和语音合成了。

腾讯云语音合成每月免费额度有 100 万字符,应当是够用的。作为本土服务,腾讯云的语音合成对中文显然更加友好,不会像苹果语音合成的中文机器人既视感。

插件及拓展功能

前面也提及到谷歌翻译的插件,这是 Bob 在新版本中提供的拓展需求,可以让用户自定义 API。目前测试版本还只看到一个公开的插件,就是谷歌翻译,如果未来有更多第三方开发者共享自己的插件,或许能带来更多便利和惊喜。

在额外调用方式上,此前的版本就已经加入了对 PopClip 的支持,新版本还添加了 AppleScript 调用方式。

Bob 的未来:OCR 文字识别可独立使用

如果刚升级到新版本,不少 Bob 老用户可能会有点不大容易接受,最核心的原因是多数服务都需要自己配置 API 密钥了。但这个问题其实是相对的,各家翻译、文字识别、语音合成提供的免费额度都是有数量限制或者并发次数限制,当 Bob 用户量越大出现不稳定的几率会增大,而同样的免费额度对于个人使用却是绰绰有余,手动配置好可以持续使用,稳定性上也能够有保障。

鉴于此,我也想开发者 Ripper 提议后续加入配置信息导出备份的功能,如遇到意外重装,能够快速恢复原有的配置。

整体来说,新版本的 Bob 保持了原有的使用习惯,增加了更多服务 API 支持,在提升翻译功能体验的同时,也将 OCR 文字识别和语音合成单独拿出来,Ripper 透露后续会将 OCR 识别功能独立,具有独立使用的快捷键,这样 Bob 不再是单纯的翻译工具了。

至于 Bob 新版何时正式上线,我也没有得到具体的消息,目前还存在一些 bug 需要修复,其本人近期也经常工作加班,时间上可能还得延后,大家还是耐心等待吧。

相关文章