作爲一名碼字編輯,時常穿梭於各類發佈會、專訪、羣訪等場景,而一款好用的智能錄音筆,對碼字編輯來說,就是生產力工具。

錄音筆的發展與存儲介質的發展息息相關,如今存儲技術的發展已經到了一個非常高的水平,傳統錄音筆的很多需求已經被智能手機所取代。但在相對專業、高需求的場景下,智能化的實時轉寫、語音翻譯、降噪等功能就成了核心競爭力。

在圍觀了老羅4月1日的帶貨主播後,筆者檢索了目前2000—3000元價位的在售智能錄音筆後,目前在售的只有科大訊飛智能錄音筆SR701和搜狗AI錄音筆S1。

訊飛智能錄音筆SR701(以下簡稱訊飛SR701)與搜狗AI錄音筆S1(以下簡稱搜狗S1)都是現階段兩家智能錄音筆的旗艦產品,兩款產品在外觀結構上基本一致,均採用2個哈曼定向麥克風和6個矩陣麥克風設計,在產品售價上也非常接近,訊飛SR701售價2899元,搜狗S1售價2698元,訊飛SR701是在2019年5月份上市的,搜狗S1是在2020年2月份才上市的,訊飛SR701產品上市時間更早。

這兩款王牌錄音產品實際體驗如何,我們在京東上採購了這兩款產品,對這兩款產品進行對比體驗,一起來看一下這兩款現階段王牌智能錄音筆具體表現。

外觀

▲左爲訊飛SR701,右爲搜狗S1

訊飛SR701尺寸爲122mm x 65mm x 11mm,搜狗S1尺寸爲128mm x 64mm x 16.5mm。整體厚度來看,訊飛SR701更具優勢,輕薄的外觀對於經常進行語音採集工作的人羣來講,無疑是更加纖薄小巧。

▲左爲訊飛SR701,右爲搜狗S1

電池容量上,搜狗S1佔優勢,電池容量爲2450mAh,訊飛SR701電池容量爲2000mAh。不過訊飛SR701標配了18W的快充頭,充電五分鐘可以支撐2小時連續錄音,而搜狗S1則配備的10W適配器,充電效率上,訊飛SR701彌補了電池容量小的遺憾。

▲左爲訊飛SR701,右爲搜狗S1

爲了得到更好的收聲效果,訊飛SR701和搜狗S1均採用了2個哈曼定向麥克風和6個麥克風陣列的設計,不過,搜狗S1的麥克風陣列集成在屏幕總成的玻璃上,如果想要保護設備而貼膜的話,可能會因爲貼膜影響到麥克風陣列的收聲效果。

在按鍵設置上,訊飛SR701引入了側邊指紋解鎖按鈕,這相比於傳統的數字密碼安全性更高些。搜狗S1的側邊則提供了物理按鈕,可以一鍵開啓錄音功能,功能性上更方便。

從整體外觀來看,訊飛SR701和搜狗S1各有特點,接下來,我們通過具體的使用場景對訊飛SR701和搜狗S1進行對比。

使用體驗

科大訊飛在業界一直專注人工智能和算法,而搜狗則專注軟件和應用的互聯網公司。我們在這兩家公司的產品就能看到這些特點。訊飛SR701系統採用深度定製的安卓系統,而搜狗S1則是基於MIUI定製,在UI的美觀度上,搜狗S1顯然更好一些,操作更接近手機;而訊飛SR701上來就比較直觀了,理科生思維更加明顯一些。

爲了更直觀做對比,我們設置了標準朗讀(新聞聯播)、會議採訪、英語、課堂、噪音、遠距離收音等場景的對比。比較遺憾的一點,因爲疫情因素,無法實現大型會議現場的錄音拾聲轉寫。

▲左爲訊飛SR701,右爲搜狗S1

1、功能支持

搜狗S1支持APP客戶端遠程控制錄音,訊飛SR701不支持該功能。

在應用支持方面,搜狗S1對文本支持並不友好,儘管可以通過手機或者電腦進行拷貝語音文件,但搜狗S1並不支持拷貝轉寫的文稿,需要通過網頁獲取這些文本;訊飛SR701雲存儲功能是按需存儲,因此用戶可以根據需要上傳雲文件到雲服務器中,針對轉寫的文稿,訊飛SR701連接電腦就能自由拷貝。

搜狗S1共有四種錄製模式供用戶選擇,分別是會議、聽課、採訪和音樂,其中音樂模式下可錄製192Kbps和256Kbps的mp3文件和48kHz/16bit以及48kHz/24bit的WAV文件,其他模式下采樣率均爲16kHz/16bit。

訊飛SR701共有七種錄製模式,分別是標準、採訪、會議、演講、備忘、音樂、省電模式。錄製格式分別爲ACC和WAV格式,其中音樂模式下采樣率爲48kHz/16bit,省電模式下采樣率爲16kHz/16bit,而其他模式均在32kHz/16bit採樣率下進行。

在聲音錄製的質量上,訊飛SR701更好一些。

作爲智能錄音筆,語音轉寫功能和降噪自然是很多用戶關心的,接下來我們看一下訊飛SR701和搜狗S1在語音轉寫和智能降噪上的表現。

2、標準朗讀場景

首先我們來看一下第一段音頻文件,原錄音採自《新聞聯播》4月5日《爲了民族復興英雄烈士譜系列報道》欄目。以下轉寫內容均在採訪模式下進行,搜狗S1轉寫內容如下:

▲搜狗S1轉寫

搜狗S1文字轉寫功能需要登錄搜狗語音助手專門的網頁,然後從網頁下載才能編輯轉寫的內容,搜狗S1的一個好處是,它可以智能識別錄音文件中不同講話人的聲音,最多可以區分四個人,識別錄音中的掌聲、笑聲以及語氣詞,這些接下來的例子中會有所提現。通過這段《新聞聯播》內容的轉寫我們看到,搜狗S1在個別的人名、斷句上有所欠缺。另外發音相近的一些詞語也會被誤識別,比如轉寫的內容中,“事蹟”一詞就被誤轉成“世界”,“新醫藥”被誤轉稱“星醫藥”。

在來看訊飛SR701的轉寫表現,訊飛SR701在這篇報道中識別準確率基本上達到了100%,特別是在文字的斷句上,表現比搜狗S1好很多,儘管“辦利羣書社”、“太陽能光伏”、“新能源汽車”在停頓上存在一些小瑕疵,但這並不影響整體的閱讀。

▲訊飛SR701轉寫

3、發佈會速記

接下來我們再來看看,轉寫抗疫指揮部新聞發佈會的一部分講話內容。首先我們來看一下搜狗S1的表現,在未開啓智能輔助矯正功能情況下,我們看到搜狗S1轉寫過程中也將諸如“呃”、“哈”等語氣詞記錄下來,如果開啓智能輔助矯正,諸如語氣詞、重複詞、停頓詞等內容就會自動被過濾。

▲搜狗S1未開啓智能輔助矯正

▲搜狗S1開啓智能輔助矯正

不過,在轉寫的準確性上,搜狗S1這次出現漏詞的情況,同一段音頻,訊飛SR701識別準確率是100%。雖然不支持語氣詞的矯正,但是我們看到訊飛SR701在轉寫過程中並沒有任何的錯誤。

▲訊飛SR701轉寫

▲搜狗S1轉寫

▲訊飛SR701轉寫

4、英文錄音轉寫

接下來,我們再來看一下訊飛SR701和搜狗S1其他語言轉寫效果,訊飛SR701支持中英文內容轉寫。而搜狗S1支持中文、英文、日語、漢語、泰語、俄語、法語、西班牙語、德語、意大利語共10種語言轉寫,另外,搜狗S1還支持粵語、四川話、河北話、天津話、東北話、南京話、武漢話、陝西話、貴州話、濟南話共10種方言轉寫,不過除了中文普通話轉寫,剩下的轉寫語言都屬於體驗內容。我們這裏對訊飛SR701和搜狗S1的英文轉寫進行對比體驗。這段內容共550詞左右,爲了對比方便,我們對轉寫的文字進行格式化處理,其中比對結果左側框內爲原始文本,右側框內爲轉寫文本。

通過轉寫內容對比,我們看到搜狗S1和訊飛SR701英文轉寫的識別準確率差不多,一部分詞語因爲太過相近兩者均轉寫錯誤,比如“war”被轉寫爲“wall”,“shall”被撰寫成“should”,“fighter”被撰寫成“fiber”,“fear”被撰寫成“fair”,“can’t”被轉寫成“can”。這些本身由於發音問題的導致的轉寫錯誤,我們認爲屬於合理可以接受,如果去掉這些因素,我們從內容上看,訊飛SR701相對於搜狗S1在識別上會稍微好一些。

▲搜狗S1轉寫結果

▲訊飛SR701轉寫結果

5、噪音環境下測試

接下來,是訊飛SR701和搜狗S1強噪音下的降噪和轉寫體驗。訊飛SR701和搜狗S1降噪策略不同,搜狗S1支持先錄製後降噪,支持三種降噪強度,分別是真實音質、人聲增強還有純淨人聲。而訊飛SR701是根據六種不同的場景模式選擇自動設置,無需用戶臨場調整。

在清明節假期期間,筆者所居住的房子有鄰居在裝修,電鑽聲、臺鋸聲此起彼伏,如此噪音下,筆者又開啓了掃地機器人,同時使用薯片的包裝紙製造大量的噪音。

通過兩段音頻文件的波形圖我們看到,整體的降噪效果搜狗S1更好一些,不過搜狗S1對聲音的質量壓縮的很多,人聲是可以聽到的,但由於背景噪音太大,搜狗S1原始音頻會有類似脈衝式的噪音,同時一些細節上,人聲會被誤認爲是噪音而被降噪,導致音頻內容細節難以還原。訊飛SR701整體降噪效果並沒有搜狗S1那麼強悍,在這樣強噪音情況下,勉強可以聽到人聲並能進行轉寫。

▲上方綠色爲訊飛SR701波形圖,下方紫色爲搜狗S1波形圖

從轉寫的效果上來看,搜狗S1降噪效果比較好,但降噪強度太大很容易影響錄製的聲音質量,因此在文字轉寫的準確率上搜狗S1與訊飛SR701基本差不多。搜狗S1在斷句上依舊與訊飛SR701有一定差距,句子與句子之間常常會黏連在一起。

▲搜狗S1轉寫

▲訊飛SR701轉寫

6、遠距離拾聲效果

接下來,我們對兩款錄音筆進行遠距離拾聲測試,首先,我們在室內進行簡單的低聲遠距離拾聲,測試採用手機作爲外放設備,音量爲5%,距離錄音設備爲2.5米,周圍環境無其他噪音源。測試音頻素材爲央視財經頻道《遇見大咖》欄目雷軍專訪內容。以下爲原文:

主持人:這句話好空啊我覺得。

雷軍:是,在今天能有勇氣講這麼空的花的又是什麼樣的人呢?四五年前手機行業誰用國產機啊,國產機等於山寨,對嗎?我們不是這個行業,我們是幾乎所有的行業都有這樣的困難。他們不僅僅是用iPhone啊,你看他們家裏面電視都是索尼、三星、夏普,同意嗎?

這個時候我們去批評消費者是沒有價值的,我覺得問題出在產業界,出在我們自己沒做好。爲什麼索尼會這麼受尊重?它是70年代開始的,之前他們產品也一塌糊塗,我再辦個小米不是爲了成就感,不是爲了成就感,不是爲了個人的財富,怎麼怎麼着,也不是爲了滿足什麼虛榮心。我就是我想幹一件我喜歡的事情,我希望這件事情對這個社會有幫助。

搜狗S1在這樣低音量遠距離拾聲表現並不好,雖然有錄製部分的聲音,但由於降噪算法原因,部分聲音會被誤認爲是噪音被消除或者減小,這就直接導致了部分音頻內容缺失,大量音頻細節都已經無法還原,音源質量大幅降低影響了轉寫效果,搜狗S1轉寫過程中基本上有大篇幅的內容沒有正確轉寫,甚至部分音頻無法正常聽到人聲。通過轉寫後的文本我們看到,搜狗S1這這種情況下,轉寫準確率極低,已經無法正常統計轉寫的情況。

▲搜狗S1轉寫

在這段錄音的轉寫中,訊飛SR701也遇到了一些麻煩,但相比於搜狗S1已經好了很多,最起碼部分內容確實能夠成功轉寫的。在遠距離拾聲和轉寫上,訊飛SR701更好一些。

▲訊飛SR701轉寫

接下來,我們兩款產品進行極限拾聲測試,這裏我們選擇在開闊的室外環境進行測試,測試音頻文件爲央視新聞4月12日全球新冠肺炎疫情播報。訊飛SR701與搜狗S1均在距離音源15米位置進行拾聲。

在拾聲效果上,我們看到,搜狗S1雖然能有效的降低外部的環境噪音,但是由於測試距離過遠,拾音過程中會將正常的語音被誤認爲是噪音,直接導致大量的聲音信息被誤過濾,錄製音頻內容基本上聽不到語音內容,很多雜音來自環境聲,這也直接影響了轉寫準確率。

▲搜狗S1轉寫

訊飛SR701也沒有100%的識別。但在15米距離的測試中,訊飛SR701依舊保留大量的聲音細節,雖然轉寫準確率相比於正常環境低一些,但是作爲對比搜狗S1幾乎沒有識別出來完整的內容。

▲訊飛SR701轉寫

7、課堂筆記場景

在一些課堂場景,一些學生會通過錄制課上內容方便課後整理,這裏我們通過對高中歷史課程線上授課內容轉寫,體驗這兩款錄音筆的特點。

整段文本內容比較長,搜狗S1基本上全部識別出來了,但是其中識別錯誤的內容還是比較多。對比訊飛SR701,我們看到訊飛SR701準確度更高,識別準確率超過95%。

▲搜狗S1轉寫

▲訊飛SR701轉寫

通過對錄音文件的轉寫和降噪,我們看到搜狗S1在功能上會更多一點,比如講述人聲音識別,英文識別以及降噪功能。

訊飛SR701則更專注識別準確性,在常規的中文交流場景下,訊飛SR701識別準確率更高。

音頻文件網盤鏈接:https://pan.baidu.com/s/1bpUIkx5DZ50mMVGUip-xOQ (提取碼:mgc3) 

資費標準

訊飛SR701機身存儲爲32GB,開機註冊後贈送20GB的雲存儲空間,這些雲存儲空間可以錄製AAC格式文件約250分鐘,訊飛SR701這部分雲存儲空間永久免費;搜狗S1機身存儲爲64GB,附贈500小時雲存儲空間,不過這500小時雲存儲空間只能使用1年時間,如果到期後繼續使用需要額外購買會員。

作爲智能錄音筆產品,訊飛SR701和搜狗S1都推出了專門的增值服務。

訊飛SR701在出廠時已經附贈了價值2999元/年的V3會員服務,這項服務是對於訊飛SR701用戶永久免費。它包含20GB額外的雲存儲空間(約能存儲375分鐘音頻文件),每月有30小時機器快轉,每月還有3小時閒時轉寫,每次可批量上傳音頻100個,同聲傳譯以及對話翻譯不限次數使用。

搜狗S1則提供了268元/年的鑽石會員服務,第一年免費,用完一年則需要額外支付會員費用。這項服務擁有500小時的音頻文件雲存儲服務,另外轉寫時長24小時/日。同樣也允許每次最多100個音頻文件上傳,同聲傳譯和對話翻譯不限次數使用。另外,搜狗S1的鑽石會員服務還提供不限次數轉寫手動加速和小語種免費轉寫服務。

科大訊飛不同的一點是,它會提供專門的人工精轉服務,這項服務也是通過充值實現的,這項服務可以選擇輸出文稿或者字幕,文稿可以標註角色,字幕可以標註時間戳。服務價格相對比較高。

在額外轉寫時長以及人工精轉這類付費增值服務商,訊飛SR701提供的更多,同時訊飛SR701提供永久免費的V3會員,這一點相比於搜狗S1來講確實實惠不少。

總結

訊飛SR701與搜狗S1作爲兩款出色的旗艦級錄音筆產品無疑是現階段智能錄音筆市場出色的兩個選擇,訊飛SR701和搜狗S1優缺點如下。

搜狗S1優勢:

  • 內部UI美觀,M鍵標記功能適合快速標記重點內容

  • 有3.5毫米耳機口

  • APP適配關聯度高,方便隨時移動錄製

  • 電池容量大

  • 機身存儲與雲空間大

  • 附贈保護殼

  • 支持人聲區分,語氣詞、重複詞去除

  • 實體按鍵操作方便

  • 降噪表現出色

  • 附贈防風罩

搜狗S1不足:

  • 機身太厚,加上保護套更厚

  • 麥克風陣列與屏幕總成在一起,無法貼膜

  • 不支持指紋識別

  • 不支持BGI網絡登錄

  • 轉寫文本無法通過USB快速導出

  • 斷句表現一般

  • 錄音開始後震動過大,容易影響聲音質量

  • 會員服務需要按年繳費

  • 遠距離拾聲不佳

訊飛SR701優勢:

  • 機身纖薄

  • 附贈防風罩

  • 支持18W快充

  • 支持BGI網絡

  • 支持指紋識別

  • 連接電腦課快速獲取轉寫文本

  • 錄音整體音質好

  • 中文轉寫識別率高

  • ACC格式文件壓縮質量比同條件下MP3文件質量更高

  • 會員服務免費贈送

  • 遠距離拾聲轉寫準確率更高

訊飛SR701不足:

  • UI較爲單調

  • 不支持導入訊飛輸入法個人詞庫

  • 不支持說話人分離

▲左爲訊飛SR701,右爲搜狗S1

綜合來看,訊飛SR701和搜狗S1兩款產品都有着不錯的文字轉寫功底。如果想要更高的安全性能、隨時快速電量續航和更高轉寫識別需求的用戶以及一勞永逸的在線服務需求,而從我們相對有限的體驗中也可以看到,搜狗S1優於設備的易用性及多語種/方言支持,訊飛SR701則優於語音轉寫的高準確性。

錄音筆的很多錄音、轉寫功能,現階段的智能手機都可以通過軟件實現。但智能錄音筆面向的是需求相對較高的用戶,自然而然,要求也會更高。如果你是錄音筆輕度用戶,對錄音轉寫沒有需求,則可以選擇搜狗S1;如果你經常需要用到錄音筆,且對錄音轉寫有更高的需求,則訊飛SR701顯然更適合。

查看原文 >>
相關文章