摘要:事實上,Prasad提到了正在進行的研究,Alexa的訓練過程轉變爲只要有新的用戶數據,模型就可以快速更新的過程,或多或少保證了這些數據的價值在被處理之前就會被捕捉到。這一級別的預測和推理還需要考慮到視頻數據,因爲越來越多的Alexa兼容產品包含攝像頭。

編譯:原子核

在Alexa變得潮流之前,我就開始使用它了。在我瀏覽亞馬遜購物網站準備購買新揚聲器的時候,一個橫幅廣告儼然展示在我面前,於是我在第一代Echo發佈的幾個月後就購買了。在它到貨後,我當時的室友,谷歌的一名軟件工程師,急切地將Alexa的功能與她的Google Assistant進行了比較。Alexa並不是真的天衣無縫的。但就我而言,它實現了我想做的一切:它播放着我最喜歡的歌曲,在早晨成爲叫醒我的鬧鐘,時不時地告訴我天氣和新聞。

五年後,亞馬遜的雄心壯志使我樸素的慾望黯然失色。Alexa現在遍佈各地,能夠控制超過8.5萬種智能家居產品,從電視到門鈴再到耳機。它可以執行超過10萬個“功能”和計數。它每週處理數十億的互動,形成關於你的大量數據,包括你的日程安排、你的偏好以及你的行蹤數據。Alexa已經變成了一個帝國,但亞馬遜纔剛剛開始。

在接受採訪時,Alexa的首席科學家Rohit Prasad現在透露了Alexa下一步走向的更多細節。該計劃的關鍵在於將語音助理從被動交互模式轉變爲主動交互模式。Alexa不是等待並響應請求,而是預測用戶可能想要什麼。這個想法是把Alexa變成一個無處不在的伴侶,積極地塑造並安排你的生活。這要求Alexa需要比以前更好地瞭解你。

事實上,Prasad已經向世界展示了這種轉變可能會是什麼樣子的,並且在晚些時候,Prasad將在葡萄牙里斯本的WebSummit會議上概述他對Alexa未來的展望。在6月份的re:Mars大會上,他演示了一項名爲Alexa Conversations的功能,並展示瞭如何使用該功能來幫助您計劃晚上外出。您只需要開始對話,而不是手動操作,就可以爲晚上的每個部分發起一個新的請求——例如,預訂電影票。Alexa隨後會跟進詢問你是否也想預訂餐廳或叫一輛Uber。

爲了推動這種轉變,亞馬遜需要硬件和軟件的支持。今年9月,亞馬遜推出了一套“on the go”Alexa產品,包括Echo Buds(無線耳機)和Echo Loop(一種智能戒指)。所有這些新產品都可以讓Alexa記錄你生活中大量的數據,從而更好地根據你的行蹤、行動和偏好爲你提供幫助。

從軟件的角度來看,爲了實現這些能力,Alexa需要使用新的方法來處理和理解所有不同的信息源。在過去的五年中,Prasad的團隊致力於培養它對人工智能基礎知識的掌握,如基本的語音和視頻識別,並擴展其自然語言理解。在此基礎上,他們現在已經開始發展Alexa的智能預測和決策能力,以及越來越多的更高層次推理的能力。換句話說,我們的目標是讓Alexa的AI能力在幾年內變得更加複雜。

一個更聰明的Alexa

下面的一個場景是Alexa的軟件更新組合在一起來執行夜間計劃。爲了滿足電影票的請求,並給出晚餐和Uber車輛服務的提示,一個神經網絡通過一週數十億的用戶互動來進行學習,以識別彼此之間常用的功能。這就是智能預測發揮作用的方式。當有足夠多的用戶在看完電影后預訂晚餐時,Alexa會將這些技能打包在一起,並聯合推薦給客戶。

但是,要知道何時預訂Uber,需要進行推理。考慮到你和電影院的位置、電影開始時間和預期的交通,Alexa計算出什麼時候汽車應該來接你,纔會讓汽車準時到達那裏。

Prasad設想了許多其他可能需要更復雜推理的場景。你可以想象一種功能,例如,當你站在Whole Foods超市時,你可以問你的Echo Buds哪裏有西紅柿。Echo Buds需要登記一下你現在在Whole Foods超市裏,訪問它的平面圖,然後告訴你西紅柿在第七個過道。

再說說另一種情況,如果你的航班遭到延誤,你可以通過公共家庭Echo要求Alexa向你發送一條通知。但可能要發送通知時,也許你已經在開車了。Alexa需要意識到你,而不是室友或家庭成員,需要這一則通知——並且根據你啓動的最後一個Echo設備,明白你現在在你的車裏。因此,這則通知應該送到你的車裏,而不是你家。

這一級別的預測和推理還需要考慮到視頻數據,因爲越來越多的Alexa兼容產品包含攝像頭。比方說你不在家,一個女童子軍敲你家的門賣餅乾。Amazon Ring上的Alexa是一個配備攝像頭的門鈴,它應該通過視頻和音頻輸入記錄誰在你家門口,以及爲什麼在你家門口,知道你不在家,在附近的Alexa設備上給你發一個留言,詢問你想要多少餅乾,並代表你去訂購餅乾。

爲了實現這一點,Prasad的團隊現在正在測試一種用於處理用戶命令的新軟件體系結構。它涉及到通過更多層過濾音頻和視頻信息。首先,Alexa需要登記用戶在大約10萬個可用功能中選擇嘗試哪個功能。接下來,它必須在用戶是誰、這個用戶正在使用什麼設備以及在哪種情境下理解該命令。最後,它將需要根據用戶先前表達的偏好來細化最後的響應。

Prasad說:“這就是我認爲未來幾年將會變成的:推理並使之更個人化,更依據相應的背景。這就像是把所有東西放在一起,做出這些重大決定。”

觸不可及的技術

從技術角度來看,所有這一切都將是一項令人難以置信的成就。Prasad所說的——將各種數據源和機器學習方法結合起來進行高級推理——幾十年來一直是人工智能研究人員的研究目標。

然而,從消費者的角度來看,這些變化也具有關鍵的隱私影響。Prasad的願景實際上是假設Alexa可以隨時隨地跟隨你,在任何時刻對你都有很多的瞭解,併成爲幫助你協調生活的主要工具。在底線上來說,這需要收集大量關於你生活的私密細節。有些人擔心亞馬遜最終會通過你的數據,向你推銷和推送廣告,從而遠遠超出這一底線。“這最終是關於將個人和羣體的日常生活貨幣化的事情,”位於華盛頓特區的消費者隱私倡導組織數字民主中心的執行主任Jeffrey Chester說。

當被追問到這一點時,Prasad強調他的團隊已經讓用戶更容易定期自動刪除他們的數據,並選擇退出人工審查。然而,這兩個選項都沒有阻止這些數據在Alexa的機器學習模型上被使用。事實上,Prasad提到了正在進行的研究,Alexa的訓練過程轉變爲只要有新的用戶數據,模型就可以快速更新的過程,或多或少保證了這些數據的價值在被處理之前就會被捕捉到。換句話說,自動刪除您的數據只意味着一旦更新了訓練算法,它就不會再用於訓練未來的模型;對於當前的模型,您的數據將以大致相同的方式使用。(在後續請求中,亞馬遜發言人表示,該公司不會將Alexa收集的數據出售給第三方廣告商或定向廣告,除非用戶通過Alexa訪問服務。)

斯坦福大學法學院互聯網與社會中心的隱私主管Jen King說,這些數據控制方式太膚淺了。“如果你想給人們有意義的控制,那麼你必須尊重他們完全退出的決定,或者在如何使用他們的數據方面給他們更多的選擇,”她說。“在特定位置向某人提供功能性幫助可以用一種極其隱私保護的方式完成。我不認爲這種情況本身就有問題。“

在實踐中,King設想這意味着幾件事。首先,亞馬遜至少應該讓用戶選擇加入,而不是選擇退出數據的使用。其次,亞馬遜應該更加透明地說明它的用途。目前,當你刪除你的數據時,公司可能已經對它做了什麼還不清楚。她說:“想象一下,你家裏有一臺人工智能監控攝像頭,但你忘了它是開着的,而你卻光着身子在房子裏走來走去。作爲消費者,當你刪除這些文件時,如果系統已經使用它們來訓練正在使用的任何算法,那麼瞭解這些就變得非常有用。”

最後,亞馬遜應該爲用戶提供更多關於何時何地可以使用他們數據的靈活性信息。例如,用戶可能樂意放棄自己的數據,但同時希望自己的孩子不受限制。“科技公司傾向於設計這些產品,認爲要麼全有要麼全無,”她說。“我認爲這是一種非常有誤導性的做法。人們可能想要這些東西的一些便利,但這並不意味着他們想要它們出現在生活的每一個方面。“

Prasad的終極願景是希望Alexa對每個人都有用。即使在發展中國家,他也設想了人們可以在智能手機上訪問到的更便宜版本。“對我來說,我們正在將認知的重擔轉移到日常任務上,”他說。“我想讓Alexa成爲一個生產力的增強者。真正無處不在,對每個人都有用。”

相關文章