作者|王海、孫昊頭圖|CFP.CN

背景

本月初,一篇針對“困在系統裏”的外賣騎手的新聞報道展現了外賣行業中險象環生的現狀,激起社會各界的廣泛討論。面對外賣市場的激烈競爭,平臺持續地追求提升效率和降低成本,採用大數據技術和人工智能算法,並在發掘人力極限的過程中,不斷降低送餐時限,使得全行業外賣訂單單均配送時長在2019年比3年前減少了10分鐘[51] ,顯著提升了顧客體驗,推動外賣成爲了勞動密集型和技術密集型模式結合的代表行業。

然而,由於現有共享經濟商業模式中服務提供者與平臺並沒有正式僱傭關係的特殊性,平臺對騎手的權益保障和社會福利的重視程度仍有待提高;在現有的商業邏輯、算法規則和考覈制度面前,爲了完成更多訂單以提高收入,一些騎手違反交通法規甚至冒着生命危險“乘風破浪”。據統計,在2017年,僅上海市就發生涉及快遞和外賣行業的各類道路交通事故117起,共造成9人死亡,134人受傷[50] 。

當前,激烈的市場競爭環境正推動外賣平臺不斷改進算法和騎手績效考覈方式。社會在收穫良好顧客體驗、較低配送成本和極高配送效率的同時,也付出了騎手權益和行人安全降低的代價。面對此外賣騎手困境,我們將圍繞其中的問題根源,從平臺設計運營和政府監督監管的視角,系統性地提出一系列可以嘗試的改進方案。

作爲致力於大數據,運籌學,以及人工智能方法在智慧城市領域應用的學者和研究者,我們期望用更加科學的運營流程和算法邏輯,構築健康,溫暖,高效,可持續並且具有社會責任的外賣生態體系。

我們的方案將從平臺設計運營和政府監督監管兩方面展開——

在平臺設計部分,方案將聚焦騎手激勵機制、運營流程和算法,以及供需調節機制等內容;

在政府監管部分,方案將聚焦明晰勞資關係、加強資質審覈和運營監督、明確平臺責任、以及市場競爭與政府幹預等內容。由於時間和篇幅所限,本文並沒有列舉介紹所有可能的改進方向,僅選擇我們認爲對解決外賣騎手困境最重要並且具有實際可行性的內容。

針對每項的具體內容,我們在“洞察”部分介紹了相關的經濟學和管理學原理,或者相關的數據科學、人工智能和優化算法的可能技術實現路線,以供業內人士和專家學者等參考,讀者直接跳過該部分內容不會影響對全文的理解。

平臺設計

1、騎手激勵機制設計

在圍繞外賣騎手困境的討論中,改善騎手的激勵和獎懲機制是大家關注的一個焦點。

在基於人工智能算法的外賣配送系統中,從顧客成功下單的時刻起,該系統便會自動化計算最優的訂單分派和騎手配送路線,並且預測訂單的“預計送達時間”,然後以此考覈騎手的“準點率”;一旦訂單配送超時,騎手們將面臨降低收入甚至淘汰出局的懲罰。

在此過程中,值得重點關注的是,這套“最優”方案只是在給定的歷史數據和預設的模型參數下、通過模擬現實得到的“理想值”或者“樂觀值”。因此,面對複雜多變的現實場景,外賣騎手的激勵機制需要具備容錯性和靈活性,幫助外賣騎手抵抗已知或者未知的市場不確定性帶來的負面衝擊,降低外賣騎手收入的波動,這不僅有助於提升騎手們的福利水平,也將會增強平臺的總體運力。

(1)預計送達時間容錯

面對無法避免的外賣訂單配送超時風險,平臺可以考慮引入“超時容錯機制”,訂單的“預計送達時間”設置和顯示爲一定的時間段(例如,“17:20~17:25 到達”),並且根據商家的備餐狀態和騎手的配送情況動態調整、提前向顧客提醒可能的超時送達,而不是精確到具體的時刻(例如,“預計17:23到達”)甚至故意將顧客端顯示的“預計送達時間”設定的短於騎手端。

洞察:

從技術層面而言,即便是採用先進的深度學習算法,模型學習到的結果也只是關於“預計送達時間”(Estimated Time of Arrival,簡稱 ETA)的統計分佈,並不能做到對每個樣本的預測值都有絕對準確的“信心”[47] 。

ETA 參數的區間估計結果(“17:20~17:25”)會比點估計結果(“17:23”)更加具有可信度,因爲後者並不能告訴顧客真實的送達時間與它的距離,而前者則可以反映真實的送達時間所處的大致可信範圍(confidence interval)。

從管理層面而言,區間形式的“預計送達時間”是應對預測算法的誤差和外部配送環境的變化的容錯策略,體現的是對騎手和顧客負責任的態度。與此相關,平臺還可以根據送達時間的區間設置彈性的實際送達時間考覈標準:如果實際送達時間在“預計送達時間”前後N分鐘,則該筆訂單配送記錄判定爲“正常”,如果實際送達時間超過“預計送達時間”N分鐘,則該筆訂單配送記錄判定爲“超時”而納入超時評估體系;最後,如果實際送達時間早於“預計送達時間”N分鐘,則該筆訂單配送記錄判定爲“快速”而納入高效獎勵體系。

類似思想已經被外賣平臺的ETA預估算法所採納[47] ,也可以作爲超時容錯策略體現在騎手激勵機制設計中。

(2)彈性的超時獎懲

圍繞超時容錯機制,平臺可以考慮針對騎手“超時率”劃分多個區間段、設計更具有彈性的階梯式超時獎懲規則:超時率被劃分成多個區間段,例如,[0%, 5%]、(5%, 10%] 以及10%以上,如果騎手的超時率處於第一個區間段,則騎手的績效水平不會受到影響;如果騎手的超時率處於第二個區間段,則騎手的績效水平將受到適當輕微的負面影響;但是,如果騎手的超時率處於更高的區間段,則騎手的績效水平將受到顯著增強的負面影響。

洞察:

當前,騎手們的超時率通常不得高於3%,否則,包括騎手、站長甚至區域經理等所有人都將面臨績效的懲罰[51]。那麼,從激勵機制設計的本質而言,無論是預計送達時間容錯機制還是彈性超時獎懲機制,從數學模型的角度,都是在期望構建基於騎手工作績效(即超時程度或者“超時率”)的非線性激勵機制。

類似分段階梯式的非線性懲罰機制在線上多邊平臺市場中經常出現,例如,在網約車市場,爲了杜絕司機的刷單作弊行爲,平臺會設計階梯式作弊違規處罰標準:“第一次禁用3天,第二次禁用15天,第三次解除合作;累計非法獲利≥1000元時,解除合作永不錄用”[39]。

在激勵騎手們準時配送以最大化日成交金額(Gross Merchandise Volume,簡稱 GMV)或者日完單量的問題中,訂單的送達狀態取決於配送過程中環境的不確定性、騎手們的工作業務水平、以及騎手們對承擔風險的態度等多方面因素,有一些因素只有騎手們自己知道,而平臺並不能完全掌握。

那麼,採用非線性激勵機制是否一定會提升平臺整體的運營效率呢?從管理學理論上講,基於績效的激勵機制包含激勵強度的“斜率”(slope of incentive intensity)和激勵的“形狀”(shape of incentive contract)兩個特徵:斜率是指激勵強度關於績效的變化率,例如,超時率增加一個單位將會帶來的收入懲罰絕對變化值,而形狀是指激勵關於績效水平的非線性(或者稱凹凸性)。

研究表明,高激勵斜率有助於改善績效水平,而強非線性將會增強個體承擔風險的偏好;同時,最新的實證結果顯示,激勵的斜率會影響個體的風險偏好,而激勵的形狀也會影響績效水平[11]。

因此,構建基於騎手工作績效的激勵機制需要綜合上述多方面因素,合理選擇激勵關於績效水平的斜率和形狀,這樣有助於提升配送系統整體的效率。

(3)騎手配送超時互助保險

爲了進一步應對外賣訂單配送超時風險,以及降低配送超時對騎手收入造成的激烈波動,平臺除了在用戶端提供配送超時保險和賠償之外,還可以考慮嘗試建立“騎手配送超時互助保險”機制:該保險可由騎手自主選擇是否加入,即騎手在選擇接單的同時還可以選擇是否願意爲這筆訂單繳納較低金額的超時保險費,這筆費用成爲騎手之間互助的保險金額池。如果騎手因爲任何原因無法按時送達訂單,可由金額池向騎手提供經濟補償以降低其收入波動,金額池內的餘額最後都退還給騎手。

洞察:

在市場經濟條件下,保險是一個管理風險的常見工具,例如,在電子商務平臺上,保險公司會向第三方賣家推出以商品買家爲被保險人的“退換貨運費險”,以便降低可能的退換貨運費給買家造成的損失[42]。在外賣行業中,67%的騎手家庭人口在3人~5人,四成騎手的愛人選擇在家照顧孩子和老人,同時,五成騎手是家庭收入的主要來源,七成騎手月收入在五千元以下,這些數字意味着大多數騎手正面臨着來自自身和家庭的雙重消費壓力[43]。

那麼,設立“騎手配送超時互助保險”的核心目的在於希望能夠建立大數量騎手們互助的保險金額池,緩解超時對個體騎手帶來的負面收入衝擊,降低個人收入的波動性,最終發揮平滑騎手收入的作用。

研究表明,在面對風險時,低收入勞動者或者家庭通常會基於工作和消費等兩類經濟行爲進行調節:一是平滑收入(income smoothing),例如,通過同時兼任多份工作以提高收入來源的多樣性和穩定性(在美團平臺,35%的騎手擁有包括小生意或者其它外賣平臺在內的其它收入來源[43]);二是平滑消費(consumption smoothing),例如,調整自身的勞動力供給水平和使用保險協議[22]。

從這兩類經濟行爲可以看出,“騎手配送超時互助保險”可以有助於騎手抵禦超時風險,降低收入的波動性,也將會激勵騎手提供更好的運力供給。

(4)考覈週期延長

爲了進一步幫助騎手降低收入的波動性,平臺可以考慮延長對騎手的考覈週期,將以較短“時間段”(例如,現在平臺的衝單獎勵活動和考覈時間段一般是一天的某個時段),或者以“天”爲單位的獎勵或者懲罰考覈週期適當延長至“星期”甚至“月”,通過實踐尋找出最佳的考覈週期,以降低騎手對短期高頻考覈的焦慮,提高系統的整體效率。

洞察:

類似基於時間段的衝單獎勵看起來有助於滿足高峯期時段的旺盛需求,但是,關於共享經濟商業模式的實證研究表明,理性的服務提供者爲了儘可能獲得活動期的高衝單獎勵,可能會選擇在活動期開始之前策略性的停止工作,以等待高峯期的到來,這種“前瞻”(forward-looking)行爲將會導致平臺在高峯期到來之前的運力供給出現下降,給整個系統的運行效率造成負面影響[34]。

考覈週期的延長將有助於平滑騎手在不同時間段內的平均收入,激勵騎手們維持穩定的服務質量水平,保障平臺總體運力的平穩運行。那麼,平臺是否應該儘可能延長或者縮短激勵機制中的考覈週期呢?最近,一份關於產品銷售人員薪酬體系設計的研究表明,銷售人員的工作績效將會顯著受到考覈週期的影響:當平臺將激勵機制的考覈週期縮短時(比如,從“月”度考覈調整爲“天”度考覈),原本優秀的銷售人員就表現出了下降的績效水平[10]。

值得關注的是,已有的行爲學實驗研究和現實商業現象表明,基於考覈目標的高頻績效評估會潛在地增加人員的焦慮心理和工作壓力,甚至會因爲激發人員過於激進而引發欺詐和不道德行爲[23][38]。

基於上述結論,並結合現實中“外賣小哥在電梯裏急哭了”和逆行違章等現象,我們可以總結到,在外賣市場中,雖然商品性質和商業邏輯並不一樣,但平臺也需要綜合騎手們的配送努力程度,配送能力的差異性,以及他們在進行運力供給決策中的前瞻行爲等綜合因素,非常謹慎地制定出有助於降低騎手收入不確定性和提升平臺整體服務能力的最佳的考覈週期。

(5)多層次多屬性績效評估

除了上述直接根據“超時率”和“完單量”評估騎手績效的指標,平臺應該建立基於綜合服務質量、配送效率和安全保障等多屬性的多層次騎手績效評估體系。當前,系統爲騎手設置的積分等級體系是直接基於完單量、準時率或者顧客評價獎勵積分[51],可以進一步提升騎手們的安全保障、違章記錄、以及公益活動等有助於建設外賣生態體系的多個屬性的重要性。

評估體系可以嘗試根據政府部門監管法規和平臺發展目標爲不同評估指標設定優先級,其中,遵守交通安全法規應該成爲外賣配送的基本要求。

洞察:

在多層次多屬性績效評估體系的設計過程中,在第一層次,考慮到遵守交通安全法規是外賣配送的基本要求,那麼,騎手的“違章率”就需要擺在優先級最高的位置,在一定的考覈期內,如果騎手的“違章率”超過了閾值,則該騎手將被“一票否決”,不會進入到下一層次的績效評估;在第二層,維持並且提升市場佔用率可能是當前平臺運營的關鍵目標,那麼,騎手們的“完單量”可以擺在優先級次高的位置,在對“完單量”合理劃分不同等級的獎勵區間之後,各騎手再根據實際“完單量”進入相應的評估區間;最後,在特定的基於“完單量”的評估區間內,機制再綜合服務質量和顧客評價等屬性設定獎勵金額。

另外,平臺可能需要同時實現“違章率”、“日成交單量”和“超時率”等多個關鍵績效的管理目標,對此多屬性績效目標導向的決策問題,平臺不僅需要考慮到實際績效水平和管理目標的不確定性,還需要關注多個績效指標之間的相關性(例如,嚴格控制“違章率”會減少當前的“日成交單量”)對績效評估體系的影響[25]。

(6)多向評分反饋

外賣市場主要是由顧客、平臺、商家和騎手共同建立起來的生態圈,當前系統採取的是顧客給商家或者騎手的單向評分方式,忽視了騎手們的重要作用。平臺可以建立起“多向”評分反饋系統,其中,顧客給商家和騎手分別評分,顧客對商家的菜品健康和口味等進行反饋,對騎手的派送服務進行反饋;騎手也可以自由選擇給商家評分,反饋商家出餐及時性等信息;更進一步地,騎手還可以給顧客評分,反饋訂單交付難度和顧客接單態度等信息。

與此同時,平臺根據商家、顧客和騎手們的權力和義務,並綜合天氣、路況和其它不可控因素等,設定公平合理的判責系統。

洞察:

在實際商業場景中,例如,網約車市場,不僅乘客可以給司機評分,司機也可以向乘客評分。本質上而言,建立多方評分反饋系統(multi-lateral rating systems)的核心目的是增強在線市場中各參與方之間的信任度[12],降低各參與方之間的信息不對稱性[17],從而“驅逐”低質量的參與方,並且降低交易成本。

爲此,平臺需要認真思考兩個重要問題:一方面,相比於傳統的單向評分反饋系統,多向評分反饋系統是否真的會提升市場效率和社會福利?另一方面,由於參與方做出準確的評分是基於自願且需要付出成本的,在平臺沒有提供適當獎勵的情況下,作爲公共產品的用戶評分將會供給不足[2];因此,如果採取多向評分反饋系統,平臺應該如何激勵儘可能多的參與方真實地披露信息並給出可信的評分結果?

關於第一個問題,以共享經濟商業模式爲背景的理論研究表明,相比於僅有顧客的單向評分,顧客和服務提供者之間的雙向評分將弱化服務提供者之間的競爭,從而提高市場的均衡價格[17];另外,在一定條件下,雙向的評分機制將會提升社會福利[26]。

關於第二個問題,平臺需要合理設計向各參與方展示彼此評分結果的方式和時間:如果平臺在參與方完成評分之後立刻披露結果,那麼,相關的被評價方可能在後續採取報復動作,故意壓低對方的評分,從而導致顧客評分的“失真”[6];但是,如果平臺在雙方或者多方都完成評分或者允許評分的時間窗結束之後才披露結果,那麼,這種策略將會顯著降低評分者進行報復的可能性,並且增加評分的真實性和供給量[13]。

2、運營流程和算法

以上從騎手激勵機制方面介紹了外賣平臺設計的改進方向,本節將聚焦運營流程和算法設計等社會各界正在熱烈討論的話題。算法本身是中性的,而其蘊含的思想和流程則是由平臺的商業邏輯和商業目標決定的,在平臺設計中,平臺可以進一步讓運營流程和算法的目標或者邏輯更加兼顧顧客、騎手和平臺等多參與方的目標,提升社會的整體福利水平。

爲此,根據通常的外賣配送流程,我們分別提出針對顧客端、騎手端和平臺端的運營和算法改進方案,包括餐館推薦系統、預計送達時間預測算法、派單算法、路徑規劃算法、算法參數管理、以及基礎設施建設等六點建議。

(1)顧客端:餐館推薦系統

平臺可以在實時餐館推薦系統的設計中採用更多與應用場景相關、反映實時供需情況和騎手空間分佈的數據。例如,針對一個商家,如果過去 1個小時的騎手等待時間較短、當前周邊分佈的騎手較多、店內聚集的正在等待取餐的騎手較少、或者正在準備的訂單數量較少等,在其它屬性相近的條件下,那麼,該商家在推薦排序算法的輸出結果中可以被優先推薦。

推薦系統還可以根據實時已有訂單的餐館和騎手位置進行拼單推薦,實現外賣的“順風車”。例如,如果一位騎手正在顧客周邊的商家等待取單,而且預估取餐時間較長,那麼,即使該商家不是距離顧客最近或者價格最低,推薦系統也可以在一定程度上提高該商家的推薦權重和優先級。

洞察:

在當前實現的推薦系統中,算法輸入的應用場景數據至少由三大類組成[44]:一是用戶畫像,例如,性別、常駐地、價格偏好、食物偏好等;二是食物畫像,包含商家、外賣、團單(即團購訂單),其中,商家特徵包含商家價格、商家好評數、商家地理位置等,外賣特徵包含平均價格、配送時間和銷量等,團單特徵包含適用人數和返購率等;三是場景畫像,包含用戶當前所在地、時間、定位附近商圈、基於用戶的上下文場景信息等。

如果基於上述方案改進餐館推薦系統,系統可以採用基於在線優化(online optimization)和增強學習(reinforcement learning)的算法,實時更新客戶端的餐館推薦結果,最終將餐館推薦系統打造成調節市場供需平衡狀態的重要工具之一。另外,關於實現外賣的“順風車”,類似思想已經在網約車市場中實現,目的是希望通過將目的地相近或者順路的訂單整合在一起,從而提升配送資源的利用率,其中,需要同時解決訂單與騎手的雙邊匹配問題、以及針對“順風車”訂單的配送費定價問題[19][17]。

(2)顧客端:預計送達時間預測算法

預計送達時間預測算法可以融合來自騎手的手機 GPS 實時定位數據、手機運動傳感器移動數據、和安卓操作系統特定應用程序蒐集的活動識別數據等多源異質數據集[28],識別騎手在不同時刻所處的活動狀態以及狀態改變的時間點。這將有助於提升訂單交付時間的預測準確性,尤其是和樓層高度、小區內配送和顧客交付相關的時間。同時,爲了明確商家和騎手的責任,並且方便顧客對商家和騎手進行公平的評分,平臺應該分別預測、顯示和評估“商家出餐時間”和“騎手送餐時間”。

洞察:

在外賣配送場景中,預計送達時間(ETA)是用戶成功下單時刻到騎手將外賣送達到顧客手中的送達時間預測結果,具體可以分解爲壓單時間(從商家接單到騎手接單)、到店時間(從騎手接單到騎手到店)、取餐時間(從騎手到店到騎手取餐)、送餐時間(從騎手取餐到到達用戶)、以及交付時間(從到達用戶到完成送達),此過程還包含了出餐時間(從商家接單到商家出餐)[45]。

關於騎手送餐時間,一個最大的技術性挑戰,也是目前網友們激烈討論的實際問題是對交付時間的預估,即騎手到達用戶附近下車後多久能送到用戶手中:一方面,老舊小區沒有電梯、或者寫字樓難以等到電梯等現實問題給騎手們快速交付訂單帶來困難;另一方面,在進行交付時間預估時,算法的輸入字段較少,重要的維度特徵僅包括交付地址(文本數據)、交付點的經緯度、區域、以及城市[48]。

對此,如果基於手機GPS實時定位數據、手機運動傳感器移動數據(motion sensor data)、以及安卓操作系統ActivityRecognitionClient API蒐集的活動識別數據(activity recognition data)等改進ETA預測算法,平臺將更清晰地識別騎手運動狀態,例如,電動車騎行中、步行中、奔跑中或者原地等待中等,然後採用深度學習方法進行序列建模(sequence modeling),實現對ETA尤其是交付時間的更準確地預測。

(3)騎手端:派單算法

在派單過程中,派單算法應當考慮騎手之間的訂單負載均衡,讓不同騎手當前累積分配到的訂單數量相對比較平均,避免出現個別騎手承載過大的配送任務、而有些騎手被閒置的局面。同時,派單算法還應當考慮騎手在當地區域的熟知程度和配送經驗等有助於提升派單效率的多種因素。

洞察:

實時派單算法是智能配送系統中的重要組成部分,當前的實時派單問題被描述爲以離散馬爾可夫決策過程(Markov Decision Process)爲核心的動態隨機優化問題,其目標是一段時間內的顧客體驗(例如,準時率)和騎手效率(例如,單均行駛距離或者單均消耗時間)等指標最優,算法需要計算動態到達的訂單分配給騎手的策略、以及每個騎手後續的節點訪問順序(即路徑規劃,routing optimization)[49]。

在對該問題進行合理建模和算法優化之後,派單算法可以實現騎手訂單負載均衡(workload balance)和融合騎手當地區域知識和配送經驗。對此,建模人員可以通過在目標函數中引入“最大化所有騎手的最小訂單負載”(maxmin)或者“最小化所有騎手的最大訂單負載”(minmax)的方式進行調整。

另外,派單算法引入騎手在當地區域的熟知程度和配送經驗等因素,這不僅意味着 ETA 的預測算法需要納入騎手在當地區域的熟知程度和配送經驗等重要指標,也意味着派單算法需要考慮騎手們之間在這兩個維度上的差異性。綜合以上因素,由多目標優化算法(multi-objective optimization)給出滿足多個目標的最佳派單結果[21]。

(4)騎手端:路徑規劃算法

與派單算法緊密關聯的是路徑規劃算法,算法應該引入與實際路況更爲貼切的特徵,例如,單行道、限行、機動車道和非機動車道,以及交通管制和交通擁堵等,並且根據實時信息進行調整。

洞察:

針對騎手路徑規劃的問題,平臺需要建立基於有向圖的實時動態路徑規劃模型,輸入該模型的可行路徑集合(set of feasible routes)需要根據離線信息進行縮小[33],例如,許多單行道、限行路線和過街天橋不允許電動車經過的路線就應該作爲強約束從集合中剔除;另外,該集合還需要根據實時信息進行調整,例如,出現嚴重交通擁堵或者臨時交通管制的路線也應該被剔除。

同時,面對隨機的訂單需求和配送時長,該問題可以考慮借鑑離線-在線近似動態規劃算法[30] (offline-online approximate dynamic programming)或者在線再優化策略[5](online re-optimization strategy)的思想進行求解。

(5)平臺端:算法參數管理

平臺端對算法參數進行及時審覈並且合理設置是解決外賣騎手困境的關鍵之一,在此應該得到重點關注。這個問題起源於平臺在預測訂單“預計送達時間”探索實踐中的模型迭代過程:在實際的ETA預估場景下,算法的損失函數設計是以“整體的預估結果能夠儘量前傾”爲目的,而且對於遲到部分會增加數值懲罰[47],這意味着算法在不斷“逼迫”騎手縮短實際送達時間,而騎手每一次成功避免超時的歷史記錄都會讓算法“學習”到可能更短的送達時間,即便這個送達時間是騎手通過闖紅燈、逆行等違反交通規則甚至冒着生命危險的方式實現的。基於此邏輯,這些歷史數據會進一步提高算法對騎手送達時間的“期待”,從而使算法朝着縮短送達時間的方向進行要求和優化。

對此,平臺應該通過對實際送達時間等算法的參數進行及時審覈和調整以終止上述的惡性循環,也就是賦予算法“底線思維”。遵守交通法規和維護行人安全是不可逾越的底線,是數據預處理環節進行歷史數據清洗和校正必須考量的因素,是數學模型中的“硬約束條件”,也是優化算法剔除不可行路徑中必須滿足的規則。這也意味着訂單送達時間應該存在着一個合理的、無法通過算法不斷優化而逾越的下界,否則,不管在任何激勵機制和評分體系之下,缺乏“底線思維”的算法流程會一直將騎手困在系統之中。

(6)平臺端:基礎設施建設

針對最後 100米配送問題,平臺可以嘗試自建或者聯合第三方物流公司建設外賣取餐櫃[52]。取餐櫃的候選位置可以是辦公場所、寫字樓、醫院以及高校,而顧客可以選擇線上下單、線下取餐。

洞察:

考慮到取餐櫃的選址將會影響顧客線上下單、線下取餐(buy-online-pick-up-in-facility)的便利性,平臺可以進行兩階段的取餐櫃網絡設計優化:在第一階段,平臺可以結合各個區域的人口社會統計、經濟發展、歷史完單、以及配送時長等多維度數據建立機器學習模型和計量經濟學模型以預測各區域的潛在需求和建立取餐櫃對需求的影響[15];在第二階段,平臺可以建立取餐櫃設施選址(facility location optimization)和騎手服務區劃分(service region allocation optimization)的多階段隨機規劃模型(multi-stage stochastic programming),聯合優化取餐櫃的位置和騎手的派單服務策略。

除此之外,在需求量較大的辦公樓、小區、學校和醫院等場所,平臺也可以考慮配備專職的終端派送人員,一方面是因爲終端配送人員對小區周邊和電梯設備更加熟悉,可以幫助降低因騎手對環境陌生而造成的顧客等待時間,另一方面是能夠實現對局部區域的訂單統一管理和配送、從而避免騎手的重複勞動。

洞察:

配備專職終端人員在提升平臺整體運營效率的同時也會增加平臺的運營成本,需要進行深入的成本-效益分析。分析框架可以將配送過程視爲一個排隊系統 (queueing system)[32],在指定場所配備專職的終端配送人員將會增加固定人力成本,但是,值得關注的是,根據排隊論,配送騎手的每單的平均派送時間和顧客的等待時間等系統的服務質量指標之間存在着強烈非線形的關係,這意味着通過配備專職終端人員以適當降低騎手們在這些場所所花的派送時間可能會帶來系統服務質量指標的顯著提高,從而使得帶來的配送效益可能會高於額外的人力成本。

在未來,平臺還可以推廣使用機器人和無人機配送。同時,作爲互聯網公司,平臺可以通過在相關核心技術的資本投入和技術積累,轉型成爲高科技公司。實際上,美團已經開始嘗試無人車和無人機的配送:在 2月份疫情期間,外賣平臺利用無人配送車爲北京市順義區幾個小區的居民做訂單配送,截至 9 月初,平臺已經累計使用無人車配送了超過6000多用戶實際訂單,覆蓋該站點超過80%的訂單需求;目前,平臺也在深圳等地進行無人機的運營測試[53]。

洞察:

在設計無人車輔助的配送系統中,面對無人車配送和騎手配送的兩種模式,考慮到無人車的在成本方面的優勢和在靈活性方面的不足,平臺可以基於實際配送場景、市場供需狀態、以及交通路況,採用馬爾可夫決策過程聯合優化無人車和騎手之間的分配比例、以及無人車和騎手的配送路線[29]。

3。 供需調節機制

在實際的運營中,外賣平臺可以嘗試對配送價格進行調整以調節市場供需。平臺可以根據配送距離和配送時段等諸多因素合理設計基礎的派送價格和騎手端補貼;另外,平臺也可以針對突變的供需情況,實時調整騎手的配送費用來緩解供需不平衡的問題[46][36]。

其實,作爲企業收益管理的重要工具,動態定價已經在多個行業得到廣泛使用,包括在上個世紀 80 年代開始得到採納的航空業、90 年代開始得到採納的酒店業和租車業[31]、以及當前新興的共享出行行業[3]。

在外賣行業,平臺面臨的市場供需不協調的問題更加突出,而且市場供需狀態隨時間變化劇烈。採取不同形式的配送價格可以區分顧客對等待時間的實際需求和時間敏感性,這對提高和使用供需彈性,緩解供不應求帶來的負面影響具有一定積極作用;然而,基於配送價格的動態定價機制並不能解決所有問題,無論是在現實生活還是學術研究中仍然存在爭議,這依賴於平臺對該策略的價值進行更加深入的探究。

(1)基於區域和時間段的時空動態定價

在調節市場供需平衡狀態的過程中,平臺可以針對每筆訂單的配送費實行基於配送區域、下單時間或者送達時間的動態定價,並且對願意等待的顧客提供願等打折。

洞察:

基於區域和時間段的時空動態定價(dynamic & surging pricing)通常可以分爲“乘積溢價”(multiplicative surge)和“加和溢價”(additive surge)兩類:在特定區域和時間段內,前者是指在基礎價格上乘以一定倍數(例如,1.5倍),美國的網約車平臺Uber早期就是使用該類溢價策略;而後者是指在基礎價格上加上與距離無關的常數(例如,10元),這是 Uber 平臺當前採用的最新溢價策略。研究表明,在供需動態變化的環境下,相比於乘積溢價策略,加和溢價策略是激勵相容 (incentive-compatible) 的定價機制[14],這爲外賣平臺設計基於配送費的實時動態定價策略提供了新的方向。

值得提醒的是,實時動態定價策略在社會各界中仍然存在爭議,理論研究結果顯示,在共享出行市場的背景下,理性的乘客和司機會策略性地等待更合適的價格或者收入,如果市場狀態比較平穩,那麼,平臺沒有必要採用實時動態定價策略,尤其是該策略可能造成乘客、司機、監管者之間對立的局面[9]。

(2) 顧客靈活充值賬戶

爲了彌補實時動態定價在區分顧客對等待時間的實際需求和時間敏感性方面的不足,平臺可以建立靈活的用戶充值賬戶:在高峯期時段,如果需要外賣儘快送到,顧客可以向個人在平臺上的賬戶充入額外的金額,這些資金並不會流入騎手或者平臺,而是作爲用戶的充值餘額,可以在低峯期時段點餐使用。

洞察:

顧客在高峯時段的充值行爲將傳遞出其對派送的等待時間比較敏感的信號,作爲系統派單算法的依據,並且,顧客在低峯期使用賬戶餘額訂餐,可以激發低峯時段的整體需求,充分利用低峯期時段閒散的備餐和配送資源,發揮平滑市場需求的作用。針對網約車市場的研究結果表明,在一定條件下,合理設計用戶充值賬戶機制 (integrated reward scheme with surge pricing) 可以實現多方共贏,提升顧客、司機和平臺的整體社會福利[37]。

(3)增加兼職和衆包騎手

平臺提升兼職和衆包騎手的運力佔比有助於提高運力調整的空間和彈性,從而更有效的調節市場的供需平衡狀態。

洞察:

平臺的騎手分爲專送全職騎手和衆包兼職騎手,前者的工作時間固定並且接受系統派單,後者靈活決定工作時間並且可以有限次拒絕派單[51]。爲了提升整體的運力供給,尤其是滿足高峯期時段的配送需求,平臺通常會採用現金獎勵的方式補貼騎手。實證研究表明,在網約車市場中,平臺補貼將會從勞動者是否選擇工作和工作時長兩個維度影響勞動力供給,而且,兼職勞動者的收入供給彈性 (supply elasticity) 更高[24]。

這意味着外賣平臺需要更加嚴密地研究騎手們的運力供給行爲,分析騎手們對期望收入水平發生變化而進行的運力供給調整,然後合理設計平臺上全職騎手和兼職騎手的比例,並精準地向騎手、尤其是兼職騎手提供補貼獎勵。

4。 政府監管

精準的政府監管對外賣行業實現可持續健康發展至關重要。深入而全面地理解平臺的商業邏輯和運營流程有助於制定高效精準的監管措施,這不僅依賴於平臺向監管者真實而全面地披露公司運營相關的信息,也依賴於監管部門聯合第三方專業研究機構共同完成對信息的分析和總結[8]。基於全面而系統的專業分析之後,監管者再對平臺和騎手的勞資關係、運營過程中的資質審覈和監管、以及平臺責任以法律法規形式進行統一規範。

(1)明晰勞資關係

相關部門需要加快出臺法律法規,明晰包括外賣騎手在內的自由職業者與共享經濟/零工經濟平臺之間的勞資關係,對全職騎手與兼職騎手的法律地位進行清晰的分類,界定相應的權利和義務[16]。

洞察:

針對相關的勞資關係,國家發展改革委於2020年7月14日發佈文件要求,強化靈活就業勞動權益保障,探索適應跨平臺、多僱主間靈活就業的權益保障、社會保障等政策[40]。作爲參考,2019年9月18日,美國加州正式簽署了AB5法案[7],並於2020年1月1日正式生效。該法案要求將臨時合同工(例如,網約車司機)納入僱主的正式受僱員工,這意味着相關企業的業務成本(例如,最低工資、保險和員工福利等)將大幅增加,並將影響公司的員工管理機制和定價機制。

實際上,爲了滿足該法案的要求,從2020年7月9日開始,Uber平臺已經開始允許司機自己根據服務時間和距離設定價格[27]。目前,圍繞AB5法案、以及自由職業者與平臺之間的勞資關係仍然存在非常大的爭議,一部分學者建議創立一個新的、介於僱員和合同工之間的第三類工作類別,該類別將保留自由職業者的一部分工作靈活度,同時,賦予他們部分全職僱員可以享受到的福利待遇[16][35]。

(2)加強資質審覈和運營監督

交管、人社、應急管理等相關部門應當督促和加強對平臺和騎手的資質審覈和安全培訓。在勞動者申請加入平臺過程中,平臺需要對騎手電動車的准入標準進行統一登記管理;與此同時,加強對平臺運營流程的監督,比如,可以藉助騎手 APP 的渠道對平臺的配送路徑規劃等算法進行監管審查,嚴禁對騎手提供違反交通規則(例如,逆行)的推薦路線;相關部門還可以對平臺上騎手每天的連續配送時長設置上限並進行合理監督,避免出現因爲騎手疲勞工作而造成的交通事故。

(3)明確平臺責任

在對涉及快遞和外賣行業的道路交通安全進行監管的過程中,監管部門應該把平臺所屬騎手發生的交通事故和違章次數、以及相應後果的嚴重程度作爲對平臺重要的監管指標,按月度或者季度等進行考覈和追責,從而督促平臺和騎手共同維護配送安全。

針對已經發生的交通事故,已有的法院判決爲相關的責任劃分提供了具有現實意義的指導。近日,關於浙江省湖州市吳興區的外賣騎手撞傷行人一案,法院最後宣判,外賣騎手雖然沒有與平臺簽訂法律勞務合同,但對外是以“平臺網上訂餐配送”的名義爲客戶提供服務,且在提供配送服務時受平臺管理制度的約束,報酬由平臺發放,因此,無論是否與公司籤合同,在其接受配送任務後均與配送平臺建立了僱傭關係,在送餐中發生事故,作爲僱主的公司應承擔賠償責任[41]。這一結果無疑明確了外賣平臺必須加快運營管理流程的調整,以保障騎手安全和行人安全。

(4)市場競爭與政府幹預

監管部門需要在遵循平臺競爭規律和市場調節作用的條件下制定提升社會福利的監管法規。在市場經濟環境下,平臺之間的自由競爭將會影響平臺選擇最優的騎手激勵機制以及運營流程和算法。但是,競爭形成的市場結果並不一定能夠實現社會各參與方的福利最大化,可能陷入“囚徒困境”的局面。

例如,如果一個平臺沒有嚴格遵守法規制度,漠視騎手權益,那麼,爲了維持甚至擴大市場份額和利潤,其競爭對手很有可能也不會選擇嚴格遵守法規制度和提升騎手權益。爲此,監管部門應該充分考慮多平臺競爭的市場環境,以問題爲導向制定相關法規,一視同仁地對所有平臺進行嚴格的監管。

洞察:

平臺之間的市場競爭雖然會有助於提升市場效率,但在一定的情況下,也有可能出現市場失靈,競爭無法達到最優的納什均衡(Nash equilibrium)。對此,監管者可以考慮根據博弈論(game theory)和機制設計(mechanism design)的理論和工具來刻畫騎手、顧客、商家和多個平臺之間的交互行爲,並研究市場中的平臺競爭結果[1]。

特別是針對競爭的外部性(externalities)可能導致出現的市場失靈的情況,監管部門需要考慮相應的監管制度規則以引導相互競爭的平臺向更有利於提升社會福利的方向發展。

總結

作爲致力於大數據,運籌學,以及人工智能方法在智慧城市領域應用的學者和研究者,我們從平臺設計運營和政府監督監管兩方面爲解決外賣騎手困境提供了可能的解決方案,探討了騎手激勵機制、運營流程和算法、供需調節機制等平臺可以採取的運營策略,並分析了明晰勞資關係、加強資質審覈和運營監督、明確平臺責任、以及市場競爭與政府幹預等監管者面臨的挑戰。

構築健康、溫暖、高效、可持續並且具有社會責任的外賣生態體系,需要我們從社會倫理、法律制度以及經濟學和管理學原理出發,融合大數據技術和人工智能算法等工具,充分滿足不同目標下多參與方的核心利益。

最終,讓每一方都釋放出最大的善意以實現共贏,只有這樣才能提升社會整體的福利水平,讓人們真正享受到科技爲生活帶來的便利。

作者簡介:

王海:清華大學學士,麻省理工學院運籌學博士,現爲新加坡管理大學決策分析方向助理教授,美國卡內基梅隆大學信息系統與公共政策學院訪問教授;研究方向爲運籌學,大數據,優化算法,以及人工智能的方法論及其在智慧城市場景的應用;主要領域包括智能交通,共享經濟,智慧物流,以及智慧醫療等。個人主頁,http://wang-hai.net/

孫昊:華中科技大學學士,清華大學管理科學與工程博士,現爲香港大學經濟及工商管理學院博士後;研究方向爲銀行與金融中介,在線市場設計,統計學習方法與應用;主要領域包括金融科技與創新,共享經濟等。

參考文獻:

[1]  Ahmadinejad, AmirMahdi, Hamid Nazerzadeh, Amin Saberi, Nolan Skochdopole, and Kane Sweeney。 (2019)。 Competition in ride-hailing markets。 Available at SSRN 3461119。

[2]  Avery, Christopher, Paul Resnick, and Richard Zeckhauser。 (1999)。 The market for evaluations。  American Economic Review , 89(3),564-584。

[3]  Bai, Jiaru, Kut C。 So, Christopher S。 Tang, Xiqun (Michael) Chen, and Hai Wang。 (2019)。 Coordinating supply and demand on an on-demand service platform with impatient customers。  Manufacturing & Service Operations Management , 21(3), 556-570。

[4]  Basu, Amiya K。, Rajiv Lal, V。 Srinivasan, and Richard Staelin。 (1985)。 Salesforce compensation plans: An agency theoretic perspective。  Marketing Science , 4(4), 267-291。

[5]  Bertsimas, Dimitris, Patrick Jaillet, and Sébastien Martin。 (2019)。 Online vehicle routing: The edge of optimization in large-scale applications。  Operations Research , 67(1), 143-162。

[6]  Bolton, Gary, Ben Greiner, and Axel Ockenfels。 (2013)。 Engineering trust: reciprocity in the production of reputation information。 Management Science , 59(2), 265-285。

[7]  California Legislative Information。 Assembly Bill No。 5。 September 18, 2019。 https://leginfo.legislature.ca.gov/faces/billTextClient.xhtml?bill_id=201920200AB5。

[8]  Calo, Ryan, and Alex Rosenblat。 (2017)。 The taking economy: Uber, information, and power。  Columbia Law Review , 117, 1623。

[9]  Chen, Yiwei, and Ming Hu。 (2020)。 Pricing and matching with forward-looking buyers and sellers。  Manufacturing & Service Operations Management , 22(4), 717-734。

[10]  Chung, Doug J。, Das Narayandas, and Dongkyu Chang。 (2020) The effects of quota frequency: Sales performance and product focus。  Management Science 。

[11]  de Figueiredo Jr, Rui JP, Evan Rawley, and Orie Shelef。 (2019)。 Bad bets: Nonlinear incentives, risk, and performance。  Strategic Management Journal 。 https://doi.org/10.1002/smj.3111

[12]  Einav, Liran, Chiara Farronato, and Jonathan Levin。 (2016)。 Peer-to-peer markets。  Annual Review of Economics , 8, 615-635。

[13]  Fradkin, Andrey, Elena Grewal, and David Holtz。 (2020)。 Reciprocity in two-sided reputation systems: Evidence from an experiment on Airbnb。 Working Paper, MIT Sloan School of Management。 https://andreyfradkin。 com。

[14]  Garg, Nikhil, and Hamid Nazerzadeh。 (2019)。 Driver surge pricing。 arXiv preprint arXiv:1905.07544。

[15]  Glaeser, Chloe Kim, Marshall Fisher, and Xuanming Su。 (2019)。 Optimal Retail Location: Empirical Methodology and Application to Practice: Finalist–2017 M&SOM Practice-Based Research Competition。  Manufacturing & Service Operations Management , 21(1), 86-102。

[16]  Hagiu, Andrei, and Julian Wright。 (2019)。 The status of workers and platforms in the sharing economy。  Journal of Economics &Management Strategy , 28(1), 97-108。

[17]  Ke, Jintao, Hai Yang, Xinwei Li, Hai Wang, and Jieping Ye。 (2020)。 Pricing and equilibrium in on-demand ride-pooling markets。  Transportation Research Part B: Methodological 139: 411-431。

[18]  Ke, T。 Tony, Baojun Jiang, and Monic Sun。 (2017)。 Peer-to-peer markets with bilateral ratings。 In MIT Sloan Research Paper No。 5236-17; NET Institute Working Paper No (pp。 17-101)。

[19]  Li, Ruijie, Yu (Marco) Nie, and Xiaobo Liu。 (2020) Pricing carpool rides based on schedule displacement。  Transportation Science 54(4):1134-1152。

[20]  Liu, Sheng, Long He, and Zuo-Jun Max Shen。 (2018)。 On-time last mile delivery: Order assignment with travel time predictors。 Management Science 。

[21]  Lyu, Guodong, Wang Chi Cheung, Chung-Piaw Teo, and Hai Wang。 (2019)。 Multi-objective online ride-matching。 Working paper, National University of Singapore。 Available at SSRN 3356823。

[22]  Morduch, Jonathan。 (1995)。 Income smoothing and consumption smoothing。  Journal of Economic Perspectives , 9(3), 103-114。

[23]  Schweitzer, Maurice E。, Lisa Ordóñez, and Bambi Douma。 (2004)。 Goal setting as a motivator of unethical behavior。  Academy of Management Journal , 47(3), 422-432。

[24]  Sun, Hao, Hai Wang, and Zhixi Wan。 (2019)。 Model and analysis of labor supply for ride-sharing platforms in the presence of sample self-selection and endogeneity。  Transportation Research Part B: Methodological , 125, 76-93。

[25]  Tsetlin, Ilia, and Robert L。 Winkler。 (2007)。 Decision making with multiattribute performance targets: The impact of changes in performance and target distributions。  Operations Research , 55(2), 226-233。

[26]  Tunc, Murat M。, Huseyin Cavusoglu, and Srinivasan Raghunathan。 (2019)。 Two-sided adverse selection and bilateral reviews in sharing economy。 Available at SSRN 3499979。

[27]  Uber Blog。 California drivers: Set your own fares when you drive with Uber。 June 25, 2020。

https://www.uber.com/blog/california/set-your-fares/。

[28]  Uber Engineering。 How trip inferences and machine learning optimize delivery times on Uber Eats。 (2018)。 https://eng.uber.com/uber-eats-trip-optimization/。

[29]  Ulmer, Marlin W。, and Barrett W。 Thomas。 (2018)。 Same-day delivery with heterogeneous fleets of drones and vehicles。  Networks ,72(4), 475-505。

[30]  Ulmer, Marlin W。 Justin C。 Goodson, Dirk C。 Mattfeld, and Marco Hennig。 (2019)。 Offline–online approximate dynamic programming for dynamic vehicle routing with stochastic requests。  Transportation Science , 53(1), 185-202。

[31]  Wall Street Journal。 (2015)。 Now prices can change from minute to minute。 December 14, 2015.https://www.wsj.com/articles/now-prices-can-change-from-minute-to-minute-1450057990。

[32]  Wang, Hai, and Amedeo Odoni。 (2016)。 Approximating the performance of a “last mile” transportation system。  Transportation Science , 50(2), 659-675。

[33]  Wang, Hai。 (2019)。 Routing and scheduling for a last-mile transportation system。  Transportation Science , 53(1), 131-147。

[34]  Wang, Hai, and Hao Sun。 (2020)。 Peak-hour incentive design with strategic driver behavior。 Singapore Management University, working paper。

[35]  Wang, Hai, and Hao Sun。 (2020)。 The optimal labor supply flexibility on ride-sharing platforms。 Singapore Management University, working paper。

[36]  Wang, Hai, and Hai Yang。 (2019)。 Ridesourcing systems: A framework and review。  Transportation Research Part B: Methodological , 129, 122-155。

[37]  Yang, Hai, Chaoyi Shao, Hai Wang, and Jieping Ye。 (2020)。 Integrated reward scheme and surge pricing in a ridesourcing market。 Transportation Research Part B: Methodological , 134, 126-142。

[38]  Zoltners Andris A, PK Sinha, and Sally E。 Lorimer。 (2016)。 Wells Fargo and the slippery slope of sales incentives。  Harvard Business Review 。 (September), https://hbr.org/2016/09/wells-fargo-and-the-slippery-slope-of -sales-incentives。

[39]  滴滴出行。 滴滴專車司機作弊違規處罰標準。 2019 年 04 月 24 日。 https://www.eycen.com/post/545.html。

[40]  發展改革委網站。 關於支持新業態新模式健康發展 激活消費市場帶動擴大就業的意見。 2020 年 07 月 14 日。 https://www.ndrc.gov.cn/xxgk/zcfb/tz/202007/t20200715_1233793_ext.html。

[41]  金融界。 浙江湖州外賣騎手撞傷行人,法院判未籤勞動合同的平臺需擔責。 2020 年 09 年 15 日。

https://baijiahao.baidu.com/s?id=1677901965178599201&wfr=spider&for=pc。

[42]  京東。 什麼是退換貨運費險?2019 年 12 月 10 日。 https://help.jd.com/user/issue/430-499.html

[43]  美團研究院。 新時代 新青年:2018 年外賣騎手羣體研究報告。 2019 年 1 月 17 日。

https://s3plus.meituan.net/v1/mss_531b5a3906864f438395a28a5baec011/official  website/c21d0443-decf-41d5-9813-ef8eaa6516d0。

[44]  美團技術團隊。 深度學習在美團推薦平臺排序中的運用。 2017 年 07 月 28 日。 https://tech.meituan.com/2017/07/28/dl.html。

[45]  美團技術團隊。 即時配送的 ETA 問題之億級樣本特徵構造實踐。 2017 年 11 月 24 日。

https://tech.meituan.com/2017/11/24/gbdt.html。

[46]  美團技術團隊。 美團外賣騎手背後的 AI 技術。 2018 年 03 月 29 日。 https://tech.meituan.com/2018/03/29/herenqing-ai-con.html。

[47]  美團技術團隊。 深度學習在美團配送 ETA 預估中的探索與實踐。 2019 年 02 月 21 日。

https://tech.meituan.com/2019/02/21/meituan-delivery-eta-estimation-in-the-practice-of-deeplearning.html。

[48]  美團技術團隊。 配送交付時間輕量級預估實踐。 2019 年 10 月 10 日。 https://tech.meituan.com/2019/10/10/distribution-time-prediction-practice.html。

[49]  美團技術團隊。 美團智能配送系統的運籌優化實戰。 2020 年 02 月 20 日。 https://tech.meituan.com/2020/02/20/meituan-delivery-operations-research.html。

[50]  青年報。 快遞、外賣行業交通事故頻發 去年 117 起事故致 9 死 134 傷。 2018 年 02 月 10 日。

http://app.why.com.cn/epaper/webpc/qnb/html/2018-02/10/content_51905.html。

[51]  人物。 外賣騎手, 困在系統裏。 2020 年 9 月 8 日。 https://mp.weixin.qq.com/s/Mes1RqIOdp48CMw4pXTwXw。

[52]  搜狐網。 高校爲什麼要佈局智能外賣櫃?對學校有什麼好處。 2019 年 6 月 21 日。

https://www.sohu.com/a/322101528_120167191。

[53]  中國日報中文網。 美團夏華夏:不斷深化現實物理場景應用 美團 AI 助力產業智能化轉型。 2020 年 9 月 8 日。http://cn.chinadaily.com.cn/a/202009/08/WS5f56f6faa310084978423e53.html。

相關文章