作者:遊雲庭

據媒體報道,近日Facebook和Instagram的母公司Meta遭遇了訴訟挫折。美國法院認定Bright Data公司抓取Meta公開數據的行爲並未違反Meta的註冊協議,駁回了其起訴,之後Meta直接放棄了訴訟。該案顯示了美國法院對於網絡數據抓取的新動向。但本案如果發生在國內,大公司維權數據抓取公司,手段很多,勝率很高,說十拿九穩並不過分,今天就結合Meta案的判決書和我國相應的法律和大家一起探討一下。

案情簡介:Bright Data是一家專業抓取互聯網信息的公司,Meta曾經向 Bright Data購買第三方電子商務網站的數據,以在其平臺上建立品牌形象。但當Bright Data抓取Meta下屬Facebook和Instagram的數據時,Meta起訴了Bright Data,認爲抓取數據違反其註冊協議。

在本案中,Meta向法庭提交的證據包括一個Bright Data抓取到並出售的包含 6.15 億條 Instagram 數據記錄的龐大數據集,售價爲 86 萬美元。該數據集包括用戶姓名、ID、國家/地區、帖子計數、簡歷、主題標籤、關注者、帖子、個人資料圖片、業務類別、電子郵件等字段。但法院認爲,這些數據都是公開信息,並不包含登錄後才能獲得的信息,Meta也不能證明Bright Data使用自己的Facebook和Instagram賬戶進行抓取,因此不能因Meta的註冊協議而追究其責任。

對於Bright Data對網站數據的抓取行爲,中美兩國法律上有多種訴訟方法可以維權,下面我們就介紹一下:

一、以違約爲訴由起訴

本案中,Meta向法院起訴的案由是違約,也就是Bright Data違反了其註冊Meta的用戶協議,但問題是法院調查的結果是:Bright Data雖然在Meta上有一個註冊賬號,但並沒有通過註冊賬號抓取Meta的信息。加州北區法院的判決書認定Meta未能證明Bright Data違反了合同,因爲Bright Data僅在未登錄狀態下抓取了公開數據,而Meta的條款並未明確禁止這種行爲。法院還指出,即使Meta、Facebook和Instagram的註冊協議被解釋爲禁止用戶在未登錄狀態下抓取公開數據,這種禁止在Bright Data註銷其Meta賬戶後也不適用。

簡單介紹下抓取登錄前網頁上的公開信息和登錄後信息的區別:登錄前用戶作爲訪客通常只能訪問公開的、非個性化的數據。例如,他們可以看到公開的帖子、頁面和用戶資料,但這些內容通常是對所有人可見的。登錄後,用戶可以訪問更多個性化的數據,包括他們的個人時間線、好友的動態、私人消息、個人賬戶設置等。這些數據通常不對外公開,只有登錄用戶才能查看。美國法院之前在Linkedin案中將阻止抓取公開信息視爲損害公共利益。

美國公司阻止數據抓取的訴訟,因爲案情不同,所以訴訟時依據也各不相同。廿多年前,eBay在曾經通過訴訟阻止了Bidder’s Edge違反robots協議抓取其數據,法律依據是《計算機欺詐和濫用法》(CFAA)。幾年前Linkedin維權數據分析公司hiQ Labs抓取其數據的訴訟過程一波三折,其依據《計算機欺詐和濫用法》的起訴先被第九巡迴法院駁回,該院認定Linkedin的阻止行爲損害公共利益,故無權阻止hiQ Labs抓取其數據,案件打到美國最高院被髮回重審,加州北區法院再判定hiQ Labs違反Linkedin用戶協議,最後雙方和解。可能Meta就是根據該案,起訴時選擇了違反用戶協議作爲案由,但訴請卻沒被法院支持。

二、以不正當競爭爲訴由進行起訴

國內起訴批量抓取網站信息通常以《反不正當競爭法》第二條,經營者應當遵循公認商業道德和誠實信用原則爲訴由。比如著名的大衆點評訴百度抓取其點評信息並在百度地圖中展示的案件中,法院認爲:

大衆點評網的用戶點評信息是漢濤公司的核心競爭資源之一,能給漢濤公司帶來競爭優勢,具有商業價值。漢濤公司爲運營大衆點評網付出了巨大的成本,通過法律維護點評信息使用市場的正當競爭秩序,有利於鼓勵經營者創新業務模式,投入成本改善消費者福祉。百度公司大量、全文使用涉案點評信息,實質替代大衆點評網向用戶提供信息,對漢濤公司造成損害,其行爲違反了公認的商業道德和誠實信用原則,具有不正當性,構成不正當競爭。

而在新浪微博訴脈脈案中,微博指控脈脈在合作期間及合作終止後非法抓取和使用新浪微博用戶信息(如頭像、名稱、職業、教育信息等),以及通過脈脈用戶手機通訊錄非法獲得和使用這些聯繫人與新浪微博用戶的對應關係,影響公司聲譽及運營收入,違反《反不正當競爭法》第二條,構成不正當競爭。

法院認爲:脈脈軟件非法抓取、使用新浪微博平臺用戶信息,以及通過脈脈用戶手機通訊錄中聯繫人手機號與新浪微博用戶信息形成對應關係等行爲構成不正當競爭行爲。該案和Meta起訴案件的主要區別在於,Bright Data並沒有登錄網站去抓取Meta的信息,而脈脈是登錄微博後,通過應用程序接口抓取的微博用戶信息,同時在和微博合作結束後未刪除用戶信息。

該案中,微博其實也能以違約進行起訴,其最終選擇了以不正當競爭作爲訴由,可能是考慮到以違約起訴技術上略複雜:一方面要證明合同條款是有效的,且沒有構成排除對方主要合同權利的格式條款;另一方面微博還認爲雙方正式合作結束後,脈脈仍通過第三方應用程序接口抓取信息,這個第三方到底是哪個主體,在舉證上有一定技術難度。還不如直接訴不正當競爭更簡單。

三、以侵犯個人信息或著作權起訴或投訴

Meta起訴Bright Data的案件,Bright Data抓取的Instagram數據集包括用戶姓名、ID、國家/地區、帖子計數、簡歷、主題標籤、關注者、帖子、個人資料圖片、業務類別、電子郵件等字段。這些字段包含的權利在法律上也可以做一些文章,因爲其中包含了三種權利:個人信息、頭像照片涉及肖像權和版權。

所以如果在國內訴訟的,被抓取信息的公司如果可以聯繫到被抓取信息的用戶的,比如公司員工同時也是公司用戶的,就可以利用這些權利對抓取信息者維權。涉及版權的,可以讓員工將版權授權給公司,進行維權。比如大衆點評訴愛幫網抓取其點評信息的案件,被抓取的點評信息中部分由大衆點評員工所創作,大衆點評就讓員工將點評內容的版權授權給自己,然後維權愛幫網。同理,Meta被抓取了用戶頭像信息,也可以通過用戶維權頭像圖片的著作權侵權。

涉及到個人信息和肖像權的,因爲這些權利的人身屬性較強,不能轉讓,故可以以員工個人的名義起訴信息抓取者,要求其停止侵犯個人信息和肖像權。或者直接向個人信息監管部門舉報,要求停止違法抓取行爲。

可能有朋友會問:個人信息和肖像照片發佈在公開的網站,其他人就不能抓取嗎?根據《個人信息保護法》,取得個人同意才能處理個人信息。Facebook或者Instagram發佈用戶的個人信息,是有用戶授權的。Bright Data抓取信息後,無論是自己使用還是轉給第三方做市場研究、營銷、廣告技術、人工智能訓練或者做其他用途的,均屬於處理個人信息,都應當再次取得用戶的同意,否則就涉嫌侵權個人信息,法律責任很重。肖像權的道理也是一樣,根據《民法典》,使用他人肖像也應當取得授權。

最後,我國是成文法國家,法律確定性比較強,在處理商業競爭的案件中,這種確定性相對而言對大公司比較友好。而美國是判例法國家,文化又偏重自由,而抓取網站數據涉及信息自由流動,所以哪怕是大公司,也會面臨訴訟結果的不確定性。

本文作者:遊雲庭,上海大邦律師事務所高級合夥人,知識產權律師。電話:8621-52134900,Email: [email protected],本文僅代表作者觀點。

相關文章