作者 | 熊文聰  中央民族大學法學院副教授、中國法學會知識產權法學研究會理事 

引  言

隨着技術和商業模式的不斷迭代革新,有關平臺公開數據保護與利用的衝突逐步走向深水區,一些最新案件的裁判結果也充分反映出司法機關在動態調整、規制與平衡之間所做的努力,如浙江法院審理的“天貓訴上貨專家”案、[1]北京法院審理的“微夢訴抖音”案、[2]上海法院審理的“金農公司訴鉀鹽中心”案。[3]然而,這些裁決雖涉及的事實情節千差萬別,但所適用的法律依據卻幾乎完全一致,即《反不正當競爭法》(以下簡稱“反法”)第二條原則性條款(雖然個別法院適用的是“反法”第十二條第二款第(四)項“其他妨礙、破壞其他經營者合法提供的網絡產品或者服務正常運行的行爲”,但由於其過於籠統、模糊,個案審理時還是要回到“反法”第二條予以評價和認定,故究其本質而言也屬於在“反法”原則性條款適用上的“延伸”),而沒有從狹義上的知識產權法專門條款加以評價和認定。並且,不同案件的判決結果也驚人相同,即均認定平臺公開數據的抓取方、使用方構成不正當競爭。

管見認爲,數據作爲21世紀極其關鍵的生產要素和流通媒介,不應當不加區分地通通財產化、私有化。2022年12月,《中共中央、國務院關於構建數據基礎制度更好發揮數據要素作用的意見》(即“數據二十條”)對外發布,其中明確指出:“堅持共享共用,釋放價值紅利。合理降低市場主體獲取數據的門檻,增強數據要素共享性、普惠性,激勵創新創業創造,形成依法規範、共同參與、各取所需、共享紅利的發展模式。”特別是大模型時代已經到來,人工智能訓練必然需要低成本地獲取海量公開數據。2017年7月,國務院發佈《新一代人工智能發展規劃》,提出到2030年,我國人工智能理論、技術與應用總體達到世界領先水平,成爲世界主要人工智能創新中心。2022年7月,科技部等六部門印發的《關於加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》提出,以促進人工智能與實體經濟深度融合爲主線,探索人工智能發展新模式新路徑。2024年3月,李強總理在作政府工作報告時強調“深化大數據、人工智能等研發應用,開展‘人工智能+’行動”。在審理涉及數據利用的案件中,司法裁判應當保持謹慎、剋制、中立,更應當秉持體系化和精細化思維,不應當在法律尚未明確規定的情況下,一概在所有平臺公開數據之上創設一種所謂的“競爭權益”或“數據權益”,並將其歸屬於該公開數據的首置平臺或經營者,由其牢牢控制,具體法理和規範分析如下:

一、所謂“數據權益”是一個僞概念

首先,本文所要探討的數據,指的是網絡平臺上由衆多數字符號單元組成的集合,而不包括信息量極小的數字符號單元。其次,本文所稱的數據,指的是網絡平臺上已經公開呈現的數據,而不包括未公開的數據信息。後者在滿足法定要件之前提下,可以作爲商業祕密受到“反法”第九條的保護,這基本上是沒有爭議的共識,故在此不表。最後,數據和信息這兩個概念並沒有本質的區別。一般認爲,數據是對客觀事物的邏輯歸納,是於計算機及網絡上流通的在二進制基礎上以0和1的組合表現出來的比特形式。2021年9月施行的《數據安全法》第三條對數據的定義是:

“本法所稱數據,是指任何以電子或者其他方式對信息的記錄。”

也就是說,數據是以電子方式表現的信息,數據不是信息物理上的載體(不是紙張和作品的關係),而僅僅是信息的一種呈現方式,或者說信息只是數據的上位概念而已。實際上,很多文獻都是將數據和信息同時並用或替換使用。

根據產生來源的差異,可以將平臺公開數據分爲幾類。自然人在使用互聯網產品或服務時被動留下的、具有可識別性、與人格利益(隱私、尊嚴、自由等)緊密相關的個人信息屬於一類數據(本文稱爲數據A),這類數據的處理與利用應當由《民法典》和《個人信息保護法》調整,而沒有必要再創設新的“個人數據”規則或所謂的“數據權益”。而對於自然人或市場經營主體(統稱爲“用戶”)在使用互聯網產品或服務時主動編輯、創作的數碼化公開內容(英文縮寫UGC),本文稱爲數據B,如果具有獨創性,可以作爲作品受到著作權保護。網絡平臺在收集、整理、編輯、添減數據A或數據B後產生的新的公開的數據集合,本文稱爲數據C。對於數據C,如果具有獨創性,則可以作爲彙編作品受到著作權法保護,故同樣沒有必要創設一個全新概念,即所謂“數據權益”。再有,平臺經營者除了收集、編輯用戶的數據,也完全可能自己創作、設計內容表達(本文稱爲數據D),顯然,該內容表達只要滿足獨創性要件,便可以作爲作品受到著作權保護。而當前司法的常見做法則是,無論平臺經營者有沒有事先證明涉案公開數據的獨創性,均一味在其之上創設一個全新的“數據權益”或“競爭權益”概念,進而爲其提供“反法”原則性條款的侵權救濟,禁止他人任何抓取和利用涉案數據的行爲。

與保護債權的合同法、保護股權的公司法不同,“反法”與物權法、知識產權法一樣,其保護民事主體依法享有的財產性權益屬於絕對權、對世權,而根據民法原理,絕對權、對世權必須有一個外在的、具有一定稀缺性的權利對象,如物權的對象是有體物;著作權的對象是作品;商標權的對象是承載了商譽的商業標識;商業祕密權益的對象是具有一定經濟價值的未公開信息。[4]

雖然數據(或數據集合)也是一個外在的對象或客體,但並不是所有數據都具有稀缺性,都是私有財產,如公共數據就不受保護,任何人都可以自由無償使用公共數據。因此,要證成某數據之上是否應當設置一項私有財產權利或權益,必須首先回答該數據是否具有一定的稀缺性。同樣地,並非所有智力成果都受知識產權法保護,而著作權法中的“獨創性”概念就是評判涉案智力成果是否具有一定的稀缺性,應否作爲私有財產權保護對象的關鍵要件。

當然,大量的商業數據集合在某網絡平臺上,確實能夠爲該平臺帶來更大規模效應、用戶黏性以及更多流量和潛在交易機會,故該數據集合顯然是有商業價值的,那能否就此認爲該數據集合具有稀缺性呢?實際上,經濟學原理告訴我們,稀缺性取決於兩個變量,一個是需求量,另一個是供給量(即稀缺性=需求量÷供應量,在需求量恆定的情況下,作爲分母的供應量越大,說明該資源越不稀缺),而很多網絡平臺上的數據集合,都是基於預先設定好的模板或算法自動生成的,其最終展示給用戶及消費者的呈現效果只是一種程式化的固定表達,而非個性化的創意表達,平臺並不需要爲該數據集合的生成及展示提供多大的人工成本和智力投入,故其不具有稀缺性,不構成私有財產。在著名的Feist案[5]中,美國聯邦最高法院之所以最終否定了涉案電話號碼簿的獨創性,就是因爲該數據集合是按照英文字母先後順序套路化排列的,故不具有稀缺性,任何人都可以自由、免費複製或使用,哪怕原告爲該數據集合付出了再多額頭汗水。

另一方面,用戶或消費者之所以喜歡在網絡平臺上瀏覽信息或選購商品,其關注或看重的通常只是單一數據的內容而不是所有單一數據集合而成的編排、呈現方式。因此,說整個數據集合具有商業價值,能夠帶來更多流量和交易機會還爲時尚早,至少網絡平臺經營者要舉證證明該數據集合的稀缺性或獨創性。例如,一家出版社30年內出版發行了一千本圖書,某經營者未經允許複製盜版了這一千本圖書,請問挪用該圖書數據集合的行爲構成對這家出版社的不正當競爭嗎?如果出版社與圖書作者簽訂的只是非專有的普通許可,那估計該出版社連著作權都無法主張。類似的例子還可以舉很多,如某人未經同意下載了某期刊數據庫上的一萬篇論文,不論該期刊數據庫經營者與論文作者簽署的是專有還是非專有許可協議,恐怕該期刊數據庫經營者都不能向前者主張挪用論文數據集合構成不正當競爭。

皮之不存毛將焉附,在原告沒能證明涉案數據集合具有一定稀缺性或獨創性的前提下,抽離出來的、空泛的競爭優勢、黏性流量或交易機會,便不可能獨立成爲“反法”所要保護的合法權益。這不僅僅是因爲脫離具體保護對象(具有一定稀缺性的財產資源或智力成果)的所謂“數據權益”已然是無本之木、無源之水,更是因爲所謂的用戶黏性流量或潛在交易機會,其本質都是買方或消費者的自由選擇權,而不是數據首置平臺的私有財產。因爲流量是隨時動態變化的,未來交易機會更是高度不確定,如果認爲流量或交易機會可以成爲某家企業的私有權益,那就等於說該企業可以控制消費者和用戶,將其死死地控制在自己所經營的商品或服務上,或者說消費者只是沒有獨立意志的工具或財物,而這種論斷顯然是不可接受的。市場競爭的本質就是流量和交易機會的爭奪,如果不允許爭奪流量和交易機會,就意味着不允許競爭,不允許消費者及社會公衆自由選擇,只有強制性的截流或欺騙誤導性的引流纔可能構成不正當競爭。

不僅如此,所謂的“競爭優勢”也不能獨自成爲“反法”所要保護的合法權益。三十年河東三十年河西,風水輪流轉、盈虧風險自擔,無論是立法機關、執法機關還是司法機關都無法也不應通過設立或適用某項法律規則來保證某家企業永遠保持競爭優勢地位。食人肥己、優勝劣汰是市場競爭的常態和本質,在激烈的市場競爭環境中,逐利的經營者通過合法正當的手段去抓取他人平臺上不受權利或法益保護的數據,無可厚非。的確,作爲被抓取數據的首置平臺,對於該數據的生成、彙集及整合投入了相應的人力物力財力,但法律並不保護純粹的投資行爲,當且僅當投資產生了有體有形的物質產品或具有創造性的智力成果時,法律才爲該物質產品或智力成果提供保護,纔在其之上賦予一種排他性的絕對權、對世權。試想,如果國家的法律制度要爲每個經營者的投資提供保護或保證其投資必有回報,永遠處於競爭優勢地位的話,那就沒有企業會虧損、倒閉、破產或註銷。

在著名的“海帶配額”再審案中,最高人民法院反覆強調指出:

“在反不正當競爭法上,一種利益應受保護並不構成該利益的受損方獲得民事救濟的充分條件。商業機會雖然作爲一種可以受到反不正當競爭法所保護的法益,但本身並非一種法定權利,而且交易的達成並非完全取決於單方意願而需要交易雙方的合意,因此他人可以自由參與競爭來爭奪交易機會。競爭對手之間彼此進行商業機會的爭奪是競爭的常態,也是市場競爭所鼓勵和提倡的。”

“還需說明的是,一審法院多次使用了‘競爭優勢’這一內涵和外延並不確定的概念,而且泛泛地將所謂山東食品公司的競爭優勢作爲反不正當競爭法所保護的法益,缺乏法律依據和法理基礎。”“即使可以證明其爲此進行了鉅額投入,在沒有充分證據證明馬達慶實施了不正當競爭行爲的情況下,因他人正常爭奪商業機會而導致的投資損失或者競爭失敗屬於正常的商業風險,不能僅因有歷史積澱和前期投入即推定商業機會應歸屬於己。”[6]

申言之,如果在原告沒能首先證明涉案數據或數據集合具有一定的稀缺性或獨創性,屬於應當受保護的私有財產的前提下,籠統而含糊地認爲數據抓取者損害了該數據首置平臺的競爭優勢、商業價值或所謂的“數據權益”,恐怕是沒有任何請求權基礎的。接下來,筆者將結合認定不正當競爭的四要件來逐一分析數據抓取行爲的正當性。

二、認定不正當競爭必須同時滿足四個要件

根據法律原理和理論通說,認定“不正當競爭”必須同時滿足四個要件,即

(1)原被告雙方作爲經營者存在競爭關係;

(2)被訴行爲損害了其他經營者(特別是原告)的合法權益;

(3)被訴行爲違背了誠實信用和公認的商業道德;

(4)被訴行爲擾亂了市場競爭秩序,損害了消費者合法權益及公共利益。

同時,“反法”一般條款(即“反法”第二條,又稱“原則性條款”)與“反法”類型化條款(即“反法”第二章所列舉的七種具體情形)是內涵與外延的邏輯關係。這也就意味着,類型化條款除了必須描述被訴行爲的外在表現形態、界定其可能損害的權益類型之外,還可以給出這類不正當競爭情形的實質判斷要件。當然,如果類型化條款(如“反法”第十二條)沒有給出實質判斷要件,或給出的並不是完整的實質判斷要件,則仍然需要回到“反法”一般條款中綜合前述四個要件全面加以研判。

然而,司法實踐並沒有從“不正當競爭”的基本內涵出發,嚴格遵循前述四要件,特別是第一個要件——“原被告雙方作爲經營者存在競爭關係”有被淡化或乃至完全忽略的趨勢,甚至幾乎把四要件縮減成僅僅一個要件,即只要被訴行爲損害了原告的合法權益,便構成不正當競爭,所謂的違背誠實信用和公認的商業道德,損害了消費者合法權益、破壞了公平競爭秩序只是附帶說明一下而已。這種做法是值得商榷和檢討的。

(一)“競爭關係”要件並非可有可無,或者說可以被任意泛化解釋。在“網絡不正當競爭”類糾紛中,不少審理法院提及,但凡被訴行爲攫取了原告的用戶流量或交易機會,就可以認定原被告之間存在競爭關係,而不論二者提供的商品或服務是否相同或類似。例如,在“天貓訴上貨專家”案中,一審法院便指出:

“具體到網絡領域,其商業模式新穎、多變,跨行業經營層出不窮,各商業主體經營內容、模式、對象、流量等往往存在交叉關係,極易在服務內容、用戶羣體、交易機會等方面存在此消彼長的競爭關係,因而網絡領域的經營行爲均受反不正當競爭法規制。”[7]

很顯然,該見解採取的是一種倒推法,即只要被訴經營行爲很可能給原告的用戶流量和交易機會造成減損,便足以認定原被告存在競爭關係。然而,該倒推法恐怕是站不住腳的。

首先,誠如前文所言,用戶流量或交易機會並非原告的私有財產,其本質是消費者的自由選擇權,且消費者的選擇是理性的、多樣化的。一個做產品銷量大數據分析的公司,可能會抓取某電商平臺上的店鋪經營信息,消費者並不會因爲在該大數據分析公司網站上看到這些店鋪經營信息而不再去該電商平臺選購商品。所謂網絡領域的經營活動,往往是藉助技術和商業模式的創新,將蛋糕做大而不是切分原來已有的蛋糕,即利用數據、信息等既有資源爲消費者開發新的商品或服務,這顯然不意味着消費者只能“二選一”。因此,認定原被告之間存在此消彼長的競爭關係是需要充分論證的,而不能拍腦袋或想當然

其次,原被告雙方存在競爭關係與被訴行爲損害原告的合法權益與並非前因後果絕對匹配。換句話說,即便原被告雙方不存在競爭關係,被告的行爲也完全可能損害原告的合法權益。法官應當體系化地理解法律制度並藉此找到正確的裁判依據。《民法典》第三條、第一百二十條及第一百二十六條均爲保護包括經營者在內的所有民事主體依法享有的、尚未上升爲法定權利的其他民事權益提供了充足的法律依據。

最後,簡言之,有競爭不一定有損失,有損失也不一定全都是因爲存在競爭才導致的。“反法”是民法的特別法,它只調整存在競爭關係的經營者之間的利益平衡,既然有《民法典》託底,便毫無必要突破既有的法律概念和規範體系,刻意淡化、曲解乃至徹底拋棄“競爭關係”要件。

(二)對於第二個要件“被訴行爲損害了原告的合法權益”,本文第一部分已有充分探討,此處不贅。但尚需補充的一點是,通過繞開或破解技術保護措施等方式大量抓取原告平臺上的數據,是否會因擠佔正常用戶訪問通道,導致原告服務器性能嚴重消耗,進而干擾平臺的流量分析,增加其運營維護和監測防禦成本呢?如果僅僅從該單一事實來看,被訴行爲確實給原告造成了一定的經濟負擔,但這是否就屬於原告“合法權益”之損害,則另當別論。

首先,互聯網的精神和原理是開放共享,而不是區別對待。成規模的數據訪問量會形成廣告效應,本身就能夠幫助該平臺吸引來更多的潛在用戶和消費者,而爲此提升服務器性能是任何平臺都願意付出的成本。如果某家平臺不歡迎批量訪問,可以通過技術手段加以限制(如規定一個用戶賬號一天可以訪問多少次平臺),但該平臺也要考慮這種限制可能惹惱消費者用腳投票。平臺不能兩頭得利,既歡迎批量訪問,又痛斥批量訪問額外增加了自己的運營成本。

其次,瀏覽訪問不等於實施數據抓取行爲,更不等於被抓取的數據一定就是平臺享有合法權益的保護對象。誠如前文所述,如果被抓取的數據不具有稀缺性或獨創性,本就屬於可以自由免費複製、傳播和流通的公共信息(如電商平臺上某件商品的尺碼、重量、款式、價格、產地以及有關品質性能的直白描述等),或者即便構成私有財產但並非由平臺經營者享有而是由平臺上的特定用戶享有,那平臺又如何能說這種批量訪問和抓取行爲損害了自己的合法權益呢?

最後,水至清則無魚,不能將前期爲監測防禦侵權所花的費用作爲認定不正當競爭的構成要件。這就好比一家大型超市賣場,其中有一定會購物的消費者,也有不一定會購物只是來閒逛一下的消費者,更有想順手牽羊的小偷竊賊,不能因爲所有光顧者中包含小偷竊賊而爲此安裝監視器和增加保安人手消耗了成本,就將其歸入因偷竊行爲而導致的損害,進而認爲還沒有下手的嫌疑人構成不正當競爭或侵權。

(三)而就第三個要件而言,涉“數據抓取”類案件的審理法院,往往從被告未經許可抓取原告平臺上的數據,或明知原告公示的“反爬蟲協議”仍然抓取,或故意繞開或破解原告設置的技術保護措施而抓取等事實中推導出被訴方違背了公認的商業道德。管見認爲,如此簡化的推導邏輯恐怕是不足取的

第一,民法中的“善意”指的是“不知情”,但不能反過來說“知情而爲”就是惡意。法律是最低限度的道德,對於個人品德的法律評價如此,更何況所謂“公認商業道德”的認定標準呢?在著名的“海帶配額”案中,最高人民法院早就強調指出:“商業道德要按照特定商業領域中市場交易參與者即經濟人的倫理標準來加以評判,它既不同於個人品德,也不能等同於一般的社會公德,所體現的是一種商業倫理。經濟人追名逐利符合商業道德的基本要求,但不一定合於個人品德的高尚標準”。[8]

第二,正如前文所言,互聯網的本質是互聯互通、開放共享,網絡平臺通常都希望自己公開的數據能被更多人看到,也希望能夠低成本獲取他人平臺上的公開數據。因此,很難說平臺設置“反爬蟲協議”來阻止他人獲取自身平臺上的公開數據屬於互聯網領域的行業慣例或公認的商業道德,其頂多只能算是設置“反爬蟲協議”平臺的單方意志而已。相反,設置歧視化的“反爬蟲協議”,人爲形成數據孤島,導致其他經營者及社會公衆獲取公共信息的便捷度減損,恐怕纔是真正有違互聯網的精神理念、行業慣例或公認的商業道德。

第三,連被抓取的數據內容都完全可能屬於公共資源而非私有財產,更何況技術保護措施本身的法律性質呢?退一步講,即便技術保護措施所要保護的數據內容屬於私有財產,但根據現行法律規定,破解技術保護措施在特定情形下也可以構成合理使用,即不需要事先徵得權利人的許可,也無需向其支付報酬。[9]該規範意旨就在於,立法者並沒有單獨把技術保護措施設定爲一項絕對權、支配權,當且僅當該措施所要保護的數據內容屬於私有財產,且破解該措施的行爲不屬於合理使用時,破解人才可能構成侵權。這樣規定能夠有效防範網絡平臺實施“數據封禁”對其他經營者及社會公衆自由獲取和充分利用公共資源造成不當阻礙,促進社會整體福利。故僅以規避“反爬蟲協議”或實施技術保護措施的破解行爲便認定其違背了公認的商業道德,顯然是有問題的。

(四)就第四個要件來說,未經允許批量抓取某網絡平臺上的公開數據,是否就擾亂了市場競爭秩序,損害了消費者合法權益及公共利益呢?恰如前文所言,市場競爭貴在動態平衡,逆水行舟、不進則退,沒有哪家企業能夠一勞永逸、坐享其成。如果某家暫時居於優勢地位的企業試圖藉助法律手段來打壓後來者,且後來者是通過技術和商業模式創新等合法手段奪取前者既有的市場份額,則該打壓行爲才真正涉嫌擾亂市場競爭秩序,可能構成壟斷和不正當競爭。

就批量抓取數據而言,被訴方要麼是將涉案數據做整體複製,且未做任何改編、加工等深度開發,用於與原告平臺相同或類似的商品或服務上;要麼是將涉案數據先做整體複製,但又做了實質性調整、修改、補充和續造,用於向消費者提供不同的商品或服務。對於前一種情況,可能確實構成對原告平臺的實質性替代,但對於用戶和消費者而言,只是換了一個平臺而已,談不上對其合法權益造成了損害;對於後一種情況,因爲向用戶提供的是完全不同的商品或服務,消費者福利是增加的,且也沒有構成對原告平臺的實質性替代。故無論怎樣,都難以構成對消費者合法權益及公共利益的實質性損害。並且,前一種“實質性替代”原告平臺的情況,也需要在原告平臺對涉案數據享有合法權益的前提下,被訴方纔可能構成侵權。

三、“反法”不是知識產權法的兜底規則

特別值得一提的是,民法中“保護”是一箇中性詞而不是一個褒義詞,即並非油多不壞菜,越多保護越好。保護任何一種資源(無論是有形的物質實體還是抽象的數據信息),都意味着相當大的社會成本,該成本不僅包括爲保護該資源必須付出的管理成本、執法成本和司法成本,更包括因創設一種排他性的絕對權、對世權而給其他經營者、消費者及社會公衆所帶來的獲取、使用該資源所需付出的成本。因此,當且僅當保護某項資源(即創設一種私權)所帶來的社會總收益大於社會總成本時,該資源才需要被保護、才值得被保護、才應當被保護

知識產權法的設立宗旨和整體框架便是始終在左右權衡、來回評估,各類情境下賦予一項數據信息或智力成果排他性私權,其所帶來的社會總收益是否大於社會總成本,而爲此創造的特定法律概念和具體規則(如獨創性、思想/表達二分法、實質性相似、合理使用、法定許可、保護期等等)無非是進行這種利弊權衡的工具而已。因此,一旦涉案數據(集合)不滿足獨創性要件,不構成作品時,也就意味着立法者已經指引執法者、司法者做出了價值判斷的結論,即涉案數據(集合)不需要被保護、不值得被保護、不應當被保護,被訴方複製、傳播涉案數據的行爲是正當的,不需要事先徵得同意併爲此支付報酬。

因此,對於不具有獨創性的數據或數據集合,不是著作權法力有不逮沒有能力提供保護的問題,而是任何法律制度都不應當給予保護的問題。如果不具有獨創性的數據(集合)不應當受著作權法保護,但還可以受其他部門法(如“反法”)保護的話,那就意味着立法者允許執法者、司法者可以就同一被訴行爲的正當性作出兩次截然相反的評判結論,而這顯然違背了邏輯同一律和法治原則,是不可接受的。因此,“反法”不是著作權法或其他知識產權法的補充規則,二者不是兜底與被兜底的關係,而是平行並列關係,即狹義上的知識產權法僅僅保護法定權利,而“反法”則僅僅保護尚未上升爲法定權利的法益,但無論是法定權利還是尚未上升爲法定權利的法益,其都是一種絕對權、對世權,從而將“反法”及知識產權法與合同法、公司法嚴格區分開來。

實際上,早在2009年,最高人民法院出臺的《關於當前經濟形勢下知識產權審判服務大局若干問題的意見》就明確指出要:

“妥善處理專利、商標、著作權等知識產權專門法與反不正當競爭法的關係,反不正當競爭法補充性保護不能牴觸專門法的立法政策,凡專門法已作窮盡規定的,原則上不再以反不正當競爭法作擴展保護。凡反不正當競爭法已在特別規定中作窮盡性保護的行爲,一般不再按照原則規定擴展其保護範圍;對於其未作特別規定的競爭行爲,只有按照公認的商業標準和普遍認識能夠認定違反原則規定時,纔可以認定構成不正當競爭行爲,防止因不適當地擴大不正當競爭範圍而妨礙自由、公平競爭。”

不僅如此,對於尚未上升爲法定權利的法益,由於其並沒有通過公開呈現、物理佔有或登記等方式事先進行公示,社會公衆並不知道(也沒有義務去知道)其保護對象的具體內容及其邊界,且缺乏合理使用、保護期等規則的限制,故需要被保護、值得被保護、應當被保護的法益必須同時滿足三大要件,即

(1)法益擁有者必須充分證明該法益具有相當的財產價值(即“稀缺性”),如未註冊商業標識必須具有一定的知名度;商業祕密必須具有較大的經濟價值等;

(2)被訴侵權人必須具有明顯的主觀故意乃至惡意,而一般過失則不構成,因爲其對該法益免受損害並不負有事先的避讓、注意義務;

(3)被訴侵權行爲給法益擁有者造成了實質性的損害後果。

不僅如此,相較於法定權利,法益擁有者只能在已經造成實質性損害後方可以主張被動的救濟,而欠缺積極權能,如將該法益進行轉讓、質押、作股出資等等。而對於已經在網絡平臺上公開的數據或數據集合,顯然已經完成了公示環節。並且,具有一定稀缺性或獨創性的數據或數據集合,完全可以作爲一項獨立的財產資源進行積極利用,故如果僅僅將其限縮在“反法”框架下予以被動的救濟,顯然也不利於鼓勵交易和數據財產價值的充分發揮。

四、數據保護應當迴歸既有的規則體系

由此可見,抓取平臺公開數據的行爲難以滿足認定不正當競爭的四項構成要件,故不適宜用“反法”第二條原則性條款或第十二條“互聯網專條”予以規制,但這並不意味着所有數據抓取行爲都是合法的、正當的。其實,現行《民法典》或知識產權專門法(尤其是《著作權法》)足以調整和評價各類抓取網絡平臺公開數據的行爲,執法或司法機關應當根據個案不同情形,做更加精細化的綜合研判,具體來說:

 情形一  當被抓取的數據屬於原告平臺經營者自己創作、設計的內容表達(數據D)時,顯然,該內容表達只要滿足獨創性要件,便可以作爲作品受到著作權保護,故這類未經許可的抓取行爲(其實就是“複製”)多數情況都是侵權的(如果不屬於“合理使用”或“法定許可”情形的話)。

 情形二  當被抓取的數據從每個獨立單項來看屬於原告首置平臺上由用戶創作、生成的內容(文字、圖片或音樂等各類符號形式,簡稱數據B),但首置平臺對這些成百上千項單個數據進行了篩選、編輯、加工,使得衆多單個數據的集合(數據集合C)在整體排列、呈現上具有獨創性,進而構成彙編作品,且被告恰恰是全盤照搬了該數據集合C,則不僅涉嫌侵犯單個數據B權利人的著作權,也完全可能涉嫌侵犯首置平臺對數據集合C作爲彙編作品享有的著作權

 情形三  如果被告在全盤照搬後,又對數據集合C的獨特排列、呈現方式做了實質性改動、調整和重組,使其不構成與原彙編作品的實質性相似,則不侵犯首置平臺對數據集合C享有的著作權,但仍然涉嫌侵犯用戶就單個數據B享有的著作權

 情形四  如果單個數據B不屬於具有獨創性的作品,但卻是與首置平臺用戶(或店鋪經營者)緊密相關的、具有一定知名度的商業標識(如註冊商標、字號、域名、商品名稱、包裝裝潢設計等)或者是由該用戶享有專利權的產品外觀設計,且被告抓取該類數據是爲了用於自己與前者相同或類似的商品或服務之上,從而達到消費者混淆誤認或減省自身創作設計成本之目的,則完全可能涉嫌侵犯用戶或店鋪經營者而非平臺享有的商標權或專利權,應當由《商標法》《專利法》或“反法”第六條予以規制

 情形五  如果單個數據B構成具有獨創性的作品,但被告在抓取單個數據B時,已經經過該數據B權利人(即首置平臺的用戶)授權,但沒有經過該數據首置平臺經營者同意,則是否侵犯首置平臺經營者的合法權益呢?這個問題相對比較複雜,但也並非沒有解:首置平臺雖然對該類數據並不享有一個完全屬於自己的絕對權,但並不妨礙首置平臺對其享有一種優先使用權。該優先使用權的正當性基礎就在於,畢竟首置平臺對這類數據的生成、編輯、存儲和呈現投入了人力、物力和財力,故用戶在簽署平臺用戶協議,願意接受平臺的技術支持及其他幫助時,就視爲用戶同意首置平臺可以優先使用該數據B,即構成默示許可

但是,該優先使用權是一種依附性的,一旦用戶許可他人可以抓取、使用數據B時,也就意味着該用戶解除了之前與首置平臺之間的默示許可協議,也即首置平臺喪失了對該數據的優先使用權,其不得阻止經用戶授權的第三方抓取、使用該數據。當然,如果第三方未經用戶同意而抓取、使用數據B,此時首置平臺還是可以憑藉其享有的優先使用權而主張該第三方構成侵權的。特別需要指明的是,首置平臺不能對任何用戶生成數據都享有優先使用權,誠如前文所言,該優先使用權具有依附性,如果單個用戶數據不構成具有獨創性的作品,用戶對被第三方抓取的數據不享有任何權益的話,則首置平臺更不可能對這類用戶數據享有排他性的優先使用權。

也許有人會提出,這只是一種理論推導,並沒有現成法條作爲司法裁判的有效依據。其實不然,現行《著作權法》第十八條規定:

“自然人爲完成法人或者非法人組織工作任務所創作的作品是職務作品,除本條第二款的規定以外,著作權由作者享有,但法人或者非法人組織有權在其業務範圍內優先使用。作品完成兩年內,未經單位同意,作者不得許可第三人以與單位使用的相同方式使用該作品。”

同時,最高人民法院2002年頒行的《關於審理著作權民事糾紛案件適用法律若干問題的解釋》第十二條規定:

“按照著作權法第十七條(現行著作權法第十九條)規定委託作品著作權屬於受託人的情形,委託人在約定的使用範圍內享有使用作品的權利;雙方沒有約定使用作品範圍的,委託人可以在委託創作的特定目的範圍內免費使用該作品。”

不難理解,之所以委託人對委託創作作品享有免費使用權;之所以用人單位對職務作品享有優先使用權,其道理就在於,委託人(用人單位)雖然對委託創作作品(職務作品)未做出任何實質性智力貢獻,但確實爲這類作品的創作提供了物質條件和技術支持,基於公平原則,即便其不享有該作品的初始版權,也應當賦予其一定的排他力以彌補其投入成本,並藉此鼓勵其繼續爲作品的產出提供支持。而用戶數據首置平臺同這種情況也完全類似,只是互聯網語境下的首置平臺對海量用戶數據的生成所花費的投入成本,如果平均到每個用戶上來說並不高,故其優先使用權也應當相對減弱,即但凡用戶同意第三方使用自己在首置平臺上生成的或創作的數據內容,則首置平臺對該數據的優先使用權即告消滅

另外,特別值得一提的是,通說認爲,獨創性的認定門檻並不高。如果首置平臺爲數據(集合)的整理、編輯及生成付出了大量資金投入,是可以作爲認定獨創性的其中一項關鍵因素和初步證據的,在滿足高度蓋然性的證據採信標準的基礎上,應轉由被訴侵權方舉證證明該數據的排列、呈現方式屬於程式化表達或本領域的通用表達、慣常表達,如果被訴侵權方不能舉證證明,則應當推定涉案數據(集合)具有獨創性,屬於受著作權保護的作品。但如果無法確證涉案數據(集合)的獨創性,也難以證明其屬於首置平臺用戶合法權益(如商標權、專利權等)的保護對象,則應當推定該數據(集合)是可以被自由抓取和利用的。當然,即便涉案數據(集合)屬於受著作權保護的作品,這種保護也不是鐵板一塊,著作權法中的合理使用規則、法定許可制度、實質性相似概念以及保護期的安排等等,均爲其他經營者和社會公衆能夠低成本乃至自由免費使用受保護數據留出了彈性空間,也即促進了數據這一21世紀最關鍵生產要素的高效流通、充分利用和衍生續造。

結  語

綜上所述,現有民法及知識產權制度已經爲平臺公開數據的保護提供了非常完備且十分精巧的利益平衡機制,而這麼做的最大好處就在於,它爲任何人、任何企業的數據利用行爲均劃出了一道可明確預期的邊界,也爲所有網絡平臺上的公開數據提供了最平等、最適恰的保護,因爲沒有哪家互聯網公司敢拍胸脯說自己已經掌握或控制了全部有價值的數據,進而永遠處於競爭優勢地位。相反,捨棄如此完備且精巧的制度安排不用,倒退到籠統且模糊的“反法”原則性條款,禁止一切未經平臺允許的數據獲取及利用行爲,最終恐怕只會導致本不該保護的給予了保護;本該限制保護的卻給予了超範圍的過度保護;本可以積極賦權的卻僅僅提供了被動的救濟,無異於將開放共享、自由聯通的互聯網圈禁成一潭潭死水,阻礙大數據訓練和人工智能的快速發展,更談不上能夠爲市場經營主體及社會大衆提供穩定、合理且公平公正的行爲預期。

申言之,不具體情況具體分析,一概爲網絡平臺上的所有公開數據提供“反法”原則性條款(“反法”第十二條第二款第(四)項“其他妨礙、破壞其他經營者合法提供的網絡產品或者服務正常運行的行爲”由於過於籠統、模糊,審理案件時還是要回到“反法”第二條予以評價和認定,故該條款也屬於“反法”原則性條款的“延伸”)的保護,是不適當的、不合理的,也是缺乏法理基礎和邏輯依據的,更與現有法律法規(包括但不限於《反不正當競爭法》《著作權法》《商標法》《專利法》《民法典》)和國家宏觀政策(如“數據二十條”“新一代人工智能發展規劃”等)的規範意旨是不匹配的。對於前沿且複雜的數據抓取類糾紛,考驗的是審判法官的細心、智慧和專業素養,法官理應根據個案不同情況,分門別類、抽絲剝繭,在現有制度框架和概念體系下,庖丁解牛般地做縝密的推斷和審慎的研判。

註釋

[1] 浙江省高級人民法院(2023)浙民終1126號民事判決書。

[2] 北京知識產權法院(2021)京73民終2816號民事判決書。

[3] 上海知識產權法院(2023)滬73民終334號民事判決書。

[4] 參見熊文聰:《超越稱謂之爭:對象與客體》,載《交大法學》2013年第4期。

[5] Feist Publications, Inc. v. Rural Telephone Serv. Co., 499 U.S. 340, (1991)

[6] 最高人民法院(2009)民申字第1065號民事裁定書。

[7] 浙江省杭州市中級人民法院(2022)浙01民初1478號民事判決書。

[8] 最高人民法院(2009)民申字第1065號民事裁定書。

[9] 參見現行《著作權法》第五十條。

本文來自微信公衆號“知產力”(ID:zhichanli),作者:熊文聰,36氪經授權發佈。

相關文章