作者 | 熊文聪  中央民族大学法学院副教授、中国法学会知识产权法学研究会理事 

引  言

随着技术和商业模式的不断迭代革新,有关平台公开数据保护与利用的冲突逐步走向深水区,一些最新案件的裁判结果也充分反映出司法机关在动态调整、规制与平衡之间所做的努力,如浙江法院审理的“天猫诉上货专家”案、[1]北京法院审理的“微梦诉抖音”案、[2]上海法院审理的“金农公司诉钾盐中心”案。[3]然而,这些裁决虽涉及的事实情节千差万别,但所适用的法律依据却几乎完全一致,即《反不正当竞争法》(以下简称“反法”)第二条原则性条款(虽然个别法院适用的是“反法”第十二条第二款第(四)项“其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为”,但由于其过于笼统、模糊,个案审理时还是要回到“反法”第二条予以评价和认定,故究其本质而言也属于在“反法”原则性条款适用上的“延伸”),而没有从狭义上的知识产权法专门条款加以评价和认定。并且,不同案件的判决结果也惊人相同,即均认定平台公开数据的抓取方、使用方构成不正当竞争。

管见认为,数据作为21世纪极其关键的生产要素和流通媒介,不应当不加区分地通通财产化、私有化。2022年12月,《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(即“数据二十条”)对外发布,其中明确指出:“坚持共享共用,释放价值红利。合理降低市场主体获取数据的门槛,增强数据要素共享性、普惠性,激励创新创业创造,形成依法规范、共同参与、各取所需、共享红利的发展模式。”特别是大模型时代已经到来,人工智能训练必然需要低成本地获取海量公开数据。2017年7月,国务院发布《新一代人工智能发展规划》,提出到2030年,我国人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。2022年7月,科技部等六部门印发的《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》提出,以促进人工智能与实体经济深度融合为主线,探索人工智能发展新模式新路径。2024年3月,李强总理在作政府工作报告时强调“深化大数据、人工智能等研发应用,开展‘人工智能+’行动”。在审理涉及数据利用的案件中,司法裁判应当保持谨慎、克制、中立,更应当秉持体系化和精细化思维,不应当在法律尚未明确规定的情况下,一概在所有平台公开数据之上创设一种所谓的“竞争权益”或“数据权益”,并将其归属于该公开数据的首置平台或经营者,由其牢牢控制,具体法理和规范分析如下:

一、所谓“数据权益”是一个伪概念

首先,本文所要探讨的数据,指的是网络平台上由众多数字符号单元组成的集合,而不包括信息量极小的数字符号单元。其次,本文所称的数据,指的是网络平台上已经公开呈现的数据,而不包括未公开的数据信息。后者在满足法定要件之前提下,可以作为商业秘密受到“反法”第九条的保护,这基本上是没有争议的共识,故在此不表。最后,数据和信息这两个概念并没有本质的区别。一般认为,数据是对客观事物的逻辑归纳,是于计算机及网络上流通的在二进制基础上以0和1的组合表现出来的比特形式。2021年9月施行的《数据安全法》第三条对数据的定义是:

“本法所称数据,是指任何以电子或者其他方式对信息的记录。”

也就是说,数据是以电子方式表现的信息,数据不是信息物理上的载体(不是纸张和作品的关系),而仅仅是信息的一种呈现方式,或者说信息只是数据的上位概念而已。实际上,很多文献都是将数据和信息同时并用或替换使用。

根据产生来源的差异,可以将平台公开数据分为几类。自然人在使用互联网产品或服务时被动留下的、具有可识别性、与人格利益(隐私、尊严、自由等)紧密相关的个人信息属于一类数据(本文称为数据A),这类数据的处理与利用应当由《民法典》和《个人信息保护法》调整,而没有必要再创设新的“个人数据”规则或所谓的“数据权益”。而对于自然人或市场经营主体(统称为“用户”)在使用互联网产品或服务时主动编辑、创作的数码化公开内容(英文缩写UGC),本文称为数据B,如果具有独创性,可以作为作品受到著作权保护。网络平台在收集、整理、编辑、添减数据A或数据B后产生的新的公开的数据集合,本文称为数据C。对于数据C,如果具有独创性,则可以作为汇编作品受到著作权法保护,故同样没有必要创设一个全新概念,即所谓“数据权益”。再有,平台经营者除了收集、编辑用户的数据,也完全可能自己创作、设计内容表达(本文称为数据D),显然,该内容表达只要满足独创性要件,便可以作为作品受到著作权保护。而当前司法的常见做法则是,无论平台经营者有没有事先证明涉案公开数据的独创性,均一味在其之上创设一个全新的“数据权益”或“竞争权益”概念,进而为其提供“反法”原则性条款的侵权救济,禁止他人任何抓取和利用涉案数据的行为。

与保护债权的合同法、保护股权的公司法不同,“反法”与物权法、知识产权法一样,其保护民事主体依法享有的财产性权益属于绝对权、对世权,而根据民法原理,绝对权、对世权必须有一个外在的、具有一定稀缺性的权利对象,如物权的对象是有体物;著作权的对象是作品;商标权的对象是承载了商誉的商业标识;商业秘密权益的对象是具有一定经济价值的未公开信息。[4]

虽然数据(或数据集合)也是一个外在的对象或客体,但并不是所有数据都具有稀缺性,都是私有财产,如公共数据就不受保护,任何人都可以自由无偿使用公共数据。因此,要证成某数据之上是否应当设置一项私有财产权利或权益,必须首先回答该数据是否具有一定的稀缺性。同样地,并非所有智力成果都受知识产权法保护,而著作权法中的“独创性”概念就是评判涉案智力成果是否具有一定的稀缺性,应否作为私有财产权保护对象的关键要件。

当然,大量的商业数据集合在某网络平台上,确实能够为该平台带来更大规模效应、用户黏性以及更多流量和潜在交易机会,故该数据集合显然是有商业价值的,那能否就此认为该数据集合具有稀缺性呢?实际上,经济学原理告诉我们,稀缺性取决于两个变量,一个是需求量,另一个是供给量(即稀缺性=需求量÷供应量,在需求量恒定的情况下,作为分母的供应量越大,说明该资源越不稀缺),而很多网络平台上的数据集合,都是基于预先设定好的模板或算法自动生成的,其最终展示给用户及消费者的呈现效果只是一种程式化的固定表达,而非个性化的创意表达,平台并不需要为该数据集合的生成及展示提供多大的人工成本和智力投入,故其不具有稀缺性,不构成私有财产。在著名的Feist案[5]中,美国联邦最高法院之所以最终否定了涉案电话号码簿的独创性,就是因为该数据集合是按照英文字母先后顺序套路化排列的,故不具有稀缺性,任何人都可以自由、免费复制或使用,哪怕原告为该数据集合付出了再多额头汗水。

另一方面,用户或消费者之所以喜欢在网络平台上浏览信息或选购商品,其关注或看重的通常只是单一数据的内容而不是所有单一数据集合而成的编排、呈现方式。因此,说整个数据集合具有商业价值,能够带来更多流量和交易机会还为时尚早,至少网络平台经营者要举证证明该数据集合的稀缺性或独创性。例如,一家出版社30年内出版发行了一千本图书,某经营者未经允许复制盗版了这一千本图书,请问挪用该图书数据集合的行为构成对这家出版社的不正当竞争吗?如果出版社与图书作者签订的只是非专有的普通许可,那估计该出版社连著作权都无法主张。类似的例子还可以举很多,如某人未经同意下载了某期刊数据库上的一万篇论文,不论该期刊数据库经营者与论文作者签署的是专有还是非专有许可协议,恐怕该期刊数据库经营者都不能向前者主张挪用论文数据集合构成不正当竞争。

皮之不存毛将焉附,在原告没能证明涉案数据集合具有一定稀缺性或独创性的前提下,抽离出来的、空泛的竞争优势、黏性流量或交易机会,便不可能独立成为“反法”所要保护的合法权益。这不仅仅是因为脱离具体保护对象(具有一定稀缺性的财产资源或智力成果)的所谓“数据权益”已然是无本之木、无源之水,更是因为所谓的用户黏性流量或潜在交易机会,其本质都是买方或消费者的自由选择权,而不是数据首置平台的私有财产。因为流量是随时动态变化的,未来交易机会更是高度不确定,如果认为流量或交易机会可以成为某家企业的私有权益,那就等于说该企业可以控制消费者和用户,将其死死地控制在自己所经营的商品或服务上,或者说消费者只是没有独立意志的工具或财物,而这种论断显然是不可接受的。市场竞争的本质就是流量和交易机会的争夺,如果不允许争夺流量和交易机会,就意味着不允许竞争,不允许消费者及社会公众自由选择,只有强制性的截流或欺骗误导性的引流才可能构成不正当竞争。

不仅如此,所谓的“竞争优势”也不能独自成为“反法”所要保护的合法权益。三十年河东三十年河西,风水轮流转、盈亏风险自担,无论是立法机关、执法机关还是司法机关都无法也不应通过设立或适用某项法律规则来保证某家企业永远保持竞争优势地位。食人肥己、优胜劣汰是市场竞争的常态和本质,在激烈的市场竞争环境中,逐利的经营者通过合法正当的手段去抓取他人平台上不受权利或法益保护的数据,无可厚非。的确,作为被抓取数据的首置平台,对于该数据的生成、汇集及整合投入了相应的人力物力财力,但法律并不保护纯粹的投资行为,当且仅当投资产生了有体有形的物质产品或具有创造性的智力成果时,法律才为该物质产品或智力成果提供保护,才在其之上赋予一种排他性的绝对权、对世权。试想,如果国家的法律制度要为每个经营者的投资提供保护或保证其投资必有回报,永远处于竞争优势地位的话,那就没有企业会亏损、倒闭、破产或注销。

在著名的“海带配额”再审案中,最高人民法院反复强调指出:

“在反不正当竞争法上,一种利益应受保护并不构成该利益的受损方获得民事救济的充分条件。商业机会虽然作为一种可以受到反不正当竞争法所保护的法益,但本身并非一种法定权利,而且交易的达成并非完全取决于单方意愿而需要交易双方的合意,因此他人可以自由参与竞争来争夺交易机会。竞争对手之间彼此进行商业机会的争夺是竞争的常态,也是市场竞争所鼓励和提倡的。”

“还需说明的是,一审法院多次使用了‘竞争优势’这一内涵和外延并不确定的概念,而且泛泛地将所谓山东食品公司的竞争优势作为反不正当竞争法所保护的法益,缺乏法律依据和法理基础。”“即使可以证明其为此进行了巨额投入,在没有充分证据证明马达庆实施了不正当竞争行为的情况下,因他人正常争夺商业机会而导致的投资损失或者竞争失败属于正常的商业风险,不能仅因有历史积淀和前期投入即推定商业机会应归属于己。”[6]

申言之,如果在原告没能首先证明涉案数据或数据集合具有一定的稀缺性或独创性,属于应当受保护的私有财产的前提下,笼统而含糊地认为数据抓取者损害了该数据首置平台的竞争优势、商业价值或所谓的“数据权益”,恐怕是没有任何请求权基础的。接下来,笔者将结合认定不正当竞争的四要件来逐一分析数据抓取行为的正当性。

二、认定不正当竞争必须同时满足四个要件

根据法律原理和理论通说,认定“不正当竞争”必须同时满足四个要件,即

(1)原被告双方作为经营者存在竞争关系;

(2)被诉行为损害了其他经营者(特别是原告)的合法权益;

(3)被诉行为违背了诚实信用和公认的商业道德;

(4)被诉行为扰乱了市场竞争秩序,损害了消费者合法权益及公共利益。

同时,“反法”一般条款(即“反法”第二条,又称“原则性条款”)与“反法”类型化条款(即“反法”第二章所列举的七种具体情形)是内涵与外延的逻辑关系。这也就意味着,类型化条款除了必须描述被诉行为的外在表现形态、界定其可能损害的权益类型之外,还可以给出这类不正当竞争情形的实质判断要件。当然,如果类型化条款(如“反法”第十二条)没有给出实质判断要件,或给出的并不是完整的实质判断要件,则仍然需要回到“反法”一般条款中综合前述四个要件全面加以研判。

然而,司法实践并没有从“不正当竞争”的基本内涵出发,严格遵循前述四要件,特别是第一个要件——“原被告双方作为经营者存在竞争关系”有被淡化或乃至完全忽略的趋势,甚至几乎把四要件缩减成仅仅一个要件,即只要被诉行为损害了原告的合法权益,便构成不正当竞争,所谓的违背诚实信用和公认的商业道德,损害了消费者合法权益、破坏了公平竞争秩序只是附带说明一下而已。这种做法是值得商榷和检讨的。

(一)“竞争关系”要件并非可有可无,或者说可以被任意泛化解释。在“网络不正当竞争”类纠纷中,不少审理法院提及,但凡被诉行为攫取了原告的用户流量或交易机会,就可以认定原被告之间存在竞争关系,而不论二者提供的商品或服务是否相同或类似。例如,在“天猫诉上货专家”案中,一审法院便指出:

“具体到网络领域,其商业模式新颖、多变,跨行业经营层出不穷,各商业主体经营内容、模式、对象、流量等往往存在交叉关系,极易在服务内容、用户群体、交易机会等方面存在此消彼长的竞争关系,因而网络领域的经营行为均受反不正当竞争法规制。”[7]

很显然,该见解采取的是一种倒推法,即只要被诉经营行为很可能给原告的用户流量和交易机会造成减损,便足以认定原被告存在竞争关系。然而,该倒推法恐怕是站不住脚的。

首先,诚如前文所言,用户流量或交易机会并非原告的私有财产,其本质是消费者的自由选择权,且消费者的选择是理性的、多样化的。一个做产品销量大数据分析的公司,可能会抓取某电商平台上的店铺经营信息,消费者并不会因为在该大数据分析公司网站上看到这些店铺经营信息而不再去该电商平台选购商品。所谓网络领域的经营活动,往往是借助技术和商业模式的创新,将蛋糕做大而不是切分原来已有的蛋糕,即利用数据、信息等既有资源为消费者开发新的商品或服务,这显然不意味着消费者只能“二选一”。因此,认定原被告之间存在此消彼长的竞争关系是需要充分论证的,而不能拍脑袋或想当然

其次,原被告双方存在竞争关系与被诉行为损害原告的合法权益与并非前因后果绝对匹配。换句话说,即便原被告双方不存在竞争关系,被告的行为也完全可能损害原告的合法权益。法官应当体系化地理解法律制度并借此找到正确的裁判依据。《民法典》第三条、第一百二十条及第一百二十六条均为保护包括经营者在内的所有民事主体依法享有的、尚未上升为法定权利的其他民事权益提供了充足的法律依据。

最后,简言之,有竞争不一定有损失,有损失也不一定全都是因为存在竞争才导致的。“反法”是民法的特别法,它只调整存在竞争关系的经营者之间的利益平衡,既然有《民法典》托底,便毫无必要突破既有的法律概念和规范体系,刻意淡化、曲解乃至彻底抛弃“竞争关系”要件。

(二)对于第二个要件“被诉行为损害了原告的合法权益”,本文第一部分已有充分探讨,此处不赘。但尚需补充的一点是,通过绕开或破解技术保护措施等方式大量抓取原告平台上的数据,是否会因挤占正常用户访问通道,导致原告服务器性能严重消耗,进而干扰平台的流量分析,增加其运营维护和监测防御成本呢?如果仅仅从该单一事实来看,被诉行为确实给原告造成了一定的经济负担,但这是否就属于原告“合法权益”之损害,则另当别论。

首先,互联网的精神和原理是开放共享,而不是区别对待。成规模的数据访问量会形成广告效应,本身就能够帮助该平台吸引来更多的潜在用户和消费者,而为此提升服务器性能是任何平台都愿意付出的成本。如果某家平台不欢迎批量访问,可以通过技术手段加以限制(如规定一个用户账号一天可以访问多少次平台),但该平台也要考虑这种限制可能惹恼消费者用脚投票。平台不能两头得利,既欢迎批量访问,又痛斥批量访问额外增加了自己的运营成本。

其次,浏览访问不等于实施数据抓取行为,更不等于被抓取的数据一定就是平台享有合法权益的保护对象。诚如前文所述,如果被抓取的数据不具有稀缺性或独创性,本就属于可以自由免费复制、传播和流通的公共信息(如电商平台上某件商品的尺码、重量、款式、价格、产地以及有关品质性能的直白描述等),或者即便构成私有财产但并非由平台经营者享有而是由平台上的特定用户享有,那平台又如何能说这种批量访问和抓取行为损害了自己的合法权益呢?

最后,水至清则无鱼,不能将前期为监测防御侵权所花的费用作为认定不正当竞争的构成要件。这就好比一家大型超市卖场,其中有一定会购物的消费者,也有不一定会购物只是来闲逛一下的消费者,更有想顺手牵羊的小偷窃贼,不能因为所有光顾者中包含小偷窃贼而为此安装监视器和增加保安人手消耗了成本,就将其归入因偷窃行为而导致的损害,进而认为还没有下手的嫌疑人构成不正当竞争或侵权。

(三)而就第三个要件而言,涉“数据抓取”类案件的审理法院,往往从被告未经许可抓取原告平台上的数据,或明知原告公示的“反爬虫协议”仍然抓取,或故意绕开或破解原告设置的技术保护措施而抓取等事实中推导出被诉方违背了公认的商业道德。管见认为,如此简化的推导逻辑恐怕是不足取的

第一,民法中的“善意”指的是“不知情”,但不能反过来说“知情而为”就是恶意。法律是最低限度的道德,对于个人品德的法律评价如此,更何况所谓“公认商业道德”的认定标准呢?在著名的“海带配额”案中,最高人民法院早就强调指出:“商业道德要按照特定商业领域中市场交易参与者即经济人的伦理标准来加以评判,它既不同于个人品德,也不能等同于一般的社会公德,所体现的是一种商业伦理。经济人追名逐利符合商业道德的基本要求,但不一定合于个人品德的高尚标准”。[8]

第二,正如前文所言,互联网的本质是互联互通、开放共享,网络平台通常都希望自己公开的数据能被更多人看到,也希望能够低成本获取他人平台上的公开数据。因此,很难说平台设置“反爬虫协议”来阻止他人获取自身平台上的公开数据属于互联网领域的行业惯例或公认的商业道德,其顶多只能算是设置“反爬虫协议”平台的单方意志而已。相反,设置歧视化的“反爬虫协议”,人为形成数据孤岛,导致其他经营者及社会公众获取公共信息的便捷度减损,恐怕才是真正有违互联网的精神理念、行业惯例或公认的商业道德。

第三,连被抓取的数据内容都完全可能属于公共资源而非私有财产,更何况技术保护措施本身的法律性质呢?退一步讲,即便技术保护措施所要保护的数据内容属于私有财产,但根据现行法律规定,破解技术保护措施在特定情形下也可以构成合理使用,即不需要事先征得权利人的许可,也无需向其支付报酬。[9]该规范意旨就在于,立法者并没有单独把技术保护措施设定为一项绝对权、支配权,当且仅当该措施所要保护的数据内容属于私有财产,且破解该措施的行为不属于合理使用时,破解人才可能构成侵权。这样规定能够有效防范网络平台实施“数据封禁”对其他经营者及社会公众自由获取和充分利用公共资源造成不当阻碍,促进社会整体福利。故仅以规避“反爬虫协议”或实施技术保护措施的破解行为便认定其违背了公认的商业道德,显然是有问题的。

(四)就第四个要件来说,未经允许批量抓取某网络平台上的公开数据,是否就扰乱了市场竞争秩序,损害了消费者合法权益及公共利益呢?恰如前文所言,市场竞争贵在动态平衡,逆水行舟、不进则退,没有哪家企业能够一劳永逸、坐享其成。如果某家暂时居于优势地位的企业试图借助法律手段来打压后来者,且后来者是通过技术和商业模式创新等合法手段夺取前者既有的市场份额,则该打压行为才真正涉嫌扰乱市场竞争秩序,可能构成垄断和不正当竞争。

就批量抓取数据而言,被诉方要么是将涉案数据做整体复制,且未做任何改编、加工等深度开发,用于与原告平台相同或类似的商品或服务上;要么是将涉案数据先做整体复制,但又做了实质性调整、修改、补充和续造,用于向消费者提供不同的商品或服务。对于前一种情况,可能确实构成对原告平台的实质性替代,但对于用户和消费者而言,只是换了一个平台而已,谈不上对其合法权益造成了损害;对于后一种情况,因为向用户提供的是完全不同的商品或服务,消费者福利是增加的,且也没有构成对原告平台的实质性替代。故无论怎样,都难以构成对消费者合法权益及公共利益的实质性损害。并且,前一种“实质性替代”原告平台的情况,也需要在原告平台对涉案数据享有合法权益的前提下,被诉方才可能构成侵权。

三、“反法”不是知识产权法的兜底规则

特别值得一提的是,民法中“保护”是一个中性词而不是一个褒义词,即并非油多不坏菜,越多保护越好。保护任何一种资源(无论是有形的物质实体还是抽象的数据信息),都意味着相当大的社会成本,该成本不仅包括为保护该资源必须付出的管理成本、执法成本和司法成本,更包括因创设一种排他性的绝对权、对世权而给其他经营者、消费者及社会公众所带来的获取、使用该资源所需付出的成本。因此,当且仅当保护某项资源(即创设一种私权)所带来的社会总收益大于社会总成本时,该资源才需要被保护、才值得被保护、才应当被保护

知识产权法的设立宗旨和整体框架便是始终在左右权衡、来回评估,各类情境下赋予一项数据信息或智力成果排他性私权,其所带来的社会总收益是否大于社会总成本,而为此创造的特定法律概念和具体规则(如独创性、思想/表达二分法、实质性相似、合理使用、法定许可、保护期等等)无非是进行这种利弊权衡的工具而已。因此,一旦涉案数据(集合)不满足独创性要件,不构成作品时,也就意味着立法者已经指引执法者、司法者做出了价值判断的结论,即涉案数据(集合)不需要被保护、不值得被保护、不应当被保护,被诉方复制、传播涉案数据的行为是正当的,不需要事先征得同意并为此支付报酬。

因此,对于不具有独创性的数据或数据集合,不是著作权法力有不逮没有能力提供保护的问题,而是任何法律制度都不应当给予保护的问题。如果不具有独创性的数据(集合)不应当受著作权法保护,但还可以受其他部门法(如“反法”)保护的话,那就意味着立法者允许执法者、司法者可以就同一被诉行为的正当性作出两次截然相反的评判结论,而这显然违背了逻辑同一律和法治原则,是不可接受的。因此,“反法”不是著作权法或其他知识产权法的补充规则,二者不是兜底与被兜底的关系,而是平行并列关系,即狭义上的知识产权法仅仅保护法定权利,而“反法”则仅仅保护尚未上升为法定权利的法益,但无论是法定权利还是尚未上升为法定权利的法益,其都是一种绝对权、对世权,从而将“反法”及知识产权法与合同法、公司法严格区分开来。

实际上,早在2009年,最高人民法院出台的《关于当前经济形势下知识产权审判服务大局若干问题的意见》就明确指出要:

“妥善处理专利、商标、著作权等知识产权专门法与反不正当竞争法的关系,反不正当竞争法补充性保护不能抵触专门法的立法政策,凡专门法已作穷尽规定的,原则上不再以反不正当竞争法作扩展保护。凡反不正当竞争法已在特别规定中作穷尽性保护的行为,一般不再按照原则规定扩展其保护范围;对于其未作特别规定的竞争行为,只有按照公认的商业标准和普遍认识能够认定违反原则规定时,才可以认定构成不正当竞争行为,防止因不适当地扩大不正当竞争范围而妨碍自由、公平竞争。”

不仅如此,对于尚未上升为法定权利的法益,由于其并没有通过公开呈现、物理占有或登记等方式事先进行公示,社会公众并不知道(也没有义务去知道)其保护对象的具体内容及其边界,且缺乏合理使用、保护期等规则的限制,故需要被保护、值得被保护、应当被保护的法益必须同时满足三大要件,即

(1)法益拥有者必须充分证明该法益具有相当的财产价值(即“稀缺性”),如未注册商业标识必须具有一定的知名度;商业秘密必须具有较大的经济价值等;

(2)被诉侵权人必须具有明显的主观故意乃至恶意,而一般过失则不构成,因为其对该法益免受损害并不负有事先的避让、注意义务;

(3)被诉侵权行为给法益拥有者造成了实质性的损害后果。

不仅如此,相较于法定权利,法益拥有者只能在已经造成实质性损害后方可以主张被动的救济,而欠缺积极权能,如将该法益进行转让、质押、作股出资等等。而对于已经在网络平台上公开的数据或数据集合,显然已经完成了公示环节。并且,具有一定稀缺性或独创性的数据或数据集合,完全可以作为一项独立的财产资源进行积极利用,故如果仅仅将其限缩在“反法”框架下予以被动的救济,显然也不利于鼓励交易和数据财产价值的充分发挥。

四、数据保护应当回归既有的规则体系

由此可见,抓取平台公开数据的行为难以满足认定不正当竞争的四项构成要件,故不适宜用“反法”第二条原则性条款或第十二条“互联网专条”予以规制,但这并不意味着所有数据抓取行为都是合法的、正当的。其实,现行《民法典》或知识产权专门法(尤其是《著作权法》)足以调整和评价各类抓取网络平台公开数据的行为,执法或司法机关应当根据个案不同情形,做更加精细化的综合研判,具体来说:

 情形一  当被抓取的数据属于原告平台经营者自己创作、设计的内容表达(数据D)时,显然,该内容表达只要满足独创性要件,便可以作为作品受到著作权保护,故这类未经许可的抓取行为(其实就是“复制”)多数情况都是侵权的(如果不属于“合理使用”或“法定许可”情形的话)。

 情形二  当被抓取的数据从每个独立单项来看属于原告首置平台上由用户创作、生成的内容(文字、图片或音乐等各类符号形式,简称数据B),但首置平台对这些成百上千项单个数据进行了筛选、编辑、加工,使得众多单个数据的集合(数据集合C)在整体排列、呈现上具有独创性,进而构成汇编作品,且被告恰恰是全盘照搬了该数据集合C,则不仅涉嫌侵犯单个数据B权利人的著作权,也完全可能涉嫌侵犯首置平台对数据集合C作为汇编作品享有的著作权

 情形三  如果被告在全盘照搬后,又对数据集合C的独特排列、呈现方式做了实质性改动、调整和重组,使其不构成与原汇编作品的实质性相似,则不侵犯首置平台对数据集合C享有的著作权,但仍然涉嫌侵犯用户就单个数据B享有的著作权

 情形四  如果单个数据B不属于具有独创性的作品,但却是与首置平台用户(或店铺经营者)紧密相关的、具有一定知名度的商业标识(如注册商标、字号、域名、商品名称、包装装潢设计等)或者是由该用户享有专利权的产品外观设计,且被告抓取该类数据是为了用于自己与前者相同或类似的商品或服务之上,从而达到消费者混淆误认或减省自身创作设计成本之目的,则完全可能涉嫌侵犯用户或店铺经营者而非平台享有的商标权或专利权,应当由《商标法》《专利法》或“反法”第六条予以规制

 情形五  如果单个数据B构成具有独创性的作品,但被告在抓取单个数据B时,已经经过该数据B权利人(即首置平台的用户)授权,但没有经过该数据首置平台经营者同意,则是否侵犯首置平台经营者的合法权益呢?这个问题相对比较复杂,但也并非没有解:首置平台虽然对该类数据并不享有一个完全属于自己的绝对权,但并不妨碍首置平台对其享有一种优先使用权。该优先使用权的正当性基础就在于,毕竟首置平台对这类数据的生成、编辑、存储和呈现投入了人力、物力和财力,故用户在签署平台用户协议,愿意接受平台的技术支持及其他帮助时,就视为用户同意首置平台可以优先使用该数据B,即构成默示许可

但是,该优先使用权是一种依附性的,一旦用户许可他人可以抓取、使用数据B时,也就意味着该用户解除了之前与首置平台之间的默示许可协议,也即首置平台丧失了对该数据的优先使用权,其不得阻止经用户授权的第三方抓取、使用该数据。当然,如果第三方未经用户同意而抓取、使用数据B,此时首置平台还是可以凭借其享有的优先使用权而主张该第三方构成侵权的。特别需要指明的是,首置平台不能对任何用户生成数据都享有优先使用权,诚如前文所言,该优先使用权具有依附性,如果单个用户数据不构成具有独创性的作品,用户对被第三方抓取的数据不享有任何权益的话,则首置平台更不可能对这类用户数据享有排他性的优先使用权。

也许有人会提出,这只是一种理论推导,并没有现成法条作为司法裁判的有效依据。其实不然,现行《著作权法》第十八条规定:

“自然人为完成法人或者非法人组织工作任务所创作的作品是职务作品,除本条第二款的规定以外,著作权由作者享有,但法人或者非法人组织有权在其业务范围内优先使用。作品完成两年内,未经单位同意,作者不得许可第三人以与单位使用的相同方式使用该作品。”

同时,最高人民法院2002年颁行的《关于审理著作权民事纠纷案件适用法律若干问题的解释》第十二条规定:

“按照著作权法第十七条(现行著作权法第十九条)规定委托作品著作权属于受托人的情形,委托人在约定的使用范围内享有使用作品的权利;双方没有约定使用作品范围的,委托人可以在委托创作的特定目的范围内免费使用该作品。”

不难理解,之所以委托人对委托创作作品享有免费使用权;之所以用人单位对职务作品享有优先使用权,其道理就在于,委托人(用人单位)虽然对委托创作作品(职务作品)未做出任何实质性智力贡献,但确实为这类作品的创作提供了物质条件和技术支持,基于公平原则,即便其不享有该作品的初始版权,也应当赋予其一定的排他力以弥补其投入成本,并借此鼓励其继续为作品的产出提供支持。而用户数据首置平台同这种情况也完全类似,只是互联网语境下的首置平台对海量用户数据的生成所花费的投入成本,如果平均到每个用户上来说并不高,故其优先使用权也应当相对减弱,即但凡用户同意第三方使用自己在首置平台上生成的或创作的数据内容,则首置平台对该数据的优先使用权即告消灭

另外,特别值得一提的是,通说认为,独创性的认定门槛并不高。如果首置平台为数据(集合)的整理、编辑及生成付出了大量资金投入,是可以作为认定独创性的其中一项关键因素和初步证据的,在满足高度盖然性的证据采信标准的基础上,应转由被诉侵权方举证证明该数据的排列、呈现方式属于程式化表达或本领域的通用表达、惯常表达,如果被诉侵权方不能举证证明,则应当推定涉案数据(集合)具有独创性,属于受著作权保护的作品。但如果无法确证涉案数据(集合)的独创性,也难以证明其属于首置平台用户合法权益(如商标权、专利权等)的保护对象,则应当推定该数据(集合)是可以被自由抓取和利用的。当然,即便涉案数据(集合)属于受著作权保护的作品,这种保护也不是铁板一块,著作权法中的合理使用规则、法定许可制度、实质性相似概念以及保护期的安排等等,均为其他经营者和社会公众能够低成本乃至自由免费使用受保护数据留出了弹性空间,也即促进了数据这一21世纪最关键生产要素的高效流通、充分利用和衍生续造。

结  语

综上所述,现有民法及知识产权制度已经为平台公开数据的保护提供了非常完备且十分精巧的利益平衡机制,而这么做的最大好处就在于,它为任何人、任何企业的数据利用行为均划出了一道可明确预期的边界,也为所有网络平台上的公开数据提供了最平等、最适恰的保护,因为没有哪家互联网公司敢拍胸脯说自己已经掌握或控制了全部有价值的数据,进而永远处于竞争优势地位。相反,舍弃如此完备且精巧的制度安排不用,倒退到笼统且模糊的“反法”原则性条款,禁止一切未经平台允许的数据获取及利用行为,最终恐怕只会导致本不该保护的给予了保护;本该限制保护的却给予了超范围的过度保护;本可以积极赋权的却仅仅提供了被动的救济,无异于将开放共享、自由联通的互联网圈禁成一潭潭死水,阻碍大数据训练和人工智能的快速发展,更谈不上能够为市场经营主体及社会大众提供稳定、合理且公平公正的行为预期。

申言之,不具体情况具体分析,一概为网络平台上的所有公开数据提供“反法”原则性条款(“反法”第十二条第二款第(四)项“其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为”由于过于笼统、模糊,审理案件时还是要回到“反法”第二条予以评价和认定,故该条款也属于“反法”原则性条款的“延伸”)的保护,是不适当的、不合理的,也是缺乏法理基础和逻辑依据的,更与现有法律法规(包括但不限于《反不正当竞争法》《著作权法》《商标法》《专利法》《民法典》)和国家宏观政策(如“数据二十条”“新一代人工智能发展规划”等)的规范意旨是不匹配的。对于前沿且复杂的数据抓取类纠纷,考验的是审判法官的细心、智慧和专业素养,法官理应根据个案不同情况,分门别类、抽丝剥茧,在现有制度框架和概念体系下,庖丁解牛般地做缜密的推断和审慎的研判。

注释

[1] 浙江省高级人民法院(2023)浙民终1126号民事判决书。

[2] 北京知识产权法院(2021)京73民终2816号民事判决书。

[3] 上海知识产权法院(2023)沪73民终334号民事判决书。

[4] 参见熊文聪:《超越称谓之争:对象与客体》,载《交大法学》2013年第4期。

[5] Feist Publications, Inc. v. Rural Telephone Serv. Co., 499 U.S. 340, (1991)

[6] 最高人民法院(2009)民申字第1065号民事裁定书。

[7] 浙江省杭州市中级人民法院(2022)浙01民初1478号民事判决书。

[8] 最高人民法院(2009)民申字第1065号民事裁定书。

[9] 参见现行《著作权法》第五十条。

本文来自微信公众号“知产力”(ID:zhichanli),作者:熊文聪,36氪经授权发布。

相关文章