裁判文书网数据竟被商家标价售卖

"\u003Cdiv\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002FRXvr1kd8I41slv\" img_width=\"149\" img_height=\"172\" alt=\"裁判文书网数据竟被商家标价售卖\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp1.pstatp.com\u002Flarge\u002Fpgc-image\u002FRXvr1ksHURdXO9\" img_width=\"209\" img_height=\"169\" alt=\"裁判文书网数据竟被商家标价售卖\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp\u003E贩卖数据商家的推销页面\u003C\u002Fp\u003E\u003Cp\u003E昨天，北京青年报从某网购商城看到，最高人民法院裁判文书网的数据被标价0.1元到1元不等出售。裁判文书网发布的判决书都是公开的，为什么会被售卖？获取裁判文书网数据的手段对于网站是否有危害呢？\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E网售数据\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E价格需“私聊”获取\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E北青报记者在某网络商城中看到，有标注来自湖南、广东、山东等多地的商家均声称出售裁判文书网的数据，其中不少商家声称其数据量超6000万条。而据裁判文书网公开数据显示，目前裁判文书网上公开的文书总量为7395万多篇，如果商家所称的数量属实，则商家能够提供绝大多数已经公开的文书数据。\u003C\u002Fp\u003E\u003Cp\u003E不少声称能够出售裁判文书网数据的商家在商品文字描述中称，其数据是通过“网络爬虫”的方式获取的。所谓“网络爬虫”，又称网页蜘蛛、网页机器人，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。相当于一个自动访问网页并进行相关操作的小机器人。\u003C\u002Fp\u003E\u003Cp\u003E北青报记者注意到，尽管每名商家均在商品页面标示称，其数据售价为0.1元至1元，但每名商家均在文字描述中表示，数据的售价并不以标示为准，而是需要“私聊”获取。\u003C\u002Fp\u003E\u003Cp\u003E一名售卖裁判文书数据的商家说，购买裁判文书数据的买家所需要的数据量从几千篇到几千万篇不等，有的买家是因为无法打开裁判文书网而不得不来求助于数据卖家，“还有很多学生买数据用于论文写作，这种情况几千条就够了，商用的话可能需要几百万条甚至上千万条。”商家还称，每个月他们能接到四五个文书数据采集的订单，而价格和买家需要的数据量有关，“几百万条数据大概要几千块钱，现在加密技术很严格，所以要贵一些。”\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E“爬虫”系统\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E曾致正常用户无法访问\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E北青报记者了解到，部分技术机构通过网络爬虫系统获取裁判文书网数据的行为，已经给裁判文书网正常用户的访问带来了不便。不少网友曾在网上发帖称，自己搜索裁判文书时，常常遭遇裁判文书网网站显示因为系统原因，无法查询的情况。\u003C\u002Fp\u003E\u003Cp\u003E对此，最高人民法院在其官网回应网友对于裁判文书网运行慢、故障频繁等情况时表示，由于中国裁判文书网公开文书数量和影响力不断增加，访问用户数不断增长。同时，2018年5月初以来，大量技术公司通过爬虫系统无限制并发访问非法获取裁判文书数据，造成网站负荷过大，大量正常用户请求堵塞，访问出现速度慢或部分页面无法显示等现象。\u003C\u002Fp\u003E\u003Cp\u003E今年5月，最高人民法院信息中心主任许建峰在接受媒体采访时表示：“中国裁判文书网目前每天的访问量可以达到几千万的量级，其中还包括数据爬虫的攻击，我们的中心服务器承受着巨大压力。”\u003C\u002Fp\u003E\u003Cp\u003E“我们每时每刻都在监控着它的应用情况，希望遇到问题立即采取措施，但是的确还不能完全跟得上步子，所以会出现停网维护运营的情况。”许建峰说，最高法已成立了专门的运维保障团队去维护管理中国裁判文书网，也将在技术与人力上投入更多的力量。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E相关机构\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E已采用多种方式“反爬”\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E北青报记者获悉，此前，相关方面已采取多种方式，对抗“爬虫技术”。最高人民法院曾发文称，为更好地确保正常用户访问性能，相关方面以验证码的方式上线系统软件防爬功能。“验证码技术是防爬虫的一种有效措施，当浏览量在某段时间内达到一定数量后，将启用验证码机制进行核验。后续，我们将不定期更新防爬虫技术，加强网站维护，提高网站运行效率和稳定性。”\u003C\u002Fp\u003E\u003Cp\u003E此外，针对网友提问，为何不能按照“公开时间”为检索条件进行裁判文书检索时，最高人民法院方面表示，暂没有设置“公开时间”为检索条件的主要原因是爬虫系统会根据“公开时间”项进行增量文书爬取，“待下一步防爬虫系统稳定、可靠运行一段时间后，我们将适时考虑增加‘公开时间’检索项。”\u003C\u002Fp\u003E\u003Cp\u003E此外，最高人民法院方面称：“由于前期爬虫行为过于猖獗，无限制暴力访问大幅降低正常用户访问性能，我们采取了通过限制列表页面翻页数量来防止爬虫系统的措施。”\u003C\u002Fp\u003E\u003Cp\u003E文\u002F本报记者屈畅\u003C\u002Fp\u003E\u003Cp\u003E实习生赵诣涵统筹\u002F池海波\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E律师分析\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E强行突破“反爬”技术或构成犯罪\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E金杜律师事务所从事IP类法律业务的律师瞿淼曾发文阐述了网络爬虫所涉及的法律问题。瞿淼称，从技术中立的角度而言，爬虫技术本身并无违法违规之处。但是，随着数据产业的发展，数据爬取带来的各种问题和顾虑日渐增加。过于野蛮的爬虫可能造成网站负荷过大，从而导致网站瘫痪、不能访问等。\u003C\u002Fp\u003E\u003Cp\u003E“由于爬虫的批量访问会给网站带来巨大的压力和负担，因此许多网站经营者会采取技术手段，以阻止爬虫批量获取自己网站信息。而针对这些技术手段，爬虫开发者可以通过优化自己的代码、使用IP池等多种方式规避上述技术措施，实现对网站信息的批量抓取和复制。”瞿淼说，由于网络爬虫会根据特定策略尽可能多地访问页面，因而爬虫的使用将占用被访问网站的网络带宽并增加网络服务器的处理开销，甚至无法正常提供服务。\u003C\u002Fp\u003E\u003Cp\u003E瞿淼认为，根据《反不正当竞争法》关于网络的相关条款，如果网站运营者已经采取了一定的反爬虫措施，而爬虫控制者基于经营目的、强行突破网站运营者采取的反爬虫技术措施，并客观导致被抓取网站无法正常运行，则可能构成不正当竞争行为。此外，强行突破某些特定被爬方的技术措施，还可能构成刑事犯罪行为。\u003C\u002Fp\u003E\u003Cp\u003E针对此情况，北京市社会组织法律调解中心副理事长张新年律师认为，“这些裁判文书基于司法公开目的，是免费的公共资源，未经最高人民法院授权，商家售卖裁判文书网数据构成侵权。”\u003C\u002Fp\u003E\u003Cp\u003E文\u002F本报记者屈畅朱健勇\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E"'.slice(6, -6), groupId: '6720466457789989380

裁判文书网数据竟被商家标价售卖

热门新闻

周热门

裁判文书网数据竟被商家标价售卖

转向机器人！三星电子被曝停止自动驾驶研究：开发难度超预期，商业化难

消息称三星停止自动驾驶研究 开发人员转到机器人领域

安徽建工：技术赋能 项目建设跑出智慧建造“加速度”

微创机器人-B：图迈腔镜手术机器人获得欧盟CE认证

小i机器人一度涨超14% 与香港知名保险公司建立战略合作伙伴关系

小i机器人(AIXI.US)与香港知名保险公司建立战略合作伙伴关系

润欣科技(300493.SZ)：计划在两年时间内训练AI Chatbot机器人并商用10000台

机器人：子公司新松半导体增资扩股引入战略投资者

均普智能(688306.SH)：公司的人形机器人可以进行独立行走和智能交互

均普智能(688306.SH)：目前人形机器人已经发布第一代本体产品

中国品牌日活动即将开幕，“空中出租车”、双足机器人等多个上海品牌首次参展

国家发改委开展涉及不平等对待企业法律法规政策清理工作

【深度】企业破产法修改，依旧难产？

以“三个善于”为引领深入推进高质效监督办案

律师解读｜TikTok正式起诉美国政府，主张是什么，胜算几何？

热门新闻

周热门

消息称三星停止自动驾驶研究开发人员转到机器人领域

安徽建工：技术赋能项目建设跑出智慧建造“加速度”