数据审查:爬虫爬取公共信息需要注意什么?

标题结论:

爬取公共信息除了应当遵循正常的网络规范,获得数据方许可外,特殊主体还负有审查义务。

案例描述:

A公司开发了一款查询公司企业各方主体的平台“查查企”,其主要数据来源为国家企业信用信息公示系统的公开数据,A公司在此基础之上,向用户提供了定向发送和实时推送的功能。2019年,A公司向用户发布了有关于B公司清算的相关信息,由于B公司是国内较大公司,关注者甚多,一时间网上遍布着众多关于B公司是否清算的相关信息,让B公司的社会评价严重受损,故B公司将A公司诉至法院。

双方主张:

B公司主张

1.A公司停止侵害,赔礼道歉

2.撤回有关于B公司的所有虚假或误导性信息,并发布澄清信息

3.赔偿B公司经济损失及维权的合理开支495万元

A公司辩称

1.有关于B公司的相关信息系公共平台所展出的公共信息,A公司未进行二次编辑

2.有关B公司清算事项并非虚假信息,只是时间发生于2014年

裁判结果:

一审法院认为A公司本身基于公共数据的采集、处理而盈利,应当就信息的真实性负有较高的注意义务,且本案中,A公司系主动向用户推送了案涉信息。造成了B公司商誉受损,故判决A公司向B公司赔偿损失及合理费用60万元,并消除相关影响。

二审法院驳回上诉、维持原判。

笔者建议:

对爬虫公司的建议:依爬虫数据采集处理为主要业务流程的公司,应当对数据来源、处理进行较高程度的审查。首先应当在爬取之前确认该数据来源是否合法,该数据是否允许爬取(如查看Robots文件);其次了解该数据载体所能承受的爬取速度、频率等,做出合理的爬取策略;最后要对数据进行审查、清理,避免不合法、不合时效等异常数据推送到客户端。

对因互联网导致权益受损的公司的建议:互联网案件有个很大的特点便是取证困难,往往打起官司来很难举证,所以若遇到网络侵权或类似的情况,应当及时拍照摄像保存,必要的时候聘请律师,在其帮助下进行公证留底方便以后诉讼维权。

笔者分析:

虚拟数据信息是一种财产的观念渐渐成为大家的共识,爬虫促进了公共信息的传播,最大程度发挥了数据的效能。但是在运用爬虫时,有许多的风险与边界需要考虑,尤其是依此数据盈利的主体,应具有更高的审查义务,对信息的真实性、时效性、关联性都要进行相应的审查。确保数据来源合法、约束数据的使用行为,改进相应的爬虫技术,促进数据的良性流通。

法律依据:

《反不正当竞争法》第二条、第十七条

案例出处:

一审(2019)浙8601民初1594号

二审(2020)浙01民终4847号

发布:法律人钱斌,如若转载,请注明出处:https://www.91lvshi.cn/857.html

(0)
上一篇 2022年4月22日
下一篇 2022年4月22日

相关推荐