爬虫技术凭借高效的数据抓取能力与优质的数据产出,成为众多互联网企业的得力工具。然而,其广泛应用也伴随着一系列法律风险。在上海市普陀区人民检察院办理的一起案件中,8亿行餐饮商超数据、超300万次地图数据遭非法爬取。检察机关通过高质效办案,成功破解取证与定性难题。
风控系统拉响警报
2023年2月初,某知名地图软件公司在日常风控监测中发现异常:有不明用户正持续爬取其数据库中的地理坐标类数据,单日窃取量高达100万—400万条!该数据涵盖商家信息、服务介绍、用户点评、排行及地理位置等核心内容。公司虽迅速启动拦截机制,但对方伪造的请求特征高度模拟真实用户行为。同年5月,该公司向公安机关报案。
李、吴二人均就职于一家科技公司,主要负责采集数据,生成商业报告卖给客户。二人嫌正常浏览方式获取数据效率过低,遂企图通过编写接口直接爬取。然而,因各大平台风控严密,自学技术难以突破,便通过网络平台找到素未谋面的技术“外援”陈某某,双方约定以100万次/400元的价格,由陈某某提供爬取各类平台数据的接口。到案后,李、吴均承认:“自己技术初级,全靠陈某某搞定接口。”
2023年7月21日,陈某某在广州被抓获。鉴于该案技术性、专业性强,普陀区检察院依法介入侦查,引导公安机关重点对电脑中发现的参数获取脚本、程序等进行功能鉴定,并结合三人供述、数据需求与聊天记录,对查获的数据库内容进行鉴定,准确区分出各类数据的获取方式、数量、类型及访问次数。
经查,李、吴使用陈某某提供的、专门用于绕过验证机制的爬虫接口,非法爬取互联网平台美食、商超类数据共计8亿余行,调用地图软件公司地理坐标类数据达300余万次。近日公安机关以涉嫌非法获取计算机信息系统数据罪将陈某某、李某某等3人移送普陀区检察院审查起诉。
检察官巧解“算账”难
检察官介绍,本案中,地图软件公司提供有偿批量数据查询服务,其损失可参照公允市场查询价计算。而互联网平台公司的涉案数据属于其核心经营资源,难以直接进行价值评估。李、吴的非法调用数据导致该公司消耗巨额流量,造成显著运营成本损失。为此,检察官开展自行补充侦查,最终认定三人行为造成两家公司损失共计5万余元。本案中,平台数据保护措施属计算机信息系统安全保护措施,李、吴分别采用技术手段侵入计算机信息系统,获取数据,情节严重,其行为分别触犯《中华人民共和国刑法》第二百八十五条第二款。
陈某某能否被认定为李、吴的共犯?检察机关审查认为,陈某某与二人素未谋面,仅在网络联系中提供有偿爬虫程序及接口。李、吴利用该工具实施非法爬取,三人形成上下游协作关系。承办检察官认定,陈某某的行为更符合提供侵入计算机信息系统程序罪的构成要件,情节特别严重。
本报记者 解敏