网络抓取对民主至关重要的原因

2020-12-30 11:16:24

网络抓取的成果-使用代码从网站中收集数据和信息-遍布我们。

人们建造刮板,可以找到地球上每个Applebee的刮板,或者收集国会立法,投票或在粉丝网站上追踪要出售的精美手表。企业使用刮板来管理其在线零售库存并监视竞争对手的价格。许多知名站点使用刮板来完成诸如跟踪机票价格和工作清单之类的工作。Google本质上是一个庞大的爬行网络爬虫。

铲运机也是看门狗和新闻记者的工具,这就是为什么The Markup在本周向最高法院提起诉讼而向法庭提起法庭之约的原因,该威胁扬言将铲运定为非法。

案子本身-Van Buren诉-涉及的不是刮scrap,而是关于起诉佐治亚州警察Nathan Van Buren的法律问题,后者被贿赂在执法数据库中查找机密信息。范·布伦(Van Buren)根据《计算机欺诈和滥用法案》(CFAA)受到起诉,该法案禁止未经授权的人访问计算机网络,例如计算机黑客,其中有人闯入系统窃取信息(或如1980年代经典电影《战争游戏》中所描述的那样) (可能会引发第三次世界大战)。

对于范布伦(Van Buren)的案件,由于他被允许访问数据库进行工作,所以问题在于法院是否将他的烦恼活动广泛定义为“超出授权访问权限”以提取数据,这将使CFAA构成。而这个定义可能会影响新闻记者。

或者,就像尼尔·戈索奇(Neil Gorsuch)法官在周一的口头辩论中所说的那样,朝着“也许使我们所有人成为联邦罪犯”的方向发展。

调查记者和其他监督者经常使用刮板来阐明大小问题,从通过收集政府大楼的数字访客日志跟踪秘鲁游说者的影响,到在Facebook上监视和收集政治广告。在这两种情况下,抓取的页面和数据都可以在Internet上公开获得-无需进行黑客攻击-但所涉及的网站可以轻松地更改其服务条款上的精美文字,以将这些信息的汇总标记为“未经授权”。根据最高法院的裁决,最高法院可以裁定违反这些服务条款是CFAA规定的。

Markup在我们的简报中写道:“一项法规,如政府或富有的企业参与者等强大力量,通过其网站的服务条款阻止这些努力,将新闻采集活动单方面定为,将违反《第一修正案》。”

什么样的工作有风险?以下是通过网络抓取使一些新闻报道成为可能的摘要:

来自大西洋的COVID跟踪项目每天收集和汇总来自全国各地的数据,以此作为监测正在进行检测,大流行在哪里增长以及谁从中感染和死亡的种族差异的手段。病毒。

来自Reveal的该项目取消了极端主义的Facebook团体,并将其会员名册与Facebook上的执法团体的会员名册进行比较-并发现了很多重叠之处。

Reveal还使用刮板机发现,绝不应该向底特律居民收取数亿美元的财产税,这些居民随后因丧失抵押品赎回权而失去了房屋。

标记最近对Google的搜索结果进行的调查发现,它一贯偏爱自己的产品,留下了一些网站,这些网站巨人自己从这些网站中搜集了困扰访问者的信息,从而减少了广告收入。司法部在针对该公司的反托拉斯诉讼中引用了该问题。

在复制,粘贴,立法,今日发现的千篇一律的法律模式,特殊利益集团的大力推动,全国各地的立法循环。

路透社刮擦了社交媒体和留言板,为被收养的孩子寻找一个地下市场,他们的父母通常从国外收养孩子,他们认为这些孩子对他们来说太多了。在功能块一对夫妇后来被裁定绑架的调查结果。

Gizmodo能够使用类似的工具找到成千上万台Ring监控摄像机的可能位置。

Trace和The Verge使用刮板,发现人们使用在线市场在没有许可证且没有进行背景调查的情况下出售枪支。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。