身为驴(旅)友,花大把时间探索大千世界着实不错,如果运气好,找找宝藏,没准真能遇到堆满了金银财宝的“小金屋”。不过,这都算不上离奇。最刺激的,宝藏被神秘人士仍在大街上,任你去取。连找的力气都省了,那还不得乐昏过去?或许你会问,世上哪有这等好事?别说,还真有!
近日,研究人员鲍勃·迪亚琴科( Bob Diachenko )和文尼·特罗亚( Vinny Troia )就发现了“宝箱”。原来,这是一个 Elasticsearch 服务器,其中包含12亿用户账户,该服务器被公开在暗网上,任何人都可以“到此一游”。
数据来自何方?
研究人员分析,当人们通过 BinaryEdge 和 Shodan 寻找公开信息时,偶然发现服务器的IP地址可以追溯到 Google Cloud Services 。总体而言,该数据库存储着超过 4 TB 的公开数据供公众访问。
作为全文检索搜索引擎的核心技术, Elasticsearch 作为基于 Lucene 库的搜索引擎而存在,其被应用于企业信息网站、媒体网站、政府站点、商业网站、数字图书馆和搜索引擎中。
查看研究人员分享的详细信息后发现,该数据是从社交媒体平台(包括 Twitter , Facebook , LinkedIn 和 GitHub )中抓取,而该平台同样为 Git (一个开源的分布式版本控制系统)的存储库执行托管服务。
这些数据在服务器中被分类成四个不同的数据集,其中三个被标记为“ People Data Labs ”的数据代理,而另一个则被标记为“ OxyData ”的数据代理。
Troia 称,他在 People Data Labs ( PDL )中发现了自己 10 年前在 AT&T 公司办理的一个固话号码。这个号码他从未使用过,但是当时录入的信息却被保留在了这里。
经研究发现,在该服务器中包含了近 30 亿 PDL 用户记录,近 12 亿唯一人员和 6.5 亿唯一电子邮件地址。这些数据数量不光与 PDL 公司的宣传相符,甚至研究人员还可以通过 PDL API 返回的信息来反向查询这些数据。
另外,研究人员通过将数据库和上述两家公司的公开数据进行比对,发现至少在一定程度上源自它们。研究人员在博客文章中专门针对 PDL 的措辞进行了详细说明:在打开的 Elasticsearch 服务器上发现的数据几乎与 People Data Labs API 返回的数据完全匹配。唯一的区别是 PDL 返回的数据还包含教育历史记录。从服务器下载的任何数据中都没有教育信息。其他所有内容都完全相同,包括具有多个电子邮件地址和多个电话号码的帐户。
但是, PDL 联合创始人 Sean Thorne 否认公司拥有该服务器的说法,并称,该服务器的所有者可能使用了 PDL 提供的一种扩充产品,以及其他数据扩充或许可性服务。
另一方面,4 TB 用户数据(包括 3.8 亿个配置文件)被证实来自OxyData公司,但是该公司同样回应称并没有服务器的所有权。
截止目前,研究人员并不能确定是谁将服务器公开在互联网上,但信息泄露意味着将会影响到两家公司的共同客户,并使其面临数据滥用的风险。
除了这次事件, Elasticsearch 服务器曾多次被向公众公开,这同样将毫无戒心的用户和企业的个人数据置于风险之中:
1、今年早些时候,Elasticsearch服务器上公开了超过2000万俄罗斯公民的个人信息。
2、今年5月,在 Freedom Mobile 拥有的 Elasticsearch 数据库在线泄漏后,具有数百万加拿大人 CVV 码的个人和支付卡数据再次暴露。
3、去年 12 月,另一个包含 8200 万美国人个人信息的数据库在网上暴露了出来。
Elasticsearch 服务器有关的数据泄漏事件屡屡出现,也吸引了大量攻击者的目光,因为这可能成为其攻击行动的切入点。