今年的3.15,WiFi探针火了。
WiFi探针本身仅仅是一种通信技术,但是被歪曲应用和误解了。WiFi探针本身其实仅仅是一种数据采集,WiFi探针后面的“私人信息大数据库泛滥”其实才是可怕的,但貌似很多人将重点关注放在了WiFi探针层面上。
WIFI探针的工作过程:在移动终端接入 WiFi 网络的时候,需要发送Probe request (say hello)探针数据包,而这些数据包中包含了该终端之前接入过的 SSID 名称以及终端的 MAC 地址信息,这种探测模式一般称为主动发现模式。WiFi 通信过程经常会使用 WPA 和 WPA2 的加密方式,以保证终端和 AP 之间的数据包传输的机密性,防止被第三方窃听。然而在终端接入 AP 之前,终端需要去发现 AP 的存在,两者需要发送一些数据包来标识自身的存在,而前期的交互信息是明文,而且包含了终端的 MAC 地址信息和之前接入过的SSID 信息。
MAC 地址信息可以唯一的标识一台终端设备,不同的厂商拥有自己的 MAC 地址段,可以通过 MAC 地址直接查询该 MAC 地址对应的终端设备厂商信息。因此,在手机识别的过程中,MAC 地址可以作为其唯一性的标识,不同的两个手机 MAC地址是不同的。
简单讲:WiFi探针就是一个通信数据传输前的打招呼过程,好比它一直在向周围喊着,我在这里,大家快来连接我啊。MAC地址可理解为门牌号,几门几单元并不是一个私密信息,是可以明文模式被采集的。问题在于,门牌号被采集之后,后面还有一个可怕的“私人信息大数据库”,可以将门牌号和里面住户信息匹配下来,这个“私人户口信息”是重点。这样,小商小贩对照明文的门牌号,可以针对性叫卖,因为知道里面住户是谁。
回到手机WiFi探针,被采集到MAC地址不可怕,可怕的是“MAC地址和手机号对应库”,这样完成从MAC地址到手机号及手机持有人的映射关系,城门大开,广告自然来。
如何在拿到MAC地址后,获得使用者的手机号码? 一句话解释是地下自建数据库资源匹配。那问题来了,自建的数据库是从哪里得来数据呢?可能性最大的数据来源有两种:
一是XX商的信息泄漏。XX商会记录每个用户的MAC地址,在有需要的时候查询,他们当然也知道你的手机号,因此他们是最完备的数据来源(可以理解成公司的IT网管拥有公司所有人的电脑的MAC地址和IP地址)。
二是APP信息泄漏。现在APP基本都是用手机号注册,下载之后,很多APP都会默认获得你的MAC地址。这些资源,除了我们已知的在暗网上面售卖的各种明码实价的信息,还有众多的内部信息泄漏渠道。
所以,WiFi探针本身仅仅是一种技术,问题的核心是“私人信息大数据库”泛滥,并且进行画像(性别、年龄、学历、车子、房子、是否抽烟喝酒烫头大保健啥的)。
除了MAC地址,WiFi探针还可以采集到哪些数据呢?
可采集数据:设备MAC地址/WiFi信号强度/WiFi信号频道/信号帧类型。
在公共安全领域,WiFi探针的作用:可以将摄像机集成的探针采集到的MAC地址数据结合电信企业、公安机关数据相关联,可建立多维度的公共安全监控系统。
比如国内有安防企业的卡口摄像机,集成了WiFi探针。
通过WiFi探测技术来识别AP(无线访问接入点)附近已开启 WiFi 的智能手机、电脑等,进行识别信息。采用全向天线信号采集装置,在空旷环境下可以有效采集半径200米范围的智能手机或其他WiFi终端设备信息。当不法分子手机打开WiFi功能时,即便手机不联网(打开WiFi功能),也可以探测到不法分子手机机的MAC地址。
当然,也可以通过采集到的相关信息进行大数据分析,结合视频监控确定用户的行为轨迹,进行人流分析,定位等等诸多功能。
公安实战应用系统:
MAC频次分析
如在案发地带,可疑人员反复徘徊、进出(犯罪人员踩点、熟悉作案环境、犯罪事后探查等情况),公安实战应用系统的MAC频次分析功能可从经过该点的海量MAC数据分析中,侦测到频繁出现的可疑人员信息,为案件的侦破提供有力线索。
MAC多点碰撞分析
特定时间段内(比如案发时,案发前后)在多个案发现场搜集到的海量的MAC地址信息,通过MAC多点碰撞分析,可分析出同时在案发现场都有出现的人员信息,进而可以对破获团伙惯犯或连环作案等情况提供帮助。
MAC频繁夜出
夜间是犯罪高发期,天地伟业超星光技术将黑夜还原似白昼,同时配合WiFi探针技术,多维采集数据,利用系统MAC频繁夜出功能,将黑夜防控提升至最高级别。
MAC区域徘徊
通过分析一定区域之内MAC地址出现的次数,找到区域徘徊的智能手机。除系统人员(如该区域所有者、负责人、相关人员等系统预存的MAC地址)外,可疑人员的反复徘徊将会引起系统注意。
由于公共安全的外部环境较复杂,可以根据不同场景选择合适的Wi-Fi探针进行部署。部署环境必须具备2个条件:1、确保设备能够供电。2、确保设备能够上网。如果需要将MAC地址用作身份信息的识别,则需其他相关部门的配合,如电信企业、公安部门等。
由于探针本身设计仅仅是探测周边有些什么设备,因此并不产生大量数据,设计的时候就不会将收集到的数据存储在本身,而是通过有线连接直接发送到中心服务器上,这样即使有恶意的人将探针取走,也不能获得探针收集到的信息。同时有线连接也保证数据传输过程不容易通过电磁波的形式被监听和窃取。中心服务器一般都是在IDC机房里,而要进入IDC机房是需要经过IDC层层许可的。因而不论是数据的传输还是存储,探针的数据都是安全的。
除大陆地区,中国香港为配合“香港智慧城市蓝图”的智慧出行,香港运输署计划到2020年底在全港所有主要干线和主要道路上安装并使用1070组交通探测器。根据需求,这些探测器可以采集实时交通数据,及时发现交通事故,计算旅行时间和交通延误情况。
整个项目将分两期进行,一期项目中将采购安装430台美国FLIR公司生产的ITS Dual产品,这是一款可见光和红外热成像双波段检测器,热成像部分做数据采集(流量、速度、占有率、车型分类等)和事件检测(事故、抛洒物、行人进入高速等),可见光做视频图像监控,WiFi探针做路段交通流研判。通俗来说就是视频+红外热成像+WiFi探针三合一的交通流检测设备。
总结:鸦片是药品,也是毒品,枪支是武器,也是凶器,重点不在物品本身,在于管理。WiFi探针本身是通信技术,也具有很多场景的应用价值,但是当被利用于非法的数据采集和应用,价值观扭曲,隐患无穷。其实,我们更应该关注WiFi探针后面的“大数据泛滥”问题,随着AI、物联网、大数据的迅猛发展,未来将会有更多的技术应用落地,但信息安全及隐私问题亟需整治,从严管控,但也不能因噎废食,惧怕新技术的应用!(作者:安天下)