前阵子热播的电视剧《亲爱的,热爱的》不仅让众网友发掘了“现男友”这个宝藏般的存在,也着实让网络安全竞赛中的有名赛事CTF(夺旗赛)大火了一把。虽然剧情已落下帷幕,但现实中的“网络安全战”还在持续。例如最近长沙警方侦破的一起“卖茶女”特大电信网络诈骗案件,不仅一时成为社会新闻的热点,更是让这起事件背后的黑灰产业链重新浮出水面。据报道,该犯罪集团以公司化运作,内部组织严密、分工明确,公司下设专业剧组、技术组、物流组、业务组,其中,技术组负责从黑灰产业以两三百元不等的价格采购微信号,实时更新朋友圈。专业剧组则负责按照剧本设定寻找貌美年轻的模特并跟拍,为诈骗团伙提供“朋友圈”及聊天素材。诈骗手段之精密程度令人咋舌。
有阳光的地方就有黑暗,黑灰产链条其实一直都在人们看不见的地方兀自蔓延,在与黑灰产博弈的过程中,黑白名单、规则引擎看似是对付欺诈行之有效的办法,但只要对其原理稍加了解,就会明白很多时候它们还是在做着“亡羊补牢”的工作:黑白名单仅用于检测,覆盖率和准确率有限;规则引擎则需要对欺诈行为有深入了解,且需要大量人工操作,难以跟上最新形势。
那么在这场猫鼠游戏中,难道防欺诈就注定不能跑在欺诈活动发生之前了吗?
似乎还是有可能的。近几年,“无监督机器学习”开始出现在人们的视野,并与防欺诈紧密地联系在了一起。而谈到在做“无监督反欺诈技术”的企业,DataVisor又几乎是其中绕不开的一家。今年5月,在2019数博会“领先科技成果发布会”上,从全球范围内最终选出的100 个2019领先科技成果优秀项目里,DataVisor(维择科技)的AI反欺诈风控解决方案位列其中。作为全球首家将无监督机器学习技术运用到流量检测的企业,DataVisor在运用AI反欺诈、打击黑灰产方面的潜力越来越引人注目。
在DataVisor中国区总经理吴中看来,既然被挂以“黑灰产”的名称,其实就已经说明了我们与“黑灰产”之间注定将是“敌暗我明”的关系。如今对付欺诈行为早就不是拉黑那么简单的事,网络黑产已然呈现欺诈形态变化快,攻击呈现出团伙型的特点,因此传统规则极易被突破且难以拦截新型欺诈。而与无监督机器学习相对的有监督机器学习,不仅需要大量人工标注数据来训练检测模型,
数据更新还费时费力,在检测未知的欺诈行为方面终归“跑”得慢了点。
图片由受访者提供
与这些防欺诈手段不同的是,无监督反欺诈技术无需任何训练数据和标签,而是通过发现用户的共性行为,以及用户和用户的关系来检测欺诈。例如在一群用户注册事件中,无监督反欺诈技术通过聚类和图形分析发现其中几个集群符合某些共性:注册时间集中,都使用了某操作系统,某一个浏览器版本等。种种要素都符合某种超乎寻常的一致性,显得十分可疑。实际上,如果将这些用户中的任何一个单独拿出来分析,看上去都是极其正常的用户,很容易被忽略。
吴中表示,这正是无监督机器学习技术的优势所在:“它对打击团伙型的、新型多变的欺诈行为非常有效,因为该技术并不强依赖于过往的数据标签,而是通过分析用户数据间的关系来捕捉风险群组。”同时,由于欺诈分子在潜伏期的行为依然符合某种规律,具有某些一致性,同样还是会被无监督算法捕捉到,甚至还会被提前预警。在攻击发生前就检测出欺诈分子,这一点,恐怕是其他防欺诈方法难以做到的,这也是无监督机器学习之所以在反欺诈检测领域备受关注的重要原因之一。
在与某移动社交平台的合作案例中,欺诈团伙使用仿真软件生成虚假的GPS位置,并通过添加好友、更新个人资料等,来建立看似正常的用户行为历史。DataVisor通过大数据系统自动挖掘出潜在群体性隐蔽欺诈行为并发现未知新型的spam(互联网上到处散布的垃圾邮件),同时自动提供每个欺诈群组的群组关联信息,大大提升了自动封禁或人工审核的效率,以确保这些欺诈群组被有效地提前识别和封禁。
图片由受访者提供
不过,吴中也坦言,打击网络黑灰产和防欺诈依然需要多种手段和技术的配合,“风控并不是靠一种技术就能完美解决,黑名单、规则模型、有监督机器学习在一定场景或特定阶段也有其优势,对于检测已知模式,它们相对而言是效率较高、成本较低的选择,而无监督机器学习算法则在群组型的欺诈攻击检测拦截方面有非常大的优势,并且对于新型的欺诈行为有很强的检测能力。”他认为这些手段更多是“互相结合的关系”。
在普及行业知识、加深大众对AI防欺诈的认识方面,DataVisor一直都很活跃,不仅在全国诸多城市举办“维择下午茶”活动,还将在接下来出现在重庆智博会及上海人工智能大会上。吴中表示,在携反欺诈管理解决方案dCube亮相2019数博会后,dCube的功能还在被不断优化,并上线了设备指纹、SDK等产品。
在为了说明无监督机器学习的应用前景时,知名技术咨询公司Gartner那句“到2021年,50%以上的企业都将会把无监督机器学习用于企业的反欺诈检测之中”常常会被拿来引用。实际上机器学习确实已经被越来越多地用在网络级行为分析和实时的实体异常检测中,AI/机器学习工具也开始在实时监控人类行为方面发挥着重要作用。可以说如果这一愿景真的被实现,反欺诈行业的智能化程度将被大大提升。不过我们也应该看到,随着欺诈防御越来越强大,欺诈团伙使用的人工智能攻击手段也势必会发展壮大。与黑灰产、欺诈活动的博弈,将注定是一场旷日持久的“猫鼠游戏”。