移动互联网

知物由学 | AI时代,那些黑客正在如何打磨他们的“利器”?(二)

2018/3/7 12:31:00

“知物由学”是网易云易盾打造的一个品牌栏目,词语出自汉·王充《论衡·实知》。人,能力有高下之分,学习才知道事物的道理,而后才有智慧,不去求问就不会知道。“知物由学”希望通过一篇篇技术干货、趋势解读、人物思考和沉淀给你带来收获的同时,也希望打开你的眼界,成就不一样的你。

在本系列的“第一部分”中,我们介绍了机器学习如何帮助黑客进行信息收集以及模拟攻击。接下来我们介绍本系列的第二部分:

3.利用机器学习进行未经授权的访问

接下来是获得对用户帐户的未经授权的访问。想象一下网络犯罪分子需要未经授权访问用户的会话,显而易见的方法是不断的去尝试密码登录。对于大规模的黑客行为,其中一个非常恼人的事情是验证码。许多计算机程序可以解决简单的验证码测试,但最复杂的部分是对象分割,有许多研究论文描述了验证码验证方法。2012年6月27日,Claudia Cruz,Fernando Uceda和Leobardo Reyes发表了该领域的机器学习的第一个例子。他们使用支持向量机(SVM)的方法来破解在reCAPTCHA图像上运行的系统,其准确率为82%,并且所有的验证码机制都得到了改善。但是之后,出现了一大堆利用深度学习方法破解CAPTCHA的论文。2016年,有文章[1]发表详细说明了如何使用深度学习以92%的准确率打破简单验证码。

另一项研究是使用了图像识别领域的最新进展之一[2],具有34层的深度残留网络,打破印度流行网站IRCTC的CAPTCHA,准确率达到95-98%。这些论文大多采用基于字符的CAPTCHA。

其中一个最鼓舞人心的论文是在BlackHat会议上发布的,这项研究被称为“我是一个机器人”。他们打破了最新的语义图像CAPTCHA的记录,并比较了各种机器学习算法,并且打破了Google的reCAPTCHA的记录,准确率达到98%。

更让人敬畏的是,一篇新的文章指出,科学家称即将推出100%的CAPTCHA验证方法。网络犯罪分子可能在机器学习的帮助下找到另一个领域是暴力破解密码。

在深度学习成为热门话题之前的很长一段时间里,马尔可夫模型是2005年用来产生密码“预测”的第一个模型。如果你熟悉当前的神经网络和LSTM,你可能已经听说过一个基于训练的文本生成文本的网络,例如,如果你给这个网络一个莎士比亚的作品,它会根据它创建一个新的文本。同样的想法也可以用来生成密码。如果我们能够使用最常见的密码来训练网络,并且可以生成许多类似的密码。研究人员采用这种方法, 将其应用于获取密码并获得了不错的结果,这比传统的方式更好地创建密码列表,例如将字母更改为符号,例如从“s”到“$”。

另一种方法是在论文“PassGAN:密码猜测的深度学习方法 [3]”之一中提到的,研究人员使用GAN(生成对抗网络)来生成密码。GAN是由两个网络组成的特殊类型的神经网络; 一个通常被称为生成性的,另一个是有区别性的。当一个网络产生敌对的例子时,另一个是测试他们是否可以解决一个问题,其核心思想是根据最近发生的数据泄露所收集的密码真实数据来训练网络。在发布了来自所有违规的14亿个密码的最大数据库之后,这个想法的实现对于网络罪犯来说看起来很有希望。

4.利用机器学习进行攻击

网络犯罪分子想要利用机器学习的第四个领域就是实际的攻击。总体而言,攻击有三个总体目标:间谍活动,破坏活动和欺诈行为。这些恶意软件、间谍软件、勒索软件或任何其他类型的恶意程序都是由网络钓鱼或攻击者将其上传到受害者的计算机上而造成的。无论如何,攻击者都需要以某种方式将恶意软件上传至受害者机器上。

使用机器学习来保护恶意软件可能是第一个在网络安全领域进行机器学习的商业成功的应用,现在已经有很多篇论文描述如何使用人工智能(AI)检测恶意软件的不同技术。

网络犯罪分子如何利用机器学习来制造恶意软件?第一个众所周知的用于创建恶意软件的AI例子是在2017年发表的一篇名为“基于GAN的黑盒攻击产生敌手恶意软件的例子” 的论文中[4]提出的,作者建立了一个名为MalGAN的网络。

该研究提出了一种生成恶意软件实例的算法,能够绕开基于黑箱机器学习的检测模型。它所提出的算法比传统的基于梯度的生成算法实例要好得多,并且能够将检测率降低到几乎为零。系统以原始恶意软件样本为输入,基于样本和一些噪声输出敌对样本。神经网络的非线性结构使他们能够生成更复杂,更灵活的例子来欺骗目标模型。

我之前提到有三个主要的攻击目的:间谍,破坏和欺诈,其中大部分是由恶意软件执行的。不过,还有另外一种相对较新的攻击方式,可以被视为破坏行为,被称为Crowdturfing[5]。简而言之,是恶意使用众包服务。例如,攻击者向工作人员支付一些现金,为竞争业务写入不好的在线评论。由于是真实的人写的,这些评论往往不被发现,因为自动化工具正在寻找软件攻击者。

其他选项可能是海量的,DoS攻击或者是假信息的产生。在机器学习的帮助下,网络罪犯可以降低这些攻击的成本并实现自动化。 2017年9月发布的“在线评论系统中的自动化人群攻击和防御”研究论文介绍了一个系统,该系统生成对Yelp的虚假评论。好处不仅仅是无法检测到的很好的评论,而是比人类评分更高的评论。

5.网络犯罪自动化的机器学习

有经验的黑客可以使用机器学习在各个领域自动完成某些必要的任务。因此很难说什么时候是自动化的,但是由于网络犯罪组织有成百上千的成员,可能会出现不同类型的软件,也可能会支持更多的我们意想不到的方式。

至于具体的网络犯罪,还有一个新术语——Hivenet[6]-它们是聪明的僵尸网络。这个想法的大概内容是,如果僵尸网络是由网络犯罪分子手工管理的,那么蜂巢网络可以有一个大脑来支撑完成一个特定的事件,并根据事件改变它的行为。多台机器人同时处在设备上,根据任务,他们将决定现在谁将使用受害者的资源,就像生物体中的一串寄生虫。

附录:

·       “深度学习以92%的准确率打破简单验证码”[1]

·        34层深度残差网络破解CAPTCHA[2]

·        PassGAN:密码猜测的深度学习方法[3]

·        基于GAN的黑盒攻击[4]

·        恶意使用众包服务:Crowdturfing[5]

·        聪明的僵尸网络:Hivenet[6]
原文链接:https://dzone.com/articles/machine-learning-for-cybercriminals-part-2
文中知识点,可关注网易易盾公众号“yidun_163yun”,输入“20180306”获得链接查看。


版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。

专家介绍

  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 广告赞助| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10