四天的测试之后,刘凡在会议室中向赵建国以及他带来的其他六个人展示成果。在半小时的视频播放之后,刘凡起身站到大家面前。
“刚才的演示应该还是比较清晰的,现在我应该说是来做一个注解吧。”刘凡现在面对这样的场合,显然自如了很多,“信息泄露及交易这个问题核心因素就两个,一是内鬼,二是黑客。在内鬼方面我能做的很少,我先来谈谈我的大数据处理系统能如何有效针对黑客。
听说今天在座好几位都是技术部门的负责人,那想必各位都知道,其实像电影里那种动不动就黑了五角大楼的黑客是万里挑一的,90%以上的黑客,使用的手段都差不多,而且很好学。说白了就是做好五件事情,隐藏IP,发现目标漏洞,植入木龙篡改数据,获取目标,赶紧闪人。
而他们在做这五件事情的时候最注重一点就是时间,在赵局的授权下我研究了警方现在正在使用的黑客侦查系统,逻辑和执行都没有问题,问题就出在速度上。这个速度问题还可以分为两块,一是处理速度,二是即时性问题。
所以我刚才展示的最直观的内容,就是速度,大家应该也都看到了刚才的实验对比,经过我优化的系统可以提高三倍以上的数据处理速度。那么在第视频第二部分所展示的即时黑客报警机制是如何实现的呢?
这个东西还是和我的底层算法特殊性有关,我们现在在用的侦查系统利用的是痕迹信息,据说是已经发现了1800多种痕迹信息对吧?但在我的算法演算之下,已经发现了二十多种木马植入逻辑,有了这些植入逻辑,系统可以在黑客正在进行攻击的时候进行报警。”
“抱歉打断一下。”就在这时,有一名男子突然举手。
“您有什么问题?”面对警察刘凡还是很礼貌的,怂不怂的不重要,关键是对这个职业的尊敬。
“真的不好意思。”男子又对着大家说了声抱歉,“主要这个问题困扰了我很久,正好讲到这了我就想问问。刘先生提到了你的算法,我之前也做过研究,现在很多人认为你的算法才能带人类走向真正人工智能时代。
我个人对真正的人工智能,或者说你的算法的理解就是依托与计算机强大的处理能力,让计算机拥有与人类一样的思考方式,而计算机可以打破人脑的能力限制,人工智能实现一了种类似超级人类的存在,去处理无数人类处理不了的问题。也包括你之前提到的在无序中寻找有序。”
刘凡仔细的想了想,点头道,“也可以这么理解。”
“那这里我就有一个疑惑了,如果计算机真的可以拟人了,那么在计算机可以像人类一样思考的同时,是不是也就意味着计算机会像人类一样去犯错?纵观人类历史,人类经常犯的一个错就是一叶障目,当人类对世界的认知更完善的时候,就会发现自己以前对世界的认知是错的。
那么你如何确定你的算法推导出来的函数或者规则就是对的呢?虽然目前在人脸识别的使用上确实很有成效,但如果在未来,数据量变得越来越大,这些规则错了怎么办?到时候会不会出现一些混乱?”
“看来这位警官跟我一样是个爱琢磨的人。”刘凡笑了笑道,“我可以这样回答您,您刚才的论点是计算机拟人后可能也会像人一样犯错我也考虑过,所以在我的算法中有一个函数反省机制。
简单来说,算法一旦在数据中发现了函数规则,他需要将函数规则对所有相关数据进行一次匹配,正确100%的函数规则才会保留,而当数据增加的时候,每一个增加的数据函数规则都会进行一次匹配。
就拿人脸识别来说,在越来越多的人脸信息输入的时候,这个函数规则一直在做匹配,一旦这个函数规则在某一个人身上匹配不上了,即便正确率高达99.99%,系统也会立刻将这个函数从规则列表中剔除出去。
也就是说,在现有的大数据环境下,规则列表中的规则可以保证100%正确,而我们需要寻找的那些罪犯只要都是在这个数据库里的,就不会发生意外。如果发生意外也是在极端情况下,比如一个全新的人脸数据刚进入这个库里,正好函数匹配不上了,而这个人正好又是罪犯,又刚好激发了这个错误的函数,又正好被拍下来了。”
“我明白了。”男子点头道,“如果是这样的话其实在人脸识别方面不用担心什么意外,随着这些年的技术发展用不了多久我们就可以覆盖几乎所有人的人脸资料。
但是像这次的反黑客技术,数据是在不断膨胀的,是不是还有另外一种可能就是系统显示出现了所谓的规则,但因为规则是错的,所以出现误报呢?”
“误报确实是一种可能性。”刘凡并不避讳,“这在人脸识别项目的时候就提出过,虽然是极小概率事件,但针对这个问题我也配备了足够的预案。
如果只是单一的小概率误报可以人工报错我们会手动剔除,如果在特定时间内出现两次以上误报,我设置的逆推算法剥离程序就会激发,进行自检并保留传统的技术。
但就算只保留传统技术,我们在速度和精度上依然都是有优势的。这在之前我们也展示过。”
“可万一同时出现大批量误报呢?”
“科技只是一个辅助工具。”就在这是,赵建国突然开了口,他低沉的声音带着莫名的威慑力。
“赵局我只是想把可能存在的隐患都问清楚。”
“我明白您的意思。”刘凡赶紧笑着接话缓解突然压抑的氛围,“不过针对您的顾虑我其实也都有做相应的措施,比如权重阙值响应机制。
在所有的逻辑中,其实是有使用频率的比重分布的,比如A逻辑的使用是比重是80%,B逻辑的使用比重可能就10%,所以在我们接到的系统报警中,是通过哪一种逻辑引发的报警也是会有比重分布的。
之前在人脸识别的实施时我就提过,动态特征依旧是特征,在过于极端的情况下我的技术依然会失效,这次的黑客追踪也是如此,虽然发现了一些木马植入逻辑,但如果黑客使用的木马植入方式正好避开了这些逻辑,那这个系统在这方面的优势也就没了。
再加上本身犯罪就是一个小概率事件,所以我们可以打一个时间差,我们假设平均出警时间半小时,如果一小时内出现两次误报,那系统就自动剥离了,所以您刚才提到的那种极端现象,首先你一小时内得出现几十个甚至上百个报警,而这个时候系统会显示异常,根据权重比例,优先取出高比重的10%的报警,剩下的90%会自动启动剥离程序,但不是什么都不做,只是转向使用传统的追踪程序。
如果在特定时间之后没有出现误报上传,后面的系统报警会继续根据设定被被激发,这就避免了因为系统短时间内的大量错误导致浪费警队资源与精力的情况。
而类似这样的预案我还在系统中设置了几十种,说白了,您的担心想必是因为这些规则是由算法推导出来的,所以你认为可能不可控,这些问题我都有考虑过,回头我们可以私聊。”
刘凡说到这,之前的男子满意的点了点头,“麻烦刘先生了,你这么一说我就放心多了。”
趁着大佬们不注意,方华突然戳了一下万翠翠。
万翠翠吓了一跳,略带生气的看着方华,“你干嘛?”
方华指了指万翠翠的眼睛,笑了笑道,“你眼睛里张星星了。”
万翠翠:“......”