1956年世界达特茅斯会议上诞生了“人工智能”的概念,经历四起四落、长达半个多世纪的发展,人工智能终于在近几年迎来了爆炸式增长。在人工智能盛行全球的今天,它到底发展到了什么程度?现在的AI能做什么?我们或许可以从人工智能的两大核心要素–算法和数据来聊一聊。
智能加研究院举过一个很有趣的例子:人工智能是一辆奔跑的汽车,算法是发动机、数据是汽油。随着AI技术发展和研究的深入,发动机的性能会越来越强,不同开发者设计的发动机会有优劣之分;与此同时,汽油是AI行驶的动力之源,如果没有数据,再好的汽车也无法启动。只有优秀和算法和智能的数据相辅相成,“AI汽车”才能一路狂奔。
在近日落幕的2019OTEC人工智能创新论坛上,格灵深瞳创始人、CEO赵勇也分享了一个非常独特的看法:人工智能已经度过了以“核心算法”见长的第一阶段,正在向“数据智能”的第二阶段转变。
“核心算法”见长阶段还处于算法PK的过程。拿人脸识别来讲,作为崛起较早的人工智能技术分支,FRVT、Mega Face、LFW各种全球人脸识别竞赛充斥了新闻版面,无论是新兴人工智能企业还是老牌互联网企业甚至是安防企业都在算法PK方面进行的异常火热,你追我赶、互不相让,但随着算法水平的优化和成熟,核心算法阶段已经逐渐成为过去式。当然,格灵深瞳也交出了一份漂亮的成绩单:
7月初,全球最权威的人脸识别算法测试(FRVT)公布了最新结果,首次参与此竞赛的格灵深瞳在最具挑战的“非约束性自然环境人脸照片”测试项目中获得全球第一名的佳绩;在2018年公安部交通管理科学研究所主办的第一届全国道路车辆图像特征人工智能识别算法竞赛中,格灵深瞳在40+家参赛厂商中脱颖而出;2019年北京市交管局组织的第一届交通行为图像智能识别技术竞赛中,格灵深瞳的行为识别算法也获得了全国总排名第一的佳绩。这些成绩都证明了格灵深瞳在人脸识别、车辆识别和行为识别这三个极具规模应用前景的技术上,处于国内乃至国际领先的技术水平。
行业核心算法优化至一定程度,比如可商业化应用的标准,人工智能将迈入“数据智能”阶段,AI的未来将更多的聚焦“数据”二字。但数据也有分类,我们最常见的数据是原始数据,是无序的、非结构化的,比如公安、交通等行业产生的大量的视频数据。据格灵深瞳赵勇介绍,中国现在约有安防监控摄像头1.76亿台,但其中绝大多数只有基础的监控和录像功能,产生了大量的非结构化数据,占用了全世界50%的硬盘的数据信息中80%为冗余的无效信息。而数据智能的关键则是数据驱动决策,让机器具备推理等认知能力,大数据能够指导决策,在完成业务数据化进程后,开始进入到业务智能化,依靠数据去改变业务。
关于数据智能的布局,格灵深瞳主要依赖于其自主研发的两大基础平台:智源视觉计算平台、灵犀数据治理平台。
从原始数据到智能数据: 智源视觉计算平台。该平台可以把原始的视频数据转化为基础的结构化数据,完成“从原始数据到智能数据”的任务。目前智源视觉计算平台可以实现全目标解析和融合,包括人脸、人体、车辆、非机动车等等。从细分特征来讲,智源视觉计算平台支持年龄、性别、种族、表情等10种人脸特征,衣服样式、颜色、附属物品等25种人体特征,16种车型、10种号牌、12种颜色、4种违章行为、21000余种车款等25种车辆特征,以及车身颜色、车辆姿态、车型分类等14种非机动车特征。
从智能数据到数据智能 : 灵犀数据治理平台。该平台的目标是从各种结构化数据中挖掘行为规律、关联关系、消费习惯等有价值的信息,为上层的应用平台提供目标线索、安全管理、商业运营等方面的认知数据, 实现“从智能数据到数据智能”的关键任务。其一方面汇聚智源视觉计算平台获取的人脸、人体、车辆、非机动车等目标的结构化数据,另外一方面接入包括交易数据、位置数据、信息系统数据等各种信息,并基于特征搜索和聚类算法以及大数据智能分析算法,构建全目标的知识图谱,真正完成对场景和目标的认知理解。拿更具象化的例子来说,其可以描述出目标人在过去几个月的活动轨迹,他的朋友是谁,周围打交道的人和他是什么关系,他的消费习惯等等信息。
无论是核心算法还是数据智能,技术始终要服务于现实,AI也要商业化落地。格灵深瞳基于两大基础平台发力公安、零售、金融三大行业。而在这一阶段,人工智能将带来哪些改变?我们拭目以待。
本文素材来自互联网