数字视网膜:让智慧城市从“看清”向“看懂”进化
时间:2020-06-05 07:04:56 来源:光明日报
[导读]创新是引领发展的第一动力。今年两会,科技创新成为高频热词。近年来,我国科技创新成果不断涌现,高铁、5G、人工智能等一些高新技术产业进...
创新是引领发展的第一动力。今年两会,科技创新成为高频热词。近年来,我国科技创新成果不断涌现,高铁、5G、人工智能等一些高新技术产业进入世界前列,智慧城市建设加快推进,应用成果惠及更多老百姓。
在人工智能的部分领域,我国从基础研究到技术应用都发展很快。比如,中国工程院院士、北京大学教授高文提出的“数字视网膜”,既是一种理念创新,也是一个新的产业机遇,对智慧城市的建设意义重大,本期邀请他详细解读。
数字视网膜并非真的要做一种仿生视网膜的硬件,而是希望能够改变目前摄像头只能看或者单一链路识别的功能。让摄像头本身拥有一定的AI处理能力,对识别到的车、人、场景主动进行特征提取。从而让摄像头上传到云端的视频数据,一路通过高效编码作为数据存储;另一路经过特征提取直接作为智能大脑的“可读物”。“云大脑”与摄像头的结合,就像是给智慧城市安装了一层新的“数字视网膜”。
1.数字视网膜的八个基本要素
现在比较典型的“城市大脑”,一般是传感数据、收集、存储、数据交换和集成,还有开放的算法平台。另外,还有运行和服务平台。在平台里面,实际数据量最大的是视频数据,大概占到90%以上,这些数据能识别是车还是人,车牌号等,然后传到云端。目前的视频数据,最长存三个月。因为大量的数据不等于大数据,而且随着城市摄像头越装越多,数据增长速度非常快,海量数据的价值很少。
目前的视觉感知系统,也只是对原始信号只进行了简单的编码压缩就送到云端。视觉系统的进化实际是经过了一个漫长的历史阶段,如果看眼睛的进化,不管是昆虫还是高脊椎动物,进化是不一样的,比如昆虫是浮眼,可以完成对天敌快速识别的功能,眼睛进化实际发生了非常长的时间。
>
智慧城市升级,浙江乌镇开通城市开放道路“5G自动微公交”示范线路。新华社发
视觉通道是把视网膜上看到的东西,通过视觉通道送到脑的视觉,最后形成认知和感知。中间的网络传输通道是非常重要的,整个视网膜大概有1.2亿个感官细胞,包括锥状细胞和感知细胞,最后通过神经连接到了大脑。从视网膜到大脑之间的连通通道,并不是每一个感光细胞直接连接到了大脑,而是通过视神经连接过去,视神经的个数和视网膜本身的个数有一个比,大概126∶1,也就是说从视网膜每个感光细胞往大脑送的视觉连接通道大概有126∶1左右的压缩率,这个压缩不是简单的视频压缩,它是特征抽取,这个过程是今天的“城市大脑”要好好学习的。
如果神经系统进化不好就会产生很多问题,比如说自闭症,可能在小时候发育的时候,这种连接增长速度太快,可能会形成自闭症。所以想让“城市大脑”健康,就要视网膜或者摄像头要有很好的分工协调机制,这是从生命系统得到的启发。根据这个启发,我们在设计新的第二代“城市大脑”或者云视觉系统的时候,在中间的视觉神经通道要好好学习,我们把这个工作叫作数字视网膜。
数字视网膜的定义,包括八个基本要素,这八个基本要素包括有统一的时间戳,有全局的位置信息,有高效的视频编码功能,有高效的特征编码功能、联合优化等,要有机制和软件可定义的一些功能,这样就比较容易进行升级。这八个基本的功能要求我们分成了三组。第一组叫作全局统一的时空ID,作为一个“城市大脑”,一个全局的视觉系统来说,全局统一的时空ID非常关键。第二组特征把高效视频编码、高效特征编码和连接优化,这三个定义成第二组功能,把它叫作多层次视网膜表示,包括视频编码、特征编码、联合优化三大块。第三组特征,是把高效的模型可定义功能组合到一起。这三个组合在一起,就不会像以前的摄像头,一个硬件做进去之后改变不了什么了,按照这种数字视网膜设计出来的摄像头,可以与时俱进,可以进行一些新功能的更新。
在人工智能的部分领域,我国从基础研究到技术应用都发展很快。比如,中国工程院院士、北京大学教授高文提出的“数字视网膜”,既是一种理念创新,也是一个新的产业机遇,对智慧城市的建设意义重大,本期邀请他详细解读。
数字视网膜并非真的要做一种仿生视网膜的硬件,而是希望能够改变目前摄像头只能看或者单一链路识别的功能。让摄像头本身拥有一定的AI处理能力,对识别到的车、人、场景主动进行特征提取。从而让摄像头上传到云端的视频数据,一路通过高效编码作为数据存储;另一路经过特征提取直接作为智能大脑的“可读物”。“云大脑”与摄像头的结合,就像是给智慧城市安装了一层新的“数字视网膜”。
1.数字视网膜的八个基本要素
现在比较典型的“城市大脑”,一般是传感数据、收集、存储、数据交换和集成,还有开放的算法平台。另外,还有运行和服务平台。在平台里面,实际数据量最大的是视频数据,大概占到90%以上,这些数据能识别是车还是人,车牌号等,然后传到云端。目前的视频数据,最长存三个月。因为大量的数据不等于大数据,而且随着城市摄像头越装越多,数据增长速度非常快,海量数据的价值很少。
目前的视觉感知系统,也只是对原始信号只进行了简单的编码压缩就送到云端。视觉系统的进化实际是经过了一个漫长的历史阶段,如果看眼睛的进化,不管是昆虫还是高脊椎动物,进化是不一样的,比如昆虫是浮眼,可以完成对天敌快速识别的功能,眼睛进化实际发生了非常长的时间。
>
智慧城市升级,浙江乌镇开通城市开放道路“5G自动微公交”示范线路。新华社发
视觉通道是把视网膜上看到的东西,通过视觉通道送到脑的视觉,最后形成认知和感知。中间的网络传输通道是非常重要的,整个视网膜大概有1.2亿个感官细胞,包括锥状细胞和感知细胞,最后通过神经连接到了大脑。从视网膜到大脑之间的连通通道,并不是每一个感光细胞直接连接到了大脑,而是通过视神经连接过去,视神经的个数和视网膜本身的个数有一个比,大概126∶1,也就是说从视网膜每个感光细胞往大脑送的视觉连接通道大概有126∶1左右的压缩率,这个压缩不是简单的视频压缩,它是特征抽取,这个过程是今天的“城市大脑”要好好学习的。
如果神经系统进化不好就会产生很多问题,比如说自闭症,可能在小时候发育的时候,这种连接增长速度太快,可能会形成自闭症。所以想让“城市大脑”健康,就要视网膜或者摄像头要有很好的分工协调机制,这是从生命系统得到的启发。根据这个启发,我们在设计新的第二代“城市大脑”或者云视觉系统的时候,在中间的视觉神经通道要好好学习,我们把这个工作叫作数字视网膜。
数字视网膜的定义,包括八个基本要素,这八个基本要素包括有统一的时间戳,有全局的位置信息,有高效的视频编码功能,有高效的特征编码功能、联合优化等,要有机制和软件可定义的一些功能,这样就比较容易进行升级。这八个基本的功能要求我们分成了三组。第一组叫作全局统一的时空ID,作为一个“城市大脑”,一个全局的视觉系统来说,全局统一的时空ID非常关键。第二组特征把高效视频编码、高效特征编码和连接优化,这三个定义成第二组功能,把它叫作多层次视网膜表示,包括视频编码、特征编码、联合优化三大块。第三组特征,是把高效的模型可定义功能组合到一起。这三个组合在一起,就不会像以前的摄像头,一个硬件做进去之后改变不了什么了,按照这种数字视网膜设计出来的摄像头,可以与时俱进,可以进行一些新功能的更新。
编辑:zmh
关键字:
声明:网上天津登载此文出于传送更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供网友参考,如有侵权,请与本站客服联系。信息纠错: QQ:9528213;1482795735 E-MAIL:1482795735@qq.com