书 书 书
第4 4 卷 第6期
2 0 2 1 年6月 计 算 机 学 报
C H I N E S E J O U R N A LO F C O M P U T E R S V o l . 4 J 4N u n e 2 o 0 . 2 6 1
收稿日期:20191125;在线发布日期:20200513.本课题得到国家自然科学基金(62027804,61825101)、“中国人工智能2.0发展战略研 究”重大咨询研究项目中课题“跨媒体智能及其类脑计算融合”资助.李家宁,博士研究生,主要研究方向为时空点过程学习、机器学习与 神经形态视觉.Email:lijianing@pku.edu.cn.田永鸿(通信作者),博士,教授,中国计算机学会(CCF)高级会员,国家杰出青年科学基金 入选者,国家重点研发计划项目负责人,主要研究领域为多媒体大数据、机器学习与类脑计算.Email:yhtian@pku.edu.cn.
神经形态视觉传感器的研究进展及应用综述
李家宁
1)田永鸿
1),2)1)(北京大学计算机科学技术系 北京 100871)
2)(鹏城实验室 广东深圳 518055)
摘
要
神经形态视觉传感器具有高时域分辨率
、高动态范围
、低数据冗余和低功耗等优势
,近年来在自动驾驶
、无人机视觉导航
、工业检测及视觉监控等领域
(尤其在涉及高速运动和极端光照等条件下
)产生了巨大的应用前 景. 神经形态视觉是一个包含硬件
、软件
、生物神经模型等的视觉感知系统
,终极目标是模拟生物视觉感知结构与 机 理
,以硅视网膜达到
、扩展或超越人类智能. 作为神经形态工程的重要分支
,神经形态视觉是计算神经科学与计 算 机视觉领域的交叉学科与研究热点. 本文从生物视觉采样模型
、神经形态视觉传感器的采样模型及类型
、视觉信 号处理与特征表达
、视觉任务应用等视角进行了系统性地回顾与综述
,展望了该领域未来研究的技术挑战与可能 发展方向
,同时探讨了其对未来机器视觉和人工智能领域的潜在影响.
关键词
类脑智能
;人工智能
;硅视网膜
;仿生视觉
;神经形态工程
中图法分类号T P 1 8 犇 犗 犐
号1 0 . 1 1 8 9 7
/S P . J . 1 0 1 6 . 2 0 2 1 . 0 1 2 5 8
犚 犲 犮 犲 狀 狋 犃 犱 狏 犪 狀 犮 犲 狊 犻 狀 犖 犲 狌 狉 狅 犿 狅 狉 狆 犺 犻 犮 犞 犻 狊 犻 狅 狀 犛 犲 狀 狊 狅 狉 狊 : 犃 犛 狌 狉 狏 犲 狔
L I J i a N i n g
1)T I A NY o n g H o n g
1),2)1)(犇犲狆犪狉狋犿犲狀狋狅犳犆狅犿狆狌狋犲狉犛犮犻犲狀犮犲犪狀犱犜犲犮犺狀狅犾狅犵狔,犘犲犽犻狀犵犝狀犻狏犲狉狊犻狋狔,犅犲犻犼犻狀犵 100871)
2)(犘犲狀犵犆犺犲狀犵犔犪犫狅狉犪狋狅狉狔,犛犺犲狀狕犺犲狀,犌狌犪狀犵犱狅狀犵 518055)
犃 犫 狊 狋 狉 犪 犮 狋 R e c e n t l y , n e u r o m o r p h i c v i s i o n s e n s o r s a r e g a i n i n g m o r e a n d m o r e a t t e n t i o n i n c o m p u t e r v i s i o n o w n i n g t o t h e a d v a n t a g e so v e r c o n v e n t i o n a l c a m e r a s : h i g ht e m p o r a l r e s o l u t i o n , h i g h d y n a m i c r a n g e ( H D R ) , l o w r e d u n d a n c y a n d l o w p o w e r c o n s u m p t i o n . T h e a p p l i c a t i o n s o f w h i c h i n c l u d e a u t o n o m o u s d r i v i n g , d r o n e v i s u a l n a v i g a t i o n , i n d u s t r i a l i n s p e c t i o n , v i d e o s u r v e i l l a n c e , a n d t h e i n t e r n e t o f t h i n g s ( I o T ) , e s p e c i a l l y i n f a s tm o t i o n a n d c h a l l e n g i n g i l l u m i n a t i o n c o n d i t i o n s . N e u r o m o r p h i c v i s i o n i s a n i m p o r t a n t b r a n c h o f n e u r o m o r p h i c e n g i n e e r i n g , w h i c h u s e s t h e s i l i c o n r e t i n a t o m i m i c t h e s t r u c t u r e a n d m e c h a n i s m o f t h e b i o l o g i c a l v i s u a l s e n s i n g s y s t e m a n d a i m s t o a d d r e s s t h e s h o r t a g e s o f t r a d i t i o n a l f r a m e b a s e d c a m e r a s , a n d i t i s a l s o a r e s e a r c h h o t s p o t i n t h e f i e l d o f n e u r o s c i e n c e a n d c o m p u t e r v i s i o n . I n d e e d , n e u r o m o r p h i c v i s i o n s e n s o r s w o r k i n a c o m p l e t e l y d i f f e r e n t w a y a n d u s e w h a t i t c a l l e d “ s p i k e s ” t o c o m p u t e i n s t e a d o f f r a m e b y f r a m e b a s i s , i n w h i c h a s y n c h r o n o u s s p a t i a l t e m p o r a l s p i k e s a r e c o n t i n u o u s t i m e a n d s p a r s e p o i n t s e t s i n t h r e e
d i m e n s i o n a l s p a c e . T h i s n o v e l t e c h n o l o g y f u n d a m e n t a l l y c h a n g e s t h e s e n s i n g a n d c o m p u t i n g w a y s i n v i s i o n i n f o r m a t i o n , s o t h a t e x i s t i n g c o m p u t e r v i s i o n t e c h n i q u e s c a n n o t b e d i r e c t l y a p p l i e d t o a s y n c h r o n o u s s p i k e s f r o m n e u r o m o r p h i c c a m e r a s . N e v e r t h e l e s s , n e u r o m o r p h i c v i s i o n r e m a i n s a n a c t i v e a r e a o f r e s e a r c h i n a c a d e m i a a n d e f f o r t s a r e o n g o i n g t o o v e r c o m e s o m e s i g n i f i c a n t c h a l l e n g e s . I n t h i s p a p e r , t h e f i r s t p a r t p r e s e n t s a c o m p r e h e n s i v e o v e r v i e wo f t h e e m e r g i n g f i e l d o f n e u r o m o r p h i c v i s i o n c o n s i s t i n g o f t h e m i l l s t o n e s , t w o b i o i n s p i r e d v i s i o n s a m p l i n gm o d e l s ( i . e . , d y n a m i c v i s i o n s a m p l i n g m o d e l a n d i n t e g r a t i n g v i s i o n s a m p l i n g m o d e l ) , t h e t y p e s o f r e p r e s e n t a t i v e n e u r o
《 计
算
机
学
报
》
m o r p h i c s e n s o r s ( e . g . , D V S , A T I S , D A V I S , C e l e X , a n dV i d a r ) , a s y n c h r o n o u s e v e n t b a s e d s i g n a l p r o c e s s i n g , e v e n t b a s e d f e a t u r e r e p r e s e n t a t i o n a n d t h e t y p i c a l v i s i o n a p p l i c a t i o n s . S p e c i a l l y , w e i n t r o d u c e t h e f u n d a m e n t a l s o f n e u r o m o r p h i c s i g n a l p r o c e s s i n g m e t h o d s , s u c h a s a s y n c h r o n o u s s p a t i a l t e m p o r a l f i l t e r i n g , s p i k em e t r i c , a n ds p i k ec o d i n g . A c c o r d i n gt ot h e l i t e r a t u r e , w e s u m m a r i z e a n d r e p o r t e x p e r i m e n t a l r e s u l t s o n t h e k e y i s s u e , n a m e l y e v e n t b a s e d f e a t u r e r e p r e s e n t a t i o n , f r o mf o u r p e r s p e c t i v e s c o n s i s t i n g o f r a t e b a s e d i m a g e s , h a n d c r a f t e d f e a t u r e s , s p i k i n g n e u r a l n e t w o r k s ( S N N s ) , a n d d e e p n e u r a l n e t w o r k s ( D N N s ) . T h e s e c o n d p a r t n e x t h i g h l i g h t s t h e f o l l o w i n g c h a l l e n g e s : ( 1 ) B u i l d i n g s o m e l a r g e s c a l e n e u r o m o r p h i c v i s i o n d a t a s e t s f o r s u p e r v i s e d l e a r n i n g a p p r o a c h e s ; ( 2 ) D e f i n i n g a n e f f e c t i v e s p i k e m e t r i c f o r n e u r o m o r p h i c s i g n a l p r o c e s s i n g ; ( 3 ) L e a r n i n g a b e t t e r s p a t i a l t e m p o r a l r e p r e s e n t a t i o n f r o m a s y n c h r o n o u s s p i k e s ; ( 4 ) E x p l o r i n g h i g h s p e e d c o m p u t i n g p a r a d i g mv i a n e u r o m o r p h i c c h i p s ( e . g . , T r u e N o r t h , L o i h i , a n d S p i N N a k e r ) ;
( 5 ) D e v e l o p i n g t h e o p e n s o u r c e f r a m e w o r k a p p l i e d t o a s y n c h r o n o u s s p a t i a l t e m p o r a l s p i k e s . T h e l a s t p a r t f u r t h e rd i s c u s s e s t h em e a n i n g f u l f u t u r e r e s e a r c hd i r e c t i o n so nn e u r o m o r p h i cv i s i o n s e n s o r s . M o r e p r e c i s e l y , w e l o o k f o r w a r d t o n e wm a t e r i a l s t o e n h a n c e t h e s e n s i n g a b i l i t i e s i n c o m p u t a t i o n a l s p e e d , m e m o r y , c o m m u n i c a t i o no v e r h e a d , a n dp o w e r c o n s u m p t i o n . T h e n , w e a n a l y z e t h e p o t e n t i a l p r o f o u n d i n f l u e n c e t h a t c a n b e e x t e n d e d t o m u l t i b a n d s a m p l i n g r a t h e r t h a n o n l yv i s i b l es p e c t r u m , m u l t i t a s k l e a r n i n g j u s t l i k eh u m a nv i s i o ns y s t e m sa n dm u l t i s e n s o r f u s i o n . F i n a l l y , w e a n t i c i p a t e a n e u r o m o r p h i c c o m m u n i t y c o m b i n g n e u r o s c i e n c e a n d c o m p u t e r v i s i o n , w h i c h b e n e f i t s f r o me a c h o t h e r . W e b e l i e v e t h a t t h em o s t a l l u r i n g c h a r a c t e r i s t i c o f t h e c o m p r e h e n s i v e s u r v e y p a p e r i s t h a t i t a c t s a s a b r i d g e b e t w e e n n e u r o m o r p h i c c a m e r a s a n dm a n y c o m p u t e r v i s i o n t a s k s , t h u s b r i n i n g t h e m a i n s t r e a mo f c o m p u t e r v i s i o n r e s e a r c h t o l e v e r a g e t h e b e n e f i t s o f t h e s e n o v e l s e n s o r s a n d e n l a r g i n g t h e f o o t p r i n t o f n e u r o m o r p h i c v i s i o n t o w a r d s a b r o a d e r a r r a y o f a p p l i c a t i o n s .
犓 犲 狔 狑 狅 狉 犱 狊 b r a i n i n s p i r e d i n t e l l i g e n c e ; a r t i f i c i a l i n t e l l i g e n c e ; s i l i c o n r e t i n a ; b i o i n s p i r e d v i s i o n ; n e u r o m o r p h i c e n g i n e e r i n g
1 引 言
视觉是智慧生物和智能体的基本功能 , 负责理 解 与 感 知 外 部 世 界 . 人 类感知系统有超过8 0 %的信 息 量 来 自 视 觉 系 统 , 远 远 超 过 听 觉 系 统 、 触 觉 系 统 以 及其他感知系统之和
[1]. 如何设计强大的视觉感知 系 统 , 以 应 用 于 计 算 机 视 觉 技 术 和 人 工 智 能 技 术 , 一 直 是 科 学 界 和 工 业 界 的 研 究 热 点
[2].
视频即静止图像序列 , 是随着电影电视技术发 展 起 来 的 一 个 人造概念 , 利用了人类视觉系统的视 觉 暂 留现象
[3], 将两帧图像刷新的时间间隔小于 5 0 m s , 会 产 生 连 续 的 视 觉 感 受 . 近年来 , 传统视频在 视觉观赏角度取得了重大进展
[4], 但存在数据采样 冗 余 大 、 感 光 动 态 范 围 小 和 时 域 采 集 低 分 辨 率 , 在 高 速 运 动 场 景 易 产 生 运 动 模 糊 等 缺 点
[5]. 此 外 , 计算机 视 觉 一 直 朝 着 “ 视 频 摄像头+计算机+算法=机器 视 觉 ” 的 主 流 方 向
[67], 却 很 少 人 质 疑 用 图 像 序列 ( 视 频 ) 表 达 视 觉 信 息 的 合 理 性 , 更 少 人 质 疑 是 否 凭 借 该
计 算 机 视 觉 算 法 就 能 实 现 真 正 机 器 视 觉 .
人 类 视 觉 系 统 具 有 低 冗 余 、 低 功 耗 、 高 动 态 及 鲁 棒 性 强 等 优 势 , 可以高效地自适应处理动态与静态 信 息 , 且 具 有 极 强的小样本泛化能力和全面的复杂 场 景 感 知 能 力
[8]. 探 索 人 类 视 觉 系 统 的 奥 秘 , 并借鉴 人 类 视 觉 系 统 的 神 经 网 络 结 构 和 视 觉 信 息 采 样 加 工 处理机理
[9], 建立起一套新的视觉信息感知与处理 理 论 、 技术标准 、 芯片和应用工程系统 , 从而更好 模 拟 、 扩 展 或 超 越 人 类 视 觉 感 知 系 统 的 能 力 . 这 是 神 经 科 学与信息科学的交叉学科 , 称之为神经形态 视 觉
[1012].
神 经 形 态 视 觉 是 一 个 包 含 硬 件 开 发 , 软 件 支 撑 , 生 物 神 经 模 型 , 三 者 不 可 缺 一 的 视 觉 感 知 系 统 , 其 终 极 目 标 之 一 是 模拟生物视觉感知结构与机理 , 以硅 视 网 膜 ( S i l i c o nR e t i n a )
[13]来以期达到真正的机器 视 觉 .
神经形态视觉传感器的研制是建立在神经科 学 、 生 理 学 等 领 域对生物视网膜结构与功能机理的 研 究 基础上的 . 1 9 4 3年M c C u l l o c h和P i t t s
[14]提出
9 5 2 6期 李家宁等
:神经形态视觉传感器的研究进展及应用综述 1
《 计
算
机
学
报
》
一 种 具 有 计 算 能 力 的神经元模型 . 1 9 5 2年H o d g k i n 和H u x l e y
[15]对 神 经 元 建立动力学微分方程描述神 经 元 动 作 电 位 的产生与传递过程 , 该动作电位称为 脉 冲 ( S p i k e ) . 1 9 8 6年加州理工学院的博士研究生 M a h o w a l d 所 想 : “ 大脑是想象力的发源地 , 这让我 很 兴 奋 , 我 希 望 可以创造一个想象事物的芯片 ” , 那 时 与 导 师C a r v e r M e a d 教 授 开 始 萌 发 从 生 物 神 经 科 学和工程学角度研究立体视觉的问题 . 1 9 9 0年 M e a d 首次在 《 P r o c e e d i n g s o f t h e I E E E 》 上提出神 经 形 态 ( N e u r o m o r p h i c ) 的 概 念
[16], 利用大规模集成 电 路来模拟生物神经系统 . 1 9 9 1年M a h o w a l d和 M e a d
[13]在 《 S c i e n t i f i c A m e r i c a n 》 的 封 面 刊 登 了一只 运动的猫 , 标志了第一款硅视网膜的诞生 , 其模拟 了视网膜上视锥细胞 、 水平细胞以及双极细胞的 生物功能 , 正式点燃了神经形态视觉传感器这一 新兴领域. 1 9 9 3 年M a h o w a l d
[17]团队为了解决集成 电 路 的 稠 密 三 维连线的问题 , 提出了一种新型的集 成 电 路 通信协议 , 即地址事件协议 ( A d d r e s s E v e n t R e p r e s e n t a t i o n , A E R ) , 实现了事件的异步读出 . 2 0 0 3 年C u l u r c i e l l o 等 人
[18]设 计 了 一 种A E R方式的
积 分 发 放 的 脉 冲 模 型 , 将 像 素 光 强 编 码 为 频 率 或 脉 冲 间 隔 , 称为章鱼视网膜 ( O c t o p u sR e t i n a ) . 2 0 0 5年 D e l b r u c k 团 队
[19]研制出动态视觉传感器 ( D y n a m i c V i s i o nS e n s o r , D V S ) , 以时空异步稀疏的事件
( E v e n t ) 表 示 像 素 光 强 变 化 , 其 商 业 化 具 有 里 程 牌 的 意 义 . 然 而 , D V S无法捕捉自然场景的精细纹理图 像 . 2 0 0 8 年P o s h 等 人
[20]提出了一种基于异步视觉
的图像传感器 ( A s y n c h r o n o u sT i m e b a s e d I m a g e S e n s o r , A T I S ) , 引入了基于事件触发的光强测量
电路来重构变化处的像素灰度 . 2 0 1 3年D e l b r u c k 团 队
[21]开 发 了动态有源像素视觉传感器 ( D y n a m i c a n d A c t i v e p i x e l V i s i o n S e n s o r , D A V I S ) , 即 一种双
模 的 技 术 路 线 , 增加额外独立的传统图像采样电路 弥 补D V S纹理成像的缺陷 , 随后在2 0 1 7年又将其 扩 展为彩色D A V I S 3 4 6
[22]. 2 0 1 6年陈守顺教授团 队
[23]采 用 了 增 加 事 件 的 位宽 , 让事件携带像素光强 信 息 输出以恢复场景纹理 . 2 0 1 8年黄铁军教授团 队
[24]采用了章鱼视网膜
[18]的光强积分发放采样 原 理 , 将 脉 冲平面传输替换A E R方式以节约传输 带 宽 , 验 证 了 积 分型采样原理可高速重构场景纹理 细 节 , 即仿视网膜中央凹采样模型 ( F o v e a l i k e S a m p l i n gM o d e l , F S M ) , 也称V i d a r , 如图1所示.
神 经 形 态 视 觉传感器
[1923]模拟生物视觉感知系统 , 其 具 有 高 的 时 域 分 辨 率 、 数 据 冗 余 少 、 低 功 耗 和 高 动 态范围的优势 , 在自动驾驶
[2526]、 无人机视觉导 航
[2728]、 工 业检测
[29]及视频监控
[30]等机器视觉领 域 , 尤 其 在 涉 及 高速运动和极端光照场景下有着巨 大 的 市 场 潜 力 . 此外 , 神经形态视觉采样 、 处理及应 用 是 神 经 形 态 工 程 的 重要分支
[31], 为计算神经科学 的 脑 启 发 视 觉 模 型 提 供了验证
[32], 也是探索人类智 能 的 有 效 途 径 之一 . 目前神经形态视觉传感器的研 究 与 应 用 尚 处 于初期阶段 , 达到或超越人类视觉系 统 在 复 杂 交 互 环 境 下 的 感 知 能 力 还 需 要 大 量 的 探 索 研 究 .
图1 神经形态视觉传感器的发展历程
(蓝色框为里程碑事件
)本文从神经形态视觉的发展历程 、 生物视觉神 经 采 样 模 型 到 神 经 形 态 视 觉 传 感 器 的 采 样 机 理 及 类 型 、 神 经 视 觉 信 号处理与特征表达及视觉应用的视
角 进 行 系 统 性 回顾与综述 , 并展望了该领域未来研 究 的 重 大 挑 战 与可能发展方向 , 同时探讨了其对未 来 机 器 视 觉 和 人 工 智 能 领 域 的 潜 在 影 响 .
0 6 2
1 计 算 机 学 报 2 0 2 1 年
《 计
算
机
学
报
》
2 神经形态视觉模型与采样机理
神经形态视觉的技术路线总体上分为三个层 次 : 结 构 层次模仿视网膜 , 器件功能层次逼近视网 膜 , 智 能 层 次 超 越 视 网 膜 . 如 果 说 传 统 相 机 是 对 人 类 视 觉 系 统 的 模 拟 , 那么这种仿生物视网膜只是器件 功 能 层 次 的 初 级 模 拟 . 实 际 上 , 传 统 相 机 无 论 是 在 结 构 层 次 、 功 能 层 次 , 甚 至 智 能 层 次 都 远 不 及 人 类 视 网 膜 在 各 种 复 杂 环 境 的 感 知 能 力 .
近 年 来 , 各国 “ 脑计划 ”
[33]相继布局与展开 , 将 从 结 构 层 次 解 析类脑视觉列为重要内容之一支持 , 主 要 通 过神经科学家采用精细解析与先进探测技 术 , 获 取 视网膜基本单元的结构 、 功能及其网络连 接 , 为 器 件 功 能 层次逼近生物视觉感知系统提供理 论 支 撑 . 神 经 形 态视觉传感器正是从器件功能层次 仿 真 入 手 , 即 采 用光电纳米器件模拟生物视觉采样 模 型 与 信 息 处 理功能 , 在有限的物理空间和功耗条 件 下 构 造 出 具 有或超越生物视觉能力的感知系统 . 简 而 言 之 , 神 经 形态视觉传感器不用等完全理解视 网 膜 的 解 析 结 构与机理再进行模拟 , 而是借鉴结构 层 次 研 究 机 理 并绕过这个更为困难的问题 , 通过器 件 功 能 层 次 逼 近等仿真工程技术手段达到 、 扩展或 超 越 人 类 视 觉 感 知 系 统 的 能 力 .
目 前 , 神 经 形 态 视 觉 传 感 器 已 经 取 得 了 阶 段 性 成 果 , 有 模 拟 视 网 膜 外 周 感 知 运 动 功 能 的 差 分 型 视 觉 采 样 模型 , 如D V S
[19]、 A T I S
[20]、 D A V I S
[2122]、 C e l e X
[23]; 也 有 模 拟 视 网 膜 中 央 凹 感 知 精 细 纹 理 功 能 的 积 分 型 视 觉 采 样 模 型 , 如 章 鱼 视 网 膜
[18]、 V i d a r
[24]. 2 1 生物视网膜视觉模型
脊 椎 动 物 的 视 网 膜 是 在 6 亿 年 前 由 光 感 受 神 经 细 胞 演 变 而 成 , 位于后半眼球的多层复杂神经网状 结 构 , 如 图 2 所 示 . 灵 长 类 生 物 视 网 膜 大 致 可 以 分 为 三 层 结 构 : 光 感 受器层 、 内丛状层和外丛状层 , 其包 括 光 感 受 器 细 胞 、 双极细胞 、 水平细胞 、 神经节细胞 等 主 要 构 成
[34], 如图3所示. 光感受器细胞分为视 杆 细 胞 和 视 锥 细胞两类 , 负责将进入眼球的光信号 转 化 为 电 信 号 , 并 传 导 至 双 极 细 胞 和 水 平 细 胞 . 视 锥 细 胞 对 颜 色 敏 感 , 主 要 负 责 颜 色 的 识 别 , 通 常 在 场 景 光 照 较 强 条 件 下 工 作 ; 视 杆 细 胞 对 光 线 敏 感 , 能 够 感 受 弱 光 , 主 要 提 供 夜 晚 场 景 下 工 作 , 但 其 没 有 颜 色 辨 别 能 力 . 双 极 细 胞 接 受 光 感 受 器 的 信 号 输 入 , 其 根 据 感 受 野 的 区 域 不 同 分为O N型和O F F型 两 类 细 胞 , 分别感知光强增加和光强减弱 . 水平细胞与光感受
器 、 双 极 细 胞 横向互连 , 对光感受器输出的信号进行 亮 度 调 节 , 同 时也负责增强视觉对象边缘凸显轮廓 . 神 经 节 细 胞 负 责 接 受 双 极 细 胞 的 视 觉 信 号 输 入 , 并 以 时 空 脉 冲 信 号 ( S p a t i a l T e m p o r a l S p i k e ) 的形式做出 响 应 , 再 经视觉纤维传递至视觉皮层
[11]. 此外 , 视 网 膜 细 胞 有 多 条并行通路传递和处理视觉信号 , 有 极大的带宽传输与速度优势 , 其中M a g n o c e l l u l a r 和P a r v o c e l l u l a r 通路是最主要的两条信号通路
[35], 分 别 对 场 景 的 时 域 变 化 敏 感 和 空 间 结 构 敏 感 .
图2 视觉通路模型
图3 灵长类生物视网膜横截面示意图
[34]灵 长 类 生 物 视 网 膜 具 有 以 下 优 势
[11]:
( 1 ) 光 感受器的局部自适应增益控制 . 以记录 光 强 变 化 替 代 绝对光强来消除冗余 , 对光强感知有 高 动 态 范 围 ( H i g h D y n a m i c R a n g e , H D R ) ;
( 2 ) 视 杆细胞的空间带通滤波器 . 滤除低频信 息 的 视 觉 信 息 冗 余 和 高 频 信 息 的 噪 声 ;
( 3 ) O N和O F F类型. 神经节细胞及视网膜输 出 均 为O N和O F F脉冲信号编码 , 降 低 了 单 通 道的 脉 冲 发 放 频 率 ;
( 4 ) 感 光功能区 . 视网膜中央凹具有高的空间 分 辨 率 , 可 捕 捉 精 细 纹 理 ; 其 外 周 的 区 域 具 有 高 的 时 间 分 辨 率 , 捕 获 快 速 运 动 信 息 .
此 外 , 依 据N y q u i s t 采样定理传统相机需要传 输 超 过 2 0 G b / s 的 数 据 才 能匹配人类视觉的动态范 围 与 空 间 分 辨 率 , 而生物视觉以二进制脉冲信息表
1 6 2 6期 李家宁等
:神经形态视觉传感器的研究进展及应用综述 1
《 计
算
机
学
报
》
示 与编码 , 视觉神经仅需传输2 0 M b / s 数据至视觉 皮 层 , 数 据 量 少 将 近 1 0 0 0 倍 . 因此 , 视 网 膜 通 过 神 经 节 细 胞 将 光 强 信 息 转 换 为 时 空 脉 冲 阵 列 信 号 , 是 一 种 高 效 的 视觉信息表示与编码的方法
[11,36], 为神经形 态 视 觉 传 感 器 提 供 了 理 论 支 撑 与 功 能 层 次 的 启 发 .
生物视觉系统的信息获取 、 加工和处理主要发 生 在视网膜 、 外膝体与视皮层等处
[9], 如图2所示.
视 网 膜 是 接 收 视觉信息的第一站 ; 外膝体是将视网 膜 视 觉 信 号 传 输到初级视皮层的信息中转站 ; 视皮 层 是 视 觉 中 央 处 理 器 , 在 学 习 记 忆 、 思 维 语 言 以 及 知 觉 意识等高级视觉功能方面发挥至关重要的作 用
[37]. 视 皮 层 信 息 处 理 的 整个过程由两条并行通路 完 成 : V 1 、 V 2 和V 4 等组成腹侧通路主要处理物体 形 状 、 颜色等信息识别
[38], 也称w h a t 通路 ; V 1 、 V 2 和M T等组成的背侧通路主要处理空间位置 、 运动 等 信 息
[39], 也 称w h e r e 通路 . 因此 , 借鉴神经计算模 型 探 索 人 类 视 觉系统信息处理与分析机制 , 为计算 机 视 觉 与 人 工 智能技术提供借鉴思路与指导方向 , 进 一 步 启 发 类 脑视觉理论模型与计算方法 , 从而更 好 地 挖 掘 视 觉 特征信息 , 以逼近生物视觉的高效自 适 应 地 处 理 动 静信息 、 极强的小样本泛化能力与全 面 视 觉 分 析 能 力 .
2 2 差分型视觉采样及 犃 犈 犚 传输协议
神经元之间的复杂连接 , 脉冲信号在神经元之 间 的 传 递 是 异 步的 , 那么神经形态工程系统如何模 拟 这 一 特 性 呢 ?正是M a h o w a l d 团队
[17]提出新型的 通 信 协 议A E R方式 , 如图4所示 , 用于脉冲信号多 路 异 步 传 输 , 也 解决了大规模集成电路的三维稠密 连 线 难 题 , 即 “ 连 线 问 题 ” ( W i r i n g P r o b l e m ) .
图4 A E R方式示意图
A E R方式将传感器上每个像素视为独立的 , 脉 冲 信 号 以 事 件 ( E v e n t ) 的 形 式 传 输 , 并 按 事 件 产 生 时 间 先 后 顺 序 异 步传出 , 而不是类似传统相机那样以 固 定 频 率 的 图 像传出 , 解码电路依据地址及时间解 析 事 件 属 性 . A E R方式用于神经形态视觉传感器的 主 要 特 点
[40]在 于 :
( 1 ) 硅 视 网 膜像素输出事件模拟视网膜的神经 元 发 放 脉 冲 信 号 的 功 能 ;
( 2 ) 硅视网膜像素之间光强感知 、 脉冲产生及
传 输 均 异 步 ;
( 3 ) 硅视网膜输出异步事件稀疏时 , 事件表示 及 传 输 更 高 效 .
差分型视觉采样是神经形态视觉传感器感知 模 型的主流 , 如D V S
[19]、 A T I S
[20]、 D A V I S
[2122]、 C e l e X
[23], 其 对 灵 长 类 视 网 膜外周中光感受器 、 双极
细 胞 、 神 经 节 细 胞 三 层 结 构 的 抽 象 , 从 器 件 功 能 层 次 上 逼 近 或 超 越 视 网 膜 外 周 的 高 时 间 分 辨 率 感 知 的 能 力 , 如 图 5 ( a ) . 为 了 提 高 光 强 感 知 动 态 范 围 , D V S系 列 视 觉 传 感 器 多采用对数差分模型 , 即光电流与电 压 采 用 对 数 映射关系 , 如图5 ( b ) . 随着光强的相对 变 化 引 起 电压变化超过设定阈值 θ , 像素产生一个 脉 冲 信 号 , 如 图 5 ( c ) 所 示 , 其 原 理 如 下 :
Δ 犔 l n 犔 ( 狌 , 狋 ) - l n 犔 ( 狌 , 狋 - Δ 狋 ) = 狆 θ ( 1 )
图5 差分型视觉采样
[11]差 分 型 视觉传感器采用A E R方式 , 每个脉冲 信 号 采 用 事 件 形式表示 , 包括像素位置狌 = ( 狓 , 狔 ) 、 发 放 时 间 狋 和 事 件 极 性 狆 , 即 一 个四元组表示 ( 狓 , 狔 , 狋 , 狆 ) . 前 三 项 唯 一 确 定 时 空 域 的 位 置 , 最 后 一项极性
狆 = { - 1 , 1 } 分别表示光强的减弱O F F和光强增强 O N . 差 分 型 神 经形态视觉传感器与传统相机相比 ,
其 优 势 在 于 :
( 1 ) 输 出异步稀疏脉冲也不存在 “ 帧 ” 的概念 , 不 再 受 限 于 快 门 时 间 和 帧 率 、 感 知 光 强 的 变 化 , 可 消 除 静 态 不 变 的 视 觉 冗 余 ;
( 2 ) 采样具有高时间分辨率 , 适用于高速运动 视 觉 任 务 分 析 ;
( 3 ) 光电流与电压的对数映射关系 , 增强了高 低 光 照 的 感 知 能 力 进 而 提 升 动 态 范 围 .
2 3 积分型视觉采样
积 分 型 视 觉 采 样 在 功 能 上 是 对 灵 长 类 视 网 膜 中 央 凹 区 域 的 光 感 受 器 、 双 极 细 胞 、 神 经 节 细 胞 三 层 结 构 的抽象 , 如章鱼视网膜
[18]、 V i d a r
[24]. 积分型视觉 传 感 器 模 拟 了 神经元积分发放模型 , 将像素光强编 码 为 频 率或脉冲间隔
[18,24,3845], 具有对视觉场景的 精 细 纹 理 高速重构的能力
[44], 如图6所示. 光感受
2 6 2
1 计 算 机 学 报 2 0 2 1 年
《 计
算
机
学
报
》
器 将 光 信 号 转 化为电信号 , 积分器在光照条件 犐 ( 狋 ) 条 件 下 进 行 累 计 到 达 累 计 强 度犃 ( 狋 ) , 当该强度值超 过 脉 冲 发 放 阈 值 φ时 , 则 像 素 点 输 出 一 个 脉 冲 信 号 , 同 时 积 分 器 复 位 清 空 电 荷
[45], 其 原 理 如 下 :
犃 ( 狋 ) = ∫狋0犐 ( 狋 ) d 狋 φ ( 2 )
图6 积分型视觉采样
积分型视觉传感器的像素间彼此独立 , 章鱼视 网 膜
[18]采 用A E R方式将脉冲信号进行输出 , 尤其 在 光 强 充 足 时 积分型视觉传感器脉冲发放稠密 , 事 件 表 示 容 易 出 现 同 一 位 置 及 相 邻 位 置 多 次 请 求 脉 冲 输 出 , 会 出 现 数 据 传 输 的 巨 大 压 力 , 不 得 不 设 计 总 线 仲 裁 机 制 , 为 脉 冲 输 出 确 定 优 先 级 , 甚 至 会 因 带 宽 限 制 丢 失 脉冲信号 . V i d a r
[24]探索高速轮询的方式以 脉 冲 矩 阵 的 形 式传输每个采样时刻的脉冲发放 , 此 方 式 不 需 要 输 出脉冲的坐标与时间戳 , 只需将像素 是 否 发 放 标 记 为 “ 1 ” 和 “ 0 ” . 将脉冲平面轮询的方式 代 替A E R方式可以节约传输带宽.
3 神经形态视觉传感器类型
神 经 形 态 视 觉 传 感 器 借 鉴 生 物 视 觉 系 统 的 神 经 网 络 结 构 和 视 觉信息采样加工处理机理 , 以器件功 能 层 次 模拟 、 扩展或超越生物视觉感知系统 . 近年 来 , 一 大 批 代 表 性 的 神 经 形 态 视 觉 传 感 器 涌 现 , 是 人 类 在 探 索 仿 生 视觉技术的雏形 , 有模拟视网膜外周 感知运动功能的差分型视觉采样模型 , 如D V S
[19]、 A T I S
[20]、 D A V I S
[2122]、 C e l e X
[23]; 也有模拟视网膜 中 央 凹 感 知 精 细纹理功能的积分型视觉采样模型 , 如V i d a r
[24].
3 1 犇 犞 犛
D V S
[19]对 灵 长 类 视 网 膜 外周中的光感受器 、 双 极 细 胞 、 神 经 节 细 胞 三 层 结 构 的 功 能 抽 象 , 由 光 电 转 换 电 路 、 动态检测电路和比较器输出电路组成 , 如 图 5 所 示 . 光 电 转 换 电 路 采 用 对 数 光 强 感 知 模 型 , 提 高 了 光 强 感 知 范围 , 也更加接近生物视网膜的高动 态 适 应 的 能 力 . 动 态 检 测 电 路 采 用 差 分 型 采 样 模 型 ,
即 对 光 强 变 化 做 出 响 应 , 无 光 强 变 化 则 不 响 应 . 比 较 器 依 据 光 强 的 增 加 或 减 弱 输 出O N或O F F事件.
传统相机以固定帧率的采样方式 , 在高速场景 易 产 生 运 动 模糊 . 而D V S采用A E R异步传输方式 的 差 分 型 视 觉 采样模型 , 以异步时空脉冲信号表示 场 景 光 强 变 化 , 对场景的变化十分敏感且高时间分 辨 率 , 尤 其 适 用 于 高 速 运 动的视觉任务分析 , 如图7 所 示 . D V S 相比传统相机具有以下优势 : 高时间分 辨 率 ( 1 0
6H z ) 、 高 动 态 范 围 ( 1 2 0 d B ) 、 低 功耗 、 数据冗 余 少 和 时 延 低 .
图7 D V S 时空脉冲信号示意图
D e l b r u c k 团 队 和 I n i V a t i o n公司开发的第一款 商 用 的D V S 1 2 8
[19], 其空间分辨率为1 2 8 × 1 2 8 , 时 域 采 样 频 率 为 1 0
6H z , 动 态 范 围 为 1 2 0 d B , 在高速运 动 对 象 识 别 、 检 测 与 跟 踪广泛应用 . 此外 , D V S及其 衍 生的A T I S
[20]、 D A V I S
[2122]和C e l e X
[23]等神经形 态 视 觉 传 感 器 的研究及产品也备受关注 , 并逐渐被 应 用 于 自 动 驾 驶 、 无人机视觉导航和工业检测等涉 及 高速运动视觉任务 . 例如 , S a m s u n g公司开发了 的 空 间分辨率为6 4 0 × 4 8 0的D V S G 2
[46], 且像素 尺寸 为 9 μ m × 9 μ m . I B M公司采用了D V S 1 2 8 作 为 类 脑 芯 片T r u e N o r t h
[47]的视觉感知系统来进行快 速 手 势 识 别
[48].
D V S 利 用 差分视觉采样模型可以滤过静止不 变 或 变 化 较 弱 的视觉信息以降低数据冗余 , 同时具 有 感 知 高 速 运 动 的 优 势 . 然 而 , 这 种 优 势 带 来 了 视 觉 重 构 的 劣 势 , 即O N或O F F事件不携带绝对光强信 号 , 且 光 强 变 化 较 弱 时 无 脉 冲 信 号 发 放 , 从 而 无 法 重 构 精 细 化 纹 理 图 像 . 为 了 解 决D V S 面 向 视 觉 纹 理 可 视化 , 便衍生出A T I S
[20]、 D A V I S
[2122]和C e l e X
[23]等 神 经 形 态 视 觉 传 感 器 .
3 2 犃 犜 犐 犛
A T I S
[20]在D V S的基础上巧妙地引入了基于
3 6 2 6期 李家宁等
:神经形态视觉传感器的研究进展及应用综述 1
《 计
算
机
学
报
》
时 间 间隔的光强测量电路来实现图像重构 , 其思 路 是 每次D V S电路产生事件时 , 触发光强测量电 路进行工作 ; 光强测量设定了两个不同的参考电 压 , 通过对光强进行积分 , 并记录达到两个电压发 放的事件 ; 由于不同光强的条件下 , 电压变化相同 量所需的时间不同 , 通过建立光强与时间的映射 可以推断出光强大小 , 从而输出光强变化像素处 的光强信息 , 也称为脉冲宽度调制 ( P u l s eW i d t h M o d u l a t i o n , P W M )
[49]. 此外 , 为了解决静态区域没 有D V S 脉 冲 信 号 发放依然无法获得静态区域的视 觉 纹理信息 , A T I S引入了一套全局发放机制 , 即所 有 像 素 可 被 强制发放一次脉冲 , 这样在A T I S初始 工 作 时 可 获 得 一整幅图像作为背景 , 然后运动区域 不 断 产 生 脉 冲 进 而 不 断 地 触 发 光 强 测 量 电 路 获 得 运 动 区 域 的 灰 度 来 更 新 背 景 .
P o s c h团队和P r o p h e s e e公司研制的商用 A T I S
[49], 其 空 间 分 辨 率 为 3 0 4 × 2 4 0 , 时域采样频率 为 1 0
6H z , 动 态 范 围 为 1 4 3 d B , 在 涉 及 高 速视觉任务 存在着广泛应用 . 另外 , P r o p h e s s e e公司也受到了 I n t e l 公 司 1 5 0 0 万 美 金 的 项目资助 , 将A T I S应用于 自 动 驾驶汽车的视觉处理系统 . 随后 , B e n o s m a n
[50]团队进一步验证了在R G B三个通道的分别用 A T I S 采 样 脉 冲 信 号 再 融 合 彩 色 的 技 术 方 案 .
A T I S 在 面 向高速运动时 , 依然存在事件与灰 度 重 构 更 新 不 匹 配 的 情 况 , 其 原 因 有 以 下 两 点 : 脉 冲 发 放 后 触 发 光 强测量电路 , 其测量结果是脉冲发放 后 一 段 时 间 的 平 均 光 强 , 造 成 运 动 不 匹 配 ; 场 景 稍 微 变 化 未 引 起 脉 冲 发 放 , 从 而 像 素 未 及 时 更 新 , 随 着 时 间 推 移 会 造 成 纹 理 差 异 明 显 .
3 3 犇 犃 犞 犐 犛
D A V I S
[2122]是 一种最直观且有效的融合技术 思 路 , 将D V S 和 传 统 相 机 二 者 结 合 , 在D V S 基 础 上 额 外引入有源像素传感器 ( A c t i v e P i x e l S e n s o r , A P S ) , 用 于 视 觉 场 景 纹 理 成 像 .
D e l b r u c k 团 队 和 I n i V a t i o n公司在空间分辨率 为 2 4 0 × 1 8 0 的D A V I S 2 4 0
[21]的基础上进一步推出 了彩色D A V I S 3 4 6
[22], 其空间分辨率达到3 4 6 × 2 6 0 , 时 域 采 样 频 率 为 1 0
6H z , 动态范围为1 2 0 d B , 并 将D V S 所 产生的事件坐标的空间位置 ( 狓 , 狔 ) 携带 R G B彩色信息 , 但是A P S电路采样速度远不如 D V S 电 路 , A P S 模式的帧率为5 0 F P S , 动态范围为 5 6 . 7 d B , 两 套 采 样 电 路 产 生的图像无法做到精准同 步 , 尤 其 在 高 速运动场景 , 且A P S图像在高速运动 场 景 存 在 运 动 模 糊 .
当 前 , D A V I S是 神 经 形 态 视 觉 传 感 器 商 用 产 品 、 工
业 应 用 及学术研究的主流 , 源于D V S系列性传感器
( D V S 1 2 8 、 D A V I S 2 4 0 、 D A V I S 3 4 6 和彩色D A V I S 3 4 6 ) 的 学 术 研 究 推 广 , 相 关 视 觉 任 务 数 据 集 的 公 开 、 代 码 及 软 件 的 开 源 等 营 造 的 良 好 生 态 环 境 . 因 此 , 在 本 文 介 绍 脉 冲 信 号 处理与特征表达 、 视觉应用等均以差 分 型 视 觉 采 样 模 型 的D V S 系 列 传 感 器 为 主 . 3 4 犆 犲 犾 犲 犡
C e l e X
[23]在 考 虑 到A T I S的光强测量电路存在 滞 后 , 在D V S 电 路 输 出 脉冲事件的地址 ( 狓 , 狔 ) 和发 放 时间 狋的同时 , 也及时地将该像素的光强信息犐 输 出 , 即C e l e X输出事件可用四元组 ( 狓 , 狔 , 狋 , 犐 ) 表 示 . C e l e X的设计思路主要包括三个部分
[51]: ( 1 ) 引 入 缓 冲 和 读 出 开 关 电 路 直 接 将 对 数 光 感 受 器 的 电 路 转 换 为 光 强 信息输出 ; ( 2 ) 采用全局控制信号输出 一 整 帧 图 像 , 便 于初始工作时可获得整幅图像作为 背 景 和 及 时 全局更新 ; ( 3 ) 专门设计列模拟读出电 路 输 出 缓 冲器的光强值 . C e l e X巧妙地将脉冲事件 的 位 宽 设 计 为 9 b i t , 既 保 证 了 脉 冲 本 身 的 语 义 信 息 , 又 携 带 了 一 定 量 的 光 强 信 息 .
陈 守 顺 教 授团队和C e l e P i x e l 公司最新发布的 第 五 代C e l e X V
[52], 其空间分辨率达为1 2 8 0 × 8 0 0 基 本 达 到 了 传 统相机的水平 , 同时时域最大输出采 样 频率为1 6 0 M H z , 动态范围为1 2 0 d B , 该产品的 高空间分辨率 、 高时域分辨率及高动态范围的
“ 三 高 ” 优势引起了当前神经形态工程领域的关注 . 此 外 , C e l e P i x e l 公司也受到了B a i d u公司4 0 0 0万 的 项 目 资 助 , 采用C e l e X V用于汽车自动驾驶辅助 系 统 , 利 用 其 优 势 对 驾 驶 异 常 行 为 进 行 实 时 监 测 .
C e l e X的脉冲事件采用9 b i t 信息输出 , 在剧烈 运 动 场 景 或 高 速运动场景时 , 面临数据量大而无法 及 时 传 输 、 甚 至 丢弃部分脉冲数据以致采样信号无 法 保 真 、 同 时 对 轻微光照也无法做出响应及时更新 等 缺 点 . 但 是 , C e l e X的 “ 三 高 ” 性能及其光流信息的 输 出 等 优 势 , 在 自动驾驶 、 无人机视觉导航 、 工业检 测 和 视 频 监 控 等 涉 及 高 速 运 动 视 觉 任 务 有 着 巨 大 的 应 用 潜 力 .
3 5 犞 犻 犱 犪 狉
V i d a r
[24]对灵长类视网膜中央凹的光感受器 、 双 极 细 胞 、 神 经 节 细 胞 三 层 结 构 的 功 能 抽 象 , 采 用 了 积 分 型 视 觉 采 样模型 , 将像素光强编码为频率或脉 冲 间 隔
[18,24,3845], 具 有 对视觉场景的精细纹理高速 重 构 的 能 力
[44]. V i d a r 由 光 电 转 换 电 路 、 积分器电路 和 比 较器输出电路组成 , 如图6 ( a ) 所示 . 光感受器 将 光 信 号 转 换 为电信号 , 积分器将电信号进行积分
4 6 2
1 计 算 机 学 报 2 0 2 1 年
《 计
算
机
学
报
》
累 计 , 比 较 器 将 该累计值与脉冲发放阈值比较判断 输 出 脉 冲 信 号 , 同 时 积 分 器 被 复 位 , 也 称 为 脉 冲 频 率 调制 ( P u l s e F r e q u e n c yM o d u l a t i o n , P F M )
[18]. V i d a r 像 素 间 的 脉 冲 信号输出彼此独立 , 单个像素的脉冲 信 号 按 照 时 间 先 后顺序排成 “ 脉冲序列 ” , 所有像素 按 照 空 间 位 置 相 互关系构成 “ 脉冲阵列 ” , 脉冲阵列 的 每 个 时 刻 的 截 面 称 为 “ 脉 冲 平 面 ” , 脉 冲 信 号 以 “ 1 ” 表 示 , 没 有 脉 冲 信 号 以 “ 0 ” 表 示 , 如 图 8 所 示 .
图8 V i d a r 时空脉冲信号示意图
黄 铁 军 教授团队研制的第一款V i d a r
[24], 其空 间 分 辨 率 为4 0 0 × 2 5 0 , 时域采样频率为4 × 1 0
4H z , 每 秒输出 4 7 6 . 3 M的数据量 , 并可依据脉冲发放的
时 空 特 性 来 对 静 态 场 景 或 高 速 运 动 场 景 进 行 精 细 化 纹 理 重 构 , 如 采 用滑动窗口累计法或脉冲间隔映射 的 方 法
[44]. 此 外 , V i d a r 可 自 由 设 定 时 长的脉冲信号 进 行 影 像 重 构 , 在成像的动态的动态范围上具有灵 活 性 . 该 积 分 型 视觉采样芯片能对高速运动进行精 细 化 纹 理 重 构 , 可 用 于 高 速 运 动 场 景 的 物 体 检 测 、 跟 踪 和 识 别 , 在 自 动驾驶 、 无人机视觉导航 、 机器视觉 等 涉 及 高 速 视 觉 任 务 领 域 的 应 用 潜 力 巨 大 .
V i d a r 采 用 积分型视觉采样模型 , 将光强信号 进 行 频 率 或 脉 冲间隔编码 , 本质是将光强信息变换 为 频 率 编码 , 相比面向运动感知的D V S系列传感 器 , 更加友好地面向视觉精细重构的优势 . 然而 , V i d a r 无论在静态场景还是运动区域都会产生脉
冲 , 采 样 上 存 在 巨 大 的 数 据 冗 余 , 以 及 如 何 控 制 脉 冲 发 放 阈 值 以 便 自 适 应 感 知 不 同 光 照 场 景 和 控 制 数 据 量 是 积 分 视 觉 采 样 需 要 亟 待 解 决 的 问 题 .
3 6 仿视网膜视觉传感器性能对比
近 期 , 大 量 的 神 经 形 态 视 觉 传 感 器 涌 现 并 商 业 化 应 用 , 有 模 拟 视 网 膜 外 周 感 知 运 动 功 能 的 差 分 型 视 觉 采样模型 , 如D V S 1 2 8
[19]、 A T I S
[20]、 D A V I S 3 4 6
[2122]、 D V S G 2
[46]、 C e l e X V
[23]; 也 有 模 拟 视 网膜中央凹功
能 的 积 分 型 视 觉 采 样 模 型 , 如V i d a r
[24], 具体的各性 能 参 数 的 对 比 如 表 1 所 示 .
表
1
神经形态视觉传感器性能参数对比 传感器类型 时间 空间分辨率 最大采样率/Hz 动态
范围/dB功耗/
mW 芯片
大小/mm2 像元
尺寸/μm2 填充
因子/% 延迟/μs 电源电压/V 纹理 DVS128[19] 2008128×128 1×106 120 23 6.3×6 40×40 8.1 12 3.3 图像否 ATIS[20] 2011304×240 1×106 143 50~175 9.9×8.2 30×30 20 3 1.8&3.3灰度 DAVIS346[22]2017346×2601.2×107 120 10~170 8×6 18.5×18.5 22 20 1.8&3.3彩色 DVSG2[43] 2017640×480 3×109 90 27~50 8×5.8 9×9 100 65~4101.2&2.8 否 CeleXV[23] 20181280×8001.6×108 120 390~47014.3×11.6 9.8×9.8 9 1 1.2&3.3灰度 Vidar[24] 2018400×250 4×104 - 370 10×6 20×20 13.75 25 1.5&3.3灰度