随着人工智能兴起,利用“深度学习”技术进行计算机视觉工作已是很普遍的应用,如图像分类、对象检测等。通常只需将单张图像送入训练好的模型中进行推理即可得到输出结果,但当遇到视频文件或串流视频时,逐格(by Frame)图像分析就变得很没效率,因为帧间时间差距过短(通常为1/30~1/60秒),场景中的对象位移量(变形量)可能过小,导致帧间得到几乎相同的计算结果(对象位置、尺寸及分类),浪费计算资源,也让系统看起来反应过慢。 为了使视频文件及串流视频在分析上能加快反应,Intel OpenVINO Too