欢迎来到人工智能与机器人产业平台!
客服热线
发起求购
科学家开发的图像识别算法的工作速度比类比快40% | 图像识别
时间:2021-05-25 来源:章鱼通


HSE大学的一位科学家开发了一种图像识别算法,其工作速度比类比快40% 。它可以加快基于视频的图像识别系统的实时处理。研究结果已发表在《信息科学》杂志上。

  

卷积神经网络(CNNS)包括一系列卷积层,在计算机视觉中被广泛使用。网络中的每一层都有输入和输出。图像的数字描述进入第一层的输入,并在输出时转换为不同的一组数字。结果进入下一层的输入,依此类推,直到图像中的对象的类标签在最后一层被预测。例如,该类可以是一个人、猫或椅子。为此, CNN接受了具有已知类标签的一组图像的培训。数据集中每个类的图像的数量和变异性越大,经过培训的网络将越准确。


如果训练集中只有几个例子,则使用神经网络的额外训练(微调)。 CNN接受训练,以识别来自类似数据集的图像,从而解决最初的问题。例如,当神经网络学会识别人脸或他们的属性(情绪、性别、年龄)时,它就会接受初步训练,以从他们的照片中识别名人。然后,对现有的小数据集进行微调,以识别家庭或亲属在家庭视频监视系统中的脸。 CNN中的层越深(数量),它就越准确地预测图像中的对象类型。然而,如果层的数量增加,就需要更多的时间来识别对象。


这项研究的作者, Nizhny Novgorod的HSE校园的Andrey Savchenko教授,能够加快一个预先训练的具有任意结构的卷积神经网络的工作,该网络由他实验中的90 - 780层组成。结果,识别速度提高了高达40% ,同时控制了不超过0.5 - 1%的准确性损失。科学家依赖序列分析和多次比较(多假设测试)等统计方法。


"图像识别问题的决定由分类器做出-一种特殊的数学算法,它接收一系列数字(图像的特征/嵌入)作为输入,并输出关于图像属于哪类的预测。分类器可以通过向其提供神经网络任何层的输出来应用。要识别'简单"图像,分类器只需要分析神经网络第一层的数据(输出)。


如果我们对所做决定的可靠性有信心,就没有必要浪费更多的时间。对于"复杂"图片,第一层显然是不够的-你需要转到下一层。因此,分类器被添加到神经网络中的几个中间层中。根据输入图像的复杂性,提出的算法决定是继续识别还是完成它。由于控制这种过程中的错误很重要,我应用了多次比较的理论:我介绍了许多假设,在这些假设中间层停止,并顺序测试了这些假设, " Savchenko教授解释说。


如果第一个分类器已经产生了一个被多个假设测试程序认为可靠的决定,该算法将停止。如果该决定被宣布为不可靠,神经网络中的计算将继续到中间层,并重复进行可靠性检查。


正如科学家指出的那样,对于神经网络的最后一层的输出获得了最准确的决定。早期网络输出的分类要快得多,这意味着需要同时培训所有分类器,以加快识别速度,同时控制准确性的损失。例如,由于较早停止而导致的错误不超过1% 。


"高精度对于图像识别总是很重要的。例如,如果在人脸识别系统中做出了错误的决定,那么要么外面的人可以访问机密信息,要么反过来,用户将多次被拒绝访问,因为神经网络无法正确识别他。有时可以牺牲速度,但这很重要,例如,在视频监控系统中,实时决策是非常可取的,即每个帧不超过20 - 30毫秒。为了在这里和现在识别视频帧中的一个对象,在不失去准确性的情况下迅速采取行动是非常重要的, " Savchenko教授说。


赞(0)
标签
相关动态
·
秀技能、展风采!2022年广东省人工智能工程应用职业技能竞赛开始报名啦!
·
天价芯片速成班能上吗?
·
自动驾驶汽车撞人,撞了白撞?
·
学了人工智能,饭碗就稳了?
·
关于开展广东省第十一届“省长杯”工业设计大赛新一代电子信息类专项赛作品征集的通知
·
用光远程遥控大脑?科技树点亮到奇怪的方向?
·
搞农业,一点也不土!
·
深度学习“撞到南墙”了?