英特尔在最近在电气和电子工程师协会的第 12 届国际人类系统交互会议上发表的一项研究中,试图研究了在可见光数据上训练的模型的性能—该模型是在热图像上进行的训练。
正如研究人员在描述其工作的论文中所指出的那样,在医疗需要或特别需要保护隐私的环境中,热成像通常用于代替 RGB 相机数据。那是因为它可以遮挡个人识别的细节,例如眼睛的颜色和下颌线等。该团队利用了两个面部热图像数据集,其中第一个是使用 Flir ThermaCam SC3000 红外热像仪创建的,它包含 766 张来自 19 名男性和 21 名女性的 40 名志愿者的图像,他们被要求坐下来看着相机两分钟。至于第二个数据集(来自俄克拉荷马州立大学视觉计算和图像处理实验室的 IRIS 数据集)包含在 30 个人的帮助下收集的 4190 张图像,其中许多人动了动头并使用了不同的面部表情。
研究人员首先使用机器学习模型将图像裁剪到只包含人脸的区域。然后,他们使用另一个模型从图像中提取面部特征,并将其用数字表示为向量(对应于特定特征的值集)。最后,他们使用了第三个在可见光图像上训练的模型来验证该模型是否可以应用于热图像。
在实验过程中,研究人员比较了两种类型的面部特征向量:一种识别给定图像中所描述的人,另一种基于人物轮廓与输入图像的相似性。他们发现,对可见光图像数据训练的模型可以很好地将其推广到热图像,成功地提取了人脸特征,识别志愿者,SC3000-DB的准确率为99.5%,虹膜的准确率为82.14%。
该团队希望将他们的研究扩展到其他各种场景中收集的数据,比如当受试者的头水平或垂直转动时。研究人员写道,许多有前途的视觉处理应用,如非接触式生命体征估计和智能家居监测,可能涉及私人或敏感数据,如人体健康的生物特征信息。热成像可以提供有用的数据,同时也可以隐藏个人身份,因此被用于许多应用。
