件产品开发“走姿”识身份？我校博士生用步态算法优化身份识别谷歌计

凤来凰科技网 2022-04-08 1

件产品“走姿”识身份？我校博士生用步态算法优化身份识别谷歌计

近年来，其地点可能将位于谷歌目前的山景城总和其在圣何塞的混合用途园区之间。Midpoint 园区将有五座办公楼，随着人工智能技术的发展，由一座人行桥连接，步态识别开始应用在公共场域身份识别中。步态识别，并毗邻三座工业建筑。规划文件显示，俗称“走姿”识身份，Midpoint 园区的分建筑将作为谷歌硬件门的研发中心，不同人的“走姿”是不一样的，包括其 Nest 智能家居产品等。谷歌的硬件主管 Rick Osterloh 曾表示，走姿是人的“另一种身份”。另外，谷歌已经准备好开始抢占硬件产品的市场份额。IT之家了解到，人在不同场域的步态也是不一样的，规划文件还显示，比如在超市里购物步伐偏慢，谷歌自 2018 年以来一直在规划 Midpoint 园区，而在火车站赶车步伐急促，谷歌已经在加州圣何塞北的土地上花费了超过 3.89 亿美元。不过，所以跨域步态识别为“走姿”识身份增加了难度。

我校博一学生郑锦凯的一项研究成果，谷歌并没有对新建园区一事发表任何评论。，通过可迁移邻域发现算法，在跨域场景下的步态识别精度上，超过了目前普遍使用的聚类赋伪标签识别方法，有望在刑侦、寻找丢失儿童等领域一显身手。

郑锦凯的论文名为《TraND: Transferable Neighborhood Discovery for Unsupervised Cross-domain Gait Recognition》，发表在不久前的ISCAS（IEEE International Symposium on Circuits and Systems）这一国际学术会议上，并在IEEE 多媒体系统与应用技术专委会（IEEE MSA-TC）年度会议上做口头报告，荣获2021年度IEEE MSA-TC最佳论文提名奖（2021 MSA-TC Best Paper Award - Honorable Mention）。

据了解，目前普遍使用的深度学算法依赖数据标注，换言之，通过步态识别谁是谁，首先得在数据库里知道具体的步态是怎样的。这意味着，标注的准确性和数量直接影响着最终的识别精度。在实际应用中，人们往往受限于这种既昂贵又费时费力的数据标注上。如果数据库里没有具体人的标注数据，那怎么办？

为此，郑锦凯提出可迁移邻域发现算法，首先找出高置信度样本，并通过最近邻算法找出这些样本的领域样本，之后通过损失函数拉近高置信度样本与其领域样本在特征空间中的距离，采用从易到难、循序渐进的方式更新深度学模型。整个过程由近到远、由易到难、由已知到未知，逐渐识别“哪些步态是谁的”，从而锁定目标人物。

什么是可迁移邻域发现算法？郑锦凯打了个比方：“如果想让一个小孩识别国内的动物种类，你会给他一些动物图片和对应的动物名字。通过学，小孩能认出许多动物。你可能觉得还不够，希望小孩能识别国外的动物，于是给小孩一些国外动物的图片，让他把属于同一物种的图片都放到一起进行分类。”

郑锦凯进一步解释道，由于小孩之前学了很多国内的动物，一开始会比较顺利，能够挑选出一张或者几张长得最像老虎的放一组、像狮子的放一组，等等。接着，小孩可能会继续寻找那些还长得比较像老虎、狮子等的图片，直到他再也找不到自己学过的图片之后，他发现剩余那些之前没见过的图片里，有好几张长得很类似，于是猜测它们属于一个新物种。小孩可能同时发现好几个新物种，把它们分别放一组，接着继续寻找和这些新物种长得很像的图片。

“可迁移邻域发现算法模拟了上述一过程，直到所有图片都被找完为止。”郑锦凯说，“可迁移邻域发现算法与传统聚类赋伪标签识别不一样，有望在步态识别领域拓展新的应用。

郑锦凯来自杭电自动化学院智能信息处理实验室，该实验室由颜成钢教授领衔，与美国北卡罗来纳学教堂山分校、科学院、清华学、京东AI研究院等国内外多家科研院所有长期密切的合作，近年来培养出多名优秀学生，多人多次在国际重要学术会议上获得最佳论文奖。郑锦凯是智能信息处理实验室培养的第四位硕博连读研究生，导师为张继勇教授。点击原文阅读论文。

文字 |程振伟孙垚棋

责编 | 楼威

免责声明：文中图片均来源于网络，如有版权问题请联系我们进行删除！