2025年04月22日 星期二
“南翔”之争是件好事 观其“颜”辨其“声”识其“行” 防御黑格比  上海拉响蓝色预警
第2版:要闻 2020-08-04

观其“颜”辨其“声”识其“行”

上海依图科技在全球AI技术赛道再下一城——“行为识别”拔头筹

本报讯(记者 郜阳)继蝉联全球权威人脸识别竞赛冠军、先后刷新国际声纹识别权威竞赛纪录、行人重识别等权威数据集之后,上海“土生土长”的人工智能企业依图科技在全球AI技术赛道再下一城——在由全球多媒体领域顶级学会ACM MM主办的“大规模复杂场景人体视频解析”挑战赛中,拿下“Track-4:行为识别”的第一名。

ACM是全球最大的计算机领域专业性学术组织,所评选的图灵奖被公认为世界计算机领域的诺贝尔奖。而ACM MM是全球多媒体领域的顶级会议,属中国计算机学会指定的A类国际会议。在这次挑战赛中,包括腾讯、大华科技、中山大学等上百支参赛队伍参与了超过56000个复杂事件下的人体行为(包括排队、打架、俯身、同行、跑动、滞留等)解析。视频中行为识别是这次比赛中的重点项目,目的是考察算法在复杂场景下对行为的解析能力。

行为识别难度几何

如果把人脸识别比作医院“普外门诊”的话,行为识别尤其是人类的行为识别,其复杂度和识别难度不亚于“心血管内科+神经内科”。

场景复杂多变、动作差异化大、需要捕捉连续动作和长时间动作,这对行为识别和分析都是巨大的挑战,也就需要算法对行为本身有更精准的分析推理能力,甚至还需要学会通过既定的场景推算未曾见过的场景。

这次挑战赛中,依图科技的算法指标将以往学术界的基准算法提升了近3倍。与曾经举办过多次的国际竞赛不同,这次挑战赛还是第一届,参赛队伍在赛前无法了解要求识别的类别、数据集的大小和识别的具体标准,要在短短一个多月时间内,设计出最优的算法,并在众多实力强劲的队伍中摘得第一,难度极高。

记者获悉,依图此次创新性地将算法与场景深度结合。一方面从视频中自动提取到了准确、丰富的场景信息,结合行人检测、行人重识别算法,全面构建了人与人、人与场景、人与物之间在视频中的关系;另一方面,借助多年来的算法积淀和对行业场景的理解,对比赛中要求特定的14类任务进行了深度算法优化。

AI技术加速落地

此前,依图科技自主研发的全球首款云端视觉智能芯片“求索”,开启了算法设计与芯片设计相结合的时代。集合高性能AI算法和芯片耦合设计优化的芯片平台,结合世界领先的行为识别算法的依图,将更有利于赋能智能城市、安全生产、智能商业等领域,打造新一代AI基础设施。

近日,依图科技还通过了由英国标准协会颁发的ISO/IEC 27701:2019隐私信息管理体系国际认证,成为国内首家通过认证的AI公司。这是全球首个针对隐私信息管理的国际标准,也被公认为最严格、权威的隐私信息管理标准。获得这一认证,充分体现了依图科技对数据隐私保护的重视和有效实践。

新基建趋势下,各行各业加快数字化,提升各类工作的智能水平成为刚需。作为目前国内具有提供超大规模、复杂环境下亿级规模城市的智能化运营管理技术能力的人工智能公司,依图科技在硬核的技术实力和隐私保障上的不断努力,已形成一套“组合拳”,未来将加速解锁更多的智能应用。

放大

缩小

上一版

下一版

下载

读报纸首页