科教动态

当前位置:首页  科教动态
当前位置:首页  科教动态

我校教师研究成果刊登顶刊《IEEE Transactions on Multimedia》

发布时间:2025-11-12来源:新视野浏览次数:14

日前,我校计算机工程学院人工智能及应用团队陈文河博士在多媒体技术领域国际著名期刊《IEEE Transactions on Multimedia》(中科院一区TOP期刊,影响因子9.7)上发表题为“Privileged Information-Guided Multitask Mutualistic Transformer for Gaze Prediction”的研究论文,以江苏理工学院为第一单位,以陈文河博士为第一作者。

预测人类注视点对于理解其意图至关重要。作为计算机视觉领域的研究热点,凝视预测已经从单一人物的注视点预测发展到对多人位置及其注视目标的联合推理。然而,现有方法大多将人体检测与凝视预测分离处理,导致信息割裂、效果受限。受到生态学中“互利共生”概念的启发,提出了一种新颖的多任务互利Transformer(MMTR)。该方法通过在不同分支间建立信息通信机制,有效捕捉个体与目标之间的成对依赖关系,实现了更全面、可解释的群体注视目标分析。实验结果表明,MMTR 通过特权信息引导任务间的交互,成功解决了人体检测与凝视预测之间的信息不对称问题,并在两个权威基准数据集 GazeFollowing和VideoAttentionTarget上大幅超越现有最先进方法,展示了强大的性能与应用潜力。论文DOI:10.1109/TMM.2025.359903。(图文/陈文河、吴旭;审核/由从哲;编辑/张姚)


上一篇:下一篇: