西南交通大学在职研究生信息科学与技术学院、虚拟现实与多媒体团队的吴晓教授及其指导的博士生,在继去年国际多媒体学术会议(ACM International Conference on Multimedia, 简称ACM MM)发表为口头报告之后,今年,吴晓教授团队又相继在国际顶级一流学术会议:国际多媒体学术会议(ACM MM)和国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,简称CVPR)分别发表一篇和两篇国际顶尖论文。这4篇论文均以西南交通大学为第一署名单位。这也是吴晓教授团队近两年在人工智能前沿领域发表的第10篇国际顶级期刊和顶级会议论文。
国际多媒体学术会议(ACM MM)和国际计算机视觉与模式识别会议(CVPR)是计算机学科普遍认可的多媒体领域和计算机视觉领域的顶级国际会议,被中国计算机学会(CCF)列为A类会议,在西南交通大学期刊分级目录中列为A++级别。CCF分类标准中,A类会议是国际上极少数的顶级学术会议,分级标准鼓励我国学者去突破这一级别的顶级会议。在教育部第四次全国性计算机一级学科评估中,CCF A类会议论文被作为唯一单列的论文发表指标。目前国内外从事计算机视觉和图像处理相关领域的著名学者都以在这几大顶级会议上发表论文为荣,其影响力远胜于一般SCI期刊论文。今年,ACM MM口头报告录用率仅为7.5%,全球675个投稿仅50篇论文被录用为口头报告;墙报(Poster)录用率约为20%。CVPR每年的论文录用率一般在20%左右。总投稿量达4000多篇,最终录用约700篇,录取率不到20%。此次吴晓教授课题组在ACM MM 和CVPR 会议上所取得的成果,将最前沿的深度学习算法应用于电子商务以及时尚搜索领域,极具学术和商业价值,实现了西南交通大学计算机学科在顶级模式识别与人工智能会议上的又一突破。这也是信息科学与技术学院科研和学科建设的重要成果之一,同时标志着西南交通大学计算机领域的科研水平取得了长足的进步。
以博士生何俊彦为第一作者,与吴晓教授以及复旦大学姜育刚教授共同完成的研究论文《Sketch Recognition with Deep Visual-Sequential Fusion Model》,被ACM MM录用为口头报告。论文提出了一种基于深度学习的草图识别方法,该方法从草图绘制过程出发,探索了笔画的视觉特征以及时序模式的融合,利用二者之间隐含的互补性提高草图识别准确率,使得基于草图的跨域检索效果得到大幅度的提升,具有较高的实用价值。