11月18日下午(伟德bv1946官网长清湖校区报告厅)
14:00-15:00报告专家:周琳娜(国际关系学院 教授)
报告题目:大数据行为分析与图像内容取证
报告摘要:大数据行为分析方法作为一种新的科学范式,提供数据驱动下的以计算为特征的新视角、新方法与新技术,该报告从追踪、溯源、取证的角度,以信息隐藏中隐写与隐写分析取证的对抗博弈为例,论述了大数据环境下数字隐写对抗从内容隐写分析取证对抗到行为身份隐藏取证对抗的发展过程和发展趋势。
15:00-16:00报告专家:韩亚洪(天津大学 教授)
报告题目:面向跨媒体推理的视频问答方法
报告摘要:作为人工智能领域的挑战性问题,视觉问答(Visual QA)在近期引起了广泛关注。视频数据由于增加了时间维度而更加复杂,如何对视频中的复杂时序关联进行建模并发现事件线索、以及如何利用多源异构上下文信息进行跨媒体问答推理等成为关键科学问题。我们提出新的层叠记忆网络(Layered Memory Networks)模型,对电影视频中静态-动态的字幕文本以及分层结构的视觉内容进行共同建模,借助跨媒体推理获取关于电影视频问题的事实和回答。
16:00-17:00报告专家:聂飞平(西北工业大学 教授)
报告题目:基于结构化图学习的高效聚类方法
报告摘要:数据聚类是机器学习和数据挖掘研究中的一个基本问题。在数十年的研究中,已经提出了很多聚类方法,而基于图的聚类方法是其中最有效的方法之一。传统的图聚类方法需要用户事先给定一个图,然后采用松弛技巧将问题转化为一个可解的问题。由于一般的图不具有结构性,因此得到的解是连续的,需要利用离散技术得到最终的聚类结果,从而使得聚类结果十分依赖于初始化。针对这些问题,我们提出了一种结构化图学习方法,通过学习一个具有结构的图,使得我们可以直接得到聚类结果,不再依赖于初始化。该新方法具有性能优越,稳定等优点,并且其中的结构化图学习思想可以应用在其他基于图的机器学习方法中,具有很大的应用价值和启发性。
17:00-18:00报告专家:沈复民(电子科技大学 教授)
报告题目:哈希码学习及其在视觉检索识别中的应用
报告摘要:随着移动互联网及人工智能技术的发展,图像、视频等视觉数据呈爆发式的增长,对海量视觉数据的检索及识别成为最重要的研究课题之一。基于哈希码的检索因其在存储及计算上的优势成为近几年的研究热点。本次报告将简要介绍哈希码学习及和传统的度量学习的区别及优势;介绍哈希码学习的进展,特别是以“离散哈希”为代表的最新研究成果。同时也将讨论哈希在大规模图像检索及识别上的应用。
11月19日上午(伟德bv1946官网长清湖校区报告厅)
08:00-09:00报告专家:赵耀(北京交通大学 教授)
报告题目:可逆信息隐藏
报告摘要:可逆信息隐藏技术是一种能将秘密信息隐藏在媒体数据中以实现信息的秘密通信、版权和内容保护等目的,并可以在提取秘密信息后恢复原始载体的一类信息隐藏技术,该技术得到了国内外学者的广泛关注。本报告将介绍可逆信息隐藏的基本概念,回顾其典型的嵌入方法,并详细介绍本实验室最近的相关成果。
9:00-10:00报告专家:孙仕亮(华东师范大学 教授)
报告题目:概率多视图多标签学习与自编码变分推理
报告摘要:多视图学习作为当前机器学习领域的重要前沿方向,近年来得到了很大的发展。本次报告将首先回顾多视图学习的代表性方法,然后针对一类具体的问题——多视图多标签分类,介绍研究进展。针对多视图多标签分类问题,介绍了目前的经典做法以及伯努利混合模型,并提出了基于潜变量的条件混合模型。为了解决新模型的推理与学习问题,提出了基于自编码变分推理和随机优化的训练算法。最后,用具体实验结果对各种相关方法的性能进行了对比。
10:00-11:00报告专家:翟广涛(上海交通大学 教授)
报告题目:虚拟现实技术在儿童自闭症治疗中的应用
报告摘要:孤独症谱系障碍(ASD)是一系列复杂的神经发展障碍性疾病。研究表明,ASD患者的能力欠缺主要表现在缺乏交流、没有想象力、难以互动三个方面。虚拟现实(VR)技术具有的沉浸性、想象性、交互性三大特性,弥补了由于ASD患者的症状而造成的功能缺陷,因此可以用于ASD患者的能力训练和康复辅助之中。我们在前期研究中尝试使用VR技术设计ASD训练场景,取得了较好的初步效果。
11月19日下午(伟德bv1946官网长清湖校区报告厅)
14:00-15:00报告专家:马思伟(北京大学 教授)
报告题目:沉浸式媒体技术趋势与进展
报告摘要:虚拟现实技术近几年发展迅速,而沉浸式媒体技术是支撑虚拟现实应用的核心技术之一。本报告将对沉浸式媒体技术的发展趋势以及最新进展进行介绍,主要包括新一代视频编码标准进展,点云、光场等新兴媒体数据的高效压缩等内容
15:00-16:00报告专家:蒋树强(中科院计算所 教授)
报告题目:上下文信息融合的场景识别与理解
报告摘要:如何对图像进行深入的分析和理解,满足我们各种应用需求是计算机视觉和多媒体领域的一项重要研究课题。由于视觉场景中的信息涉及不同层次、不同粒度和不同角度,视觉场景理解包含场景识别、物体检测、视觉关系检测、语言描述等多项研究内容,具有多样性。近期视觉场景识别和理解发展较快,但各项研究内容大多是独立开展研究,并未充分考虑场景内信息间的上下文关联。本报告将讨论视觉场景识别和理解的研究现状,分析上下文关联对视觉场景理解的作用,并介绍场景识别、视觉关系检测、和视觉语言生成等相关研究进展。