摘要:杜政晓,清华大学计算机系三年级本科生,主要研究方向为深度学习算法在推荐系统中的应用,曾在 ECML-PKDD、KDD 等会议上发表一作论文。张钰晖,清华大学计算机系四年级本科生,主要研究方向为自然语言处理、机器学习、数据挖掘及其应用,在 npj (Nature Partner Journal) Digital Medicine 期刊、NeurIPS Workshop 会议上发表一作论文,开源清华大学开放中文词库 THUOCL。

喂,听说要搞大事情了~

难道又是博论?

No,这次可是4合1大礼包!

首届清华大学计算机学科学生科创开放日

要来了哦!!!

第一届清华大学计算机学科学生科创开放日(以下简称“开放日”)由清华大学计算机系学生科学技术协会、学生算法竞赛协会、研究生会,清华大学软件学院学生科学技术协会共同组织。整体活动以技术为导向,旨在汇总清华大学在计算机方向上的学生科创、学术、竞赛成果,提供统一的窗口进行展示,搭建统一的平台促进交流,进而展现同学在专业活动上积极进取的精神风貌,促进院系专业技术氛围的扎实厚重。

本届开放日活动汇总了学生特邀学术报告、学生学术科技作品展、清华大学智能体大赛(THUAC)、清华大学学生程序设计竞赛暨高校邀请赛(THUPC)等多个环节,并对校内校外相关专业方向的同学进行报名开放。开放日中各活动环节平行进行,参与者可以自由接触各类自身兴趣相关的技术活动。

报名时间:即日起至 5 月 10 日 20:00

活动时间:5 月 12 日(本周日)09:00 - 16:40

分论坛1:人工智能与多媒体

自然语言处理:

09:00-09:20 刘越 超越Chit Chat——微软小冰的对话技术实践

09:20-09:40 程桥 有道离线NMT模型压缩与加速方法

09:40-09:48 张钰晖 基于自然语言处理的自动疾病诊断

09:48-09:56 梁宸 DeepChannel:一种基于显著性估计与对比学习的抽取式文本摘要生成方法

网络表示学习:

09:56-10:04 涂珂 基于规则对等性的深度递归网络嵌入

10:04-10:12 张子威 保持任意阶相似度的网络嵌入

其他:

10:12-10:20 姚远 Attention-aware Multi-stroke Style Transfer

10:20-10:28 方志翀 针对上下文相关的检查倾向的干预收获

10:28-10:36 刘明华 Task and Path Planning for Multi-Agent Pickup and Delivery

10:36-10:42 朱昊 Neural Finite State Transducers: Beyond Rational Relations

10:42-10:50 杜政晓 基于元学习的场景化个性推荐

分论坛2:计算机系统结构、软件与理论

11:00-11:20 崔勇 低时延网络:挑战与机遇

11:20-11:35 吕志远 基于用户网络行为的假冒用户攻击检测

11:35-11:50 吴波 Enabling Efficient Source and Path Verification via Probabilistic Packet Marking

11:50-12:05 丁雨晖 DCLab: A Web-based System for Digital Logic Experiment Teaching

分论坛3:人工智能与多媒体

自然语言处理:

14:00-14:20 计峰 小样本学习在对话系统中的实践

14:20-14:40 高星 关于DeepQA算法中台的思考和实践

14:40-15:00 公明 深度学习模型在网络级大规模智能问答系统中的应用

多媒体:

15:00-15:20 李宇 智能拍照

15:20-15:28 郭碧川 基于凸优化的光场编码码率控制算法

15:28-15:36 张腾翔 基于同步的无线设备配对方法

其他:

15:36-15:44 翁家翌 Playing FPS Games with Environment-Aware Hierarchical Reinforcement Learning

15:44-15:52 高天宇 少次学习在关系抽取中的应用

15:52-16:00 王晓智 Adversarial Training for Weakly Supervised Event Detection

海报及Demo展示

16:00-16:40

崔勇 / 清华大学计算机系教授

崔勇,博士,清华大学计算机系教授、博导,网络技术研究所所长,教育部青年长江学者奖励、国家优秀青年科学基金、教育部新世纪人才和中创软件人才奖获得者,中国通信标准化协会理事,国际互联网标准化组织 IETF IPv6 过渡工作组主席,曾任 IEEE TPDS 编委,现任 IEEE TCC、IEEE Network 及 IEEE Internet Computing 期刊编委。他获得国家技术发明奖二等奖 1 次、国家科学技术进步奖二等奖 1 次、省部级科技进步一等奖4次以及国家信息产业重大发明 2 次。他在 IEEE Transactions 等互联网领域重要刊物上发表了近 100 篇学术论文,获得了 40 余项国家发明专利授权,完成了 4 本学术著作,所提出的 IPv6 过渡技术被国际互联网标准化组织 IETF 制定为 9 项 RFC,获得了 3 项国际会议的最佳论文奖。曾多次在 MIT、斯坦福等大学和美国 HP 实验室、华为 2012 实验室等工业界研究院作报告。

低时延网络:挑战与机遇

视频直播、VR 和分布式 ML 等新型应用业务,对网络传输时延的要求不断提升。本报告从网络传输时延的来源分析入手,研究了云端数据中心网络的低时延架构,探讨了智能移动终端的新型低时延接入传输技术,并与 VR 和移动云存储等主流应用相结合来降低时延,最终尝试设计新型传输机制来满足应用的网络传输时延需求。

刘越 / 微软小冰核心对话组负责人

刘越,微软亚洲互联网工程院 Principal Engineering Manager,毕业于北京理工大学。长期从事搜索引擎、智能助理、开放域对话产品的研发工作,现任微软小冰核心对话组负责人。

超越Chit Chat——微软小冰的对话技术实践

开放域对话(open domain conversation)近年来在学界和业界受到了广泛的关注和研究。但是依旧有很多问题还有待深入的思辨和实践。本次讲座会分享我们在两个主题上的探索。一是如何让开放域对话突破无意识的闲聊,产生有“意识”的对话交流。二是如何利用对话塑造一个特定人物,并实现产品价值。期间还会介绍我们部分技术路线和技术方案。

公明 / 必应搜索智能问答产品研发项目负责人

微软亚洲互联网工程院 NLP Group Senior Engineer Manager,必应搜索智能问答产品研发项目组负责人。硕博连读毕业于中国科学院计算技术研究所,在机器学习、计算机视觉、自然语言处理等领域有优秀的研究和工程经验。2013 年加入微软,先后参与微软必应搜索产品、智能问答产品的核心算法研发工作。

深度学习在网络级大规模智能问答系统的应用

智能问答旨在为用户提出的问题自动提供简短、准确的答案,它为用户通过搜索引擎进行大规模网络信息检索提供了更快捷、智能的体验,是下一代搜索引擎的重要方向之一。本次分享包含以下内容:首先介绍智能问答在必应搜索引擎中的应用场景,然后介绍大规模智能问答系统中的核心排序系统,并重点介绍团队如何利用深度学习模型来解决智能问答中的核心挑战问题,最后从产品的角度提出目前正在进行或未来值得研究的问题。

李宇 / 华为中央媒体技术院资深算法工程师

李宇,华为中央媒体技术院主任工程师,清华大学电子系毕业,曾在三星任高级研究员,当前在华为中央媒体技术院拍照工程部从事计算机视觉和深度学习方向的研发工作。

智能拍照

随着近些年深度学习领域的突破,计算机视觉技术在加速发展。拍照是手机终端的重要功能之一,计算机视觉在 camera 拍照上的应用,正使得 camera 拍照更加智能,效果更好,更有趣味。本次报告讲分享视觉技术在终端拍照上的应用及挑战。

程桥 / 网易有道资深算法工程师

网易有道资深算法工程师。毕业于浙江大学,毕业后一直从事机器翻译的研发工作,经历了机器翻译从 SMT 时代发展到 NMT 时代的过程。在有道参与了 NMT 的工程优化,质量调优,离线翻译,语音翻译的核心研发工作,在机器翻译方向有丰富的研发经验。

有道离线NMT模型压缩与加速方法

深度学习近些年在图像、语音和自然语言处理等领域都取得了显著的进步,也产生了一些将这些技术部署到移动端的需求。受限于移动设备存储和计算资源稀缺,部署深度学习应用需要对神经网络模型进行压缩和计算加速。本次报告将结合有道在部署离线 NMT 上的尝试,介绍参数裁剪和共享,量化,知识蒸馏,剪枝等模型压缩和计算加速方法。

高星 / 阿里巴巴智能服务事业部算法专家

阿里巴巴智能服务事业部算法专家, 致力于智能人机交互领域的算法研究和业务落地,先后参与阿里小蜜、店小蜜的核心算法研发工作。目前在阿里小蜜团队担任 DeepQA 算法中台负责人, 推动深度学习模型更低成本更广泛的应用,提升业务支持效率,助力业务高速发展。

关于DeepQA算法中台的思考和实践

本次分享包含以下内容:首先是 DeepQA 算法中台的背景、目标、架构做大致介绍;然后会对中台能力地图及其中的深度学习方案进行说明,最后是对落地过程中的挑战和未来的展望。

计峰 / 阿里巴巴智能服务事业部算法专家

计峰,博士,毕业于复旦大学计算机学院,方向为自然语言处理,中文信息学会青工委委员。目前就职于阿里巴巴集团智能服务事业部,担任算法专家。加入小蜜团队后,带领团队在小样本迁移学习、商品评论问答、文本匹配等多个领域取得国际领先成果,相关工作在国际顶会上发表了 9 篇论文。在工作中,以“从业务中来,到业务中去”为指导,学术研究与应用落地相结合,不断推动小蜜机器人的发展。

小样本学习在对话系统中的实践

本次分享将从实际系统中的问题出发,介绍自然语言处理中的小样本学习问题,以及在对话系统中的应用。最后将指出未来的技术挑战和发展趋势。

郭碧川 / 清华大学计算机系博士生

清华大学计算机系博士研究生,师从温江涛教授,2018 年获得博士生国家奖学金。主要研究方向为多媒体数据处理,目前已发表论文 6 篇,其中一作论文 3 篇,获得数据压缩会议 DCC’18 最佳学生论文奖,并做口头报告。该论文荣获最佳学生论文奖 Capocelli Prize,为国内科研机构历史上首次获得该荣誉。

基于凸优化的光场编码码率控制算法

光场是一种新兴的多媒体形式,是虚拟现实、增强现实技术的重要基础。先前的光场编码算法,主要是沿用了传统二维平面图像的编码方式,缺乏针对光场数据形式的优化。这篇论文研究了在置信度与角空间连续性的约束下,光场编码质量的统计规律,利用双曲回归模型刻画帧级率-失真性能,并创新性地提出了基于凸优化方法的码率控制算法,以及对应的迭代式编码系统,突破了传统编码方式的限制,大大提高了光场编码效率,其效果在光场公开数据集上首次得到验证。论文已经被数据压缩会议 DCC'18 接受,并荣获最佳学生论文奖。

涂珂 / 清华大学计算机系博士生

涂珂,清华大学计算机系博士生在读,师从朱文武教授. 主要研究方向为数据挖掘,网络表征学习,目前在国际顶级会议上发表 3 篇一作论文。

基于规则对等性的深度递归网络嵌入

网络嵌入的目标是在一个表征空间维持节点之间的相似度。现有方法通常根据直接连接的边或者共同邻居,也就是结构对等性,来定义节点相似度。然而, 网络中不同位置的节点可能也有相似的角色或者地位,比如正则对等性。这被现有的文献大大的忽略了。正则对等性是通过一种递归的方式定义的。两个具有正则对等性的节点的邻居分别具有正则对等性。根据此,我们提出了一种名为深度递归网络嵌入 (Deep Recursive Network Embedding) (DRNE) 的新方法来维持正则对等性。更详细地我们提出了层正则化的LSTM通过递归地聚合邻居信息来表征每个节点。我们理论上证明了一些常见的和正则对等性一致的中心性度量是我们的一个最优解。此外,学到的表征能够很好的预测节点的中心性度量以及正则对等性,并且能直接用于一些底层的应用比如节点角色分类等。实验结果表明我们的方法不仅优于现有的中心性度量的方法,也优于最新的网络嵌入方法。论文发表于 KDD 2018。

张子威 / 清华大学计算机系博士生

张子威,清华大学计算机系博士生在读,师从朱文武教授. 主要研究方向为网络表征学习与图数据挖掘。目前已在国际顶级会议与期刊(如 KDD、AAAI、IJCAI、TKDE 等)上发表多篇论文,2018 年获得国家奖学金。

保持任意阶相似度的网络嵌入

网络嵌入近年来吸引了研究者的广泛关注。现有方法表明,高阶相似度在网络嵌入中起到了至关重要的作用。然而,保持高阶相似度的两个关键问题尚未被很好解决。首先,现有方法只能保持固定的高阶相似度,然而不同的网络和任务往往需要不同的高阶相似度。其次,给定一个相似度,现有方法无法同时保证精度和效率。为了解决这些问题,我们提出 AROPE,保持任意阶相似度的网络嵌入。该方法基于奇异值分解(SVD)框架。我们首先理论证明奇异值分解重加权定理,该定理揭示了不同相似度的内在关系。利用该定理,我们提出了一个高效、可扩展的特征值分解算法来计算嵌入向量,且该算法可在不同任意阶相似度间随意切换。理论分析表明:(1) 我们的方法可快速在不同阶相似度间进行切换,以保持任意阶相似度; (2) 给定一个相似度,我们的方法可得到理论最优解; (3) 算法的整体复杂度与网络规模呈线性关系。实验结果表明,我们在网络重构、链接预测、节点分类等多个任务上均远优于传统算法。论文发表于 KDD 2018。

姚远 / 清华大学计算机系博士生

姚远 / 清华大学计算机系博士生

Attention-aware Multi-stroke Style Transfer

本次报告将给大家介绍一个显著性感知的多笔触任意风格迁移框架。近几年,风格迁移算法得到了大量的关注并广泛应用于实际的场景。已有的工作不能在生成逼真的风格化效果的同时保持风格化结果与内容图的显著一致性,导致生成的结果存在扭曲变形等现象。基于此,我们引入自注意机制来提取图像的显著特性,并自适应的融合多笔触的风格效果来生成高质量的风格化图像。该工作已被 CVPR 2019 会议接收。

张腾翔 / 清华大学计算机系博士生

张腾翔,清华大学计算机系媒体所博士生。论文发表在 UbiComp 等会议。

基于同步的无线设备配对方法

本次报告将给大家介绍基于手势同步的无线设备配对方法 Tap-to-Pair。该工作针对在普适计算环境中无线设备配对的错位问题,提出了通过与目标设备闪烁模式同步的方式发起配对的方式,实现了从广播设备端灵活发起的配对技术。该工作已在 IMWUT 期刊发表。

吕志远 / 清华大学计算机系博士生

吕志远,清华大学计算机系网络所博士生。论文发表在 ISCC 等会议。

基于用户网络行为的假冒用户攻击检测

本次报告将给大家介绍用户网络行为建模的工作。不同于传统的基于用户主机数据的建模方法,该工作针对假冒用户攻击问题提出了使用网络数据包描述字段建模用户网络行为和异常检测的解决方案。该工作已被 ISCC 会议接收。

吴波 / 清华大学计算机系博士生

吴波,清华大学网络所五年级博士生,主要研究方向为网络体系结构、网络安全、区块链等,曾在 ICDCS、IWQoS、Computer Networks、MASS、IPCCC 等国际会议和期刊上发表多篇一作论文,获中国发明授权专利 5 项、中国通信行业标准 3 项。

Enabling Efficient Source and Path Verification via Probabilistic Packet Marking

当前网络容易受到源地址哄骗、流量劫持等各种类型的网络攻击,现有的安全验证方式具有较大的验证开销和通信开销,影响网络传输的性能。在本次报告中,我将会给大家介绍一种基于随机标识的源地址与路径安全验证方式,避免了现有逐跳逐包的验证方式,具有高效性、低开销等优势。

朱昊 / 清华大学计算机系本科生

朱昊,清华大学计算机系四年级本科生,主要研究方向为计算语言学,在 ACL,EMNLP,NAACL 等会议上发表多篇论文。

Neural Finite State Transducers: Beyond Rational Relations

在这次报告中,我将会给大家介绍 Neural Finite State Tranducers。这种模型具有超过 rational relations 的表达能力,又能同时 encode 输入串和输出前缀,而且容易帮助使用者引入归纳偏置,更具有可解释性。

方志翀 / 清华大学计算机系本科生

方志翀,清华大学计算机系本科生,研究兴趣为数据挖掘、反事实机器学习。

针对上下文相关的检查倾向的干预收获

我将在这次报告中介绍反事实机器学习领域中的一项工作,通过搜索引擎 A/B 测试或者生产策略更换的点击数据估计不同上下文的检查概率。

梁宸 / 清华大学计算机系本科生

梁宸,清华大学计算机四年级本科生,感兴趣的研究方向有人机交互、自然语言处理、金融推荐等,曾在 CHI、AAAI 会议上发表 2 篇论文,其中一作 1 篇。

DeepChannel: 基于显著性估计与对比学习的抽取式文本摘要生成方法

在这次报告中,我将会给大家介绍 DeepChannel,一种基于显著性估计与对比学习的抽取式文本摘要生成方法,与传统的摘要生成方法相比,它具有数据高效性、良好的泛化能力等优势。

刘明华 / 清华大学计算机系本科生

刘明华,清华大学四年级本科生,主要研究方向为机器人规划、机器人三维重建等,曾在 AAMAS、PG 等会议上发表多篇论文。

Task and Path Planning for Multi-Agent Pickup and Delivery

在这次报告中,我将会给大家介绍一类多智能体的路径和任务规划问题,在仓库物流、飞机牵引等现实场景中有着广泛的应用。

王晓智 / 清华大学计算机系本科生

王晓智,清华大学计算机系三年级本科生,入选清华大学“未来学者”计划和“星火”科技创新人才培养计划。研究方向为信息抽取和知识图谱。曾在 COLING 2018 和 NAACL-HLT 2019 上各以第一作者身份发表一篇文章,并均被选做口头报告。

Adversarial Training for Weakly Supervised Event Detection

在这次报告中我将会为大家介绍我在事件检测领域的最新工作,它利用对抗训练的技术减轻了模型的数据依赖,从而更加适用于弱监督场景。

翁家翌 / 清华大学计算机系本科生

翁家翌,清华大学计算机系本科生,主要研究方向为强化学习与游戏 AI,曾获得国际比赛 VizDoom2018 Track1 冠军。

Playing FPS Games with Environment-Aware Hierarchical Reinforcement Learning

深度强化学习在围棋等任务上获得成功,引起广泛关注。但是在不确定性、信息不完全等情况下,深度强化学习往往面临决策空间巨大、奖励函数设计困难和探索效率低下等挑战。本报告针对目前深度强化学习所面临的问题,介绍人类领域知识、隐性经验和深度强化学习的融合机制,探讨利用人类知识降低信息不完整性、实现高效探索等问题的解决方案。利用相关方法,我们在多智能体 FPS 游戏竞赛 VizDoom2018 上获得了 Track 1 的预赛和决赛冠军,成为该赛事历史上首个中国区冠军,本报告将介绍我们的解决方案。

杜政晓 / 清华大学计算机系本科生

杜政晓,清华大学计算机系三年级本科生,主要研究方向为深度学习算法在推荐系统中的应用,曾在 ECML-PKDD、KDD 等会议上发表一作论文。

基于元学习的场景化个性推荐

在这次报告中,我将会给大家介绍我们在 KDD 2019 上的基于 Meta Learning 的场景化个性推荐。在该工作中,我们通过 learning to learn 的方法,来解决了在实际推荐中对于某些推荐场景冷启动的问题。

丁雨晖 / 清华大学计算机系本科生

丁雨晖,清华大学计算机系四年级本科生。

DCLab: A Web-based System for Digital Logic Experiment Teaching

在这次报告中,我将会给大家介绍与实验教学中心合作开发的,服务于本科生数字电路系列课程的在线实验系统。

高天宇 / 清华大学计算机系本科生

高天宇,清华大学三年级本科生,研究方向为自然语言处理、信息抽取、知识表示等。曾在 AAAI 19 以共同一作身份发表论文一篇。

少次学习在关系抽取中的应用

在这次报告中,我会为大家介绍少次学习及其在关系抽取中的应用,以及我提出的混合注意力机制,其可以帮助少次学习提升表现、加快收敛速度。

张钰晖 / 清华大学计算机系本科生

张钰晖,清华大学计算机系四年级本科生,主要研究方向为自然语言处理、机器学习、数据挖掘及其应用,在 npj (Nature Partner Journal) Digital Medicine 期刊、NeurIPS Workshop 会议上发表一作论文,开源清华大学开放中文词库 THUOCL。

基于自然语言处理的自动疾病诊断

在这次报告中,我将会给大家介绍基于自然语言处理的自动疾病诊断系统。本系统重点解决了:1)如何使用大量未标注的医学诊断文本信息提升监督学习性能;2)如何利用疾病的上下位关系解决数据不平衡问题,从而提高模型训练的速度和疾病分类的准确率;3)如何对模型预测结果提供解释,同时利用模型抽取出医学专业知识。

上午场 09:00-12:00:清华大学FIT楼二层多功能报告厅

下午场 14:00-16:40:清华大学FIT楼1区312

清华大学信息科学技术大楼(FIT楼),请从FIT 楼西门进入

1 / 报名方式

2 / 活动名额

1. 因场地有限,本次活动仅接受100 位 用户凭电子门票二维码入场

2. 放票时间:本次活动将于 5 月 8 日 14:30 开放报名

3. 活动采取审核制报名,我们将根据用户研究方向与当期主题的契合度进行筛选,通过审核的用户将收到包含电子门票二维码的短信通知;

4. 如您无法按时到场参与活动,请于活动开始前 24 小时在 PaperWeekly 微信公众号后台留言告知,留言格式为放弃报名 + 报名电话;无故缺席者,将不再享有后续活动的报名资格。

3 / 直播通道

为满足不能到场听众的需求,我们将在讲座开始后在直播平台进行实时直播。详情请关注 PaperWeekly B 站直播间。

清华大学计算机科学与技术系

中国中文信息学会社会媒体处理专委会(SMP)

PaperWeekly

编辑|陈刚

审校|吕林坤 赵妍

清华大学计算机系研究生公众号

计小研

相关文章