KDD China 2019

2019 KDD China于2019年01月12日在深圳大学主办一场人工智能前沿技术峰会,我也报名参加啦~这是现场会议回忆笔记。

周志华——机器学习的挑战


非神经网络的深度模型——深度森林

唐杰:网络表示学习理论与应用

Node2Vec、DeepWalk

Pearl Pu: How eople Perceive AI - Trust and Explanation

算法的可解释性

杨强: 迁移学习和联邦学习


数据孤岛:分割的数据,不同业务部门、不同企业之间数据不连通
迁移学习:有大量的数据但是无标签的数据集A,有少量数据但是有标签的数据集B。在B上训练模型,迁移到A上

联邦学习:建立数据联盟,进行商业赋能。

李航: Building GlobalContent Platform Using AI Technologies

李航博士现任字节跳动公司人工智能实验室总监,主要介绍了字节跳动公司的工作,AI在字节跳动公司主要有三个商业目标:

  1. 内容分发(信息流-今日头条,短视频-抖音 内容推荐)
  2. 内容审核(鉴黄,标题党识别)
  3. 内容创造(为广告主自动生成候选广告语、美颜P图、把跳舞美女的腿拉长、抖音变脸游戏、跳舞机)

AI很强大,总之不要沉迷于抖音里的美女

Fausto Giunchiglia: Large Scale Privacy Preserving Data Integration

王文博: 多媒动态内容消费流信息的分析及应用:弹幕与在线视频赏析

王文博教授的演讲最轻松了,比较接地气,集中了全场的幽默笑点。介绍了他们在弹幕方面的工作,通过弹幕理解视频内容,预测剧情发展,节目画像,在合理时机插入广告语

谢幸: 个性化推荐系统的未来

首先回顾了推荐系统的历史和其中的经典模型

介绍了几项MSRA的工作,
开源项目DeepRec:

深度学习(xDeepFM)做推荐(缺点-计算量挺大的)
知识图谱做推荐(RippleNek: 抽取实体关系建立无向有环图,根据领域关系把几跳范围之内的属性加入系统(类似波纹Ripple传播一圈一圈扩散),实现推荐的多样性、解决冷启动、实现数据增广)
可解释性的推荐

现场提问环节:
有资深教授提问,许多学者在申请国基的时候需要填写自己最具有代表性的5篇工作,论文太多了填这些材料也很头疼,能否做一个工作自动根据关键字、作者、时间自动推荐代表作?
我觉得这完全可以用监督学习来做,学者网可以将这个作为一个研究点。

王孝宇: Data Mining:Online to Offline

圆桌讨论


自由提问环节,

  1. 首先观众提问了一个关于小数据的处理问题,大牛们纷纷给出了自己的见解。
    观点一:Transfer Learning
    观点二:从问题角度,小数据未必要用机器学习,专家系统,人肉解决
    观点三: 引入额外数据,知识图谱,预训练
  2. 模型训练超参数如何确定?(AutoML) 正负样本比例悬殊?(采样问题)
  3. 测试集的特征与训练集特征不同或产生了变化怎么办?
    尽量保证你的训练集和测试集特征一致不要产生变化

。。。

感悟:茶歇的抹茶千层真的好吃:)今年的研究热点在迁移学习、预训练BERT、强化学习、知识图谱、算法可解释性、深度图网络,这些是峰会高频词。

在会场偶遇师妹,附参会纪念照: