KDD2016落幕,雅虎获最佳论文,附10年最佳论文合集

  • 1
  • 5,586 阅读
  • A+

2016国际知识发现与数据挖掘大会(KDD)于8月17日圆满落幕,其中包含5个主题报告、6个全天研讨会和12场特邀演讲。吸引了来自全世界的数据挖掘、知识发现、大规模数据处理等领域的专家学者。同时,世界顶尖院校斯坦福大学、加州大学、卡内基梅隆大学、清华大学等和世界知名企业亚马逊、verizen、SAP、腾讯、滴滴等参加了此次大会。

KDD2016落幕,雅虎获最佳论文,附10年最佳论文合集

SIGKDD

ACM SIG Knowledge Discovery and Data Mining

国际知识发现数据挖掘大会

举办机构:ACM 

主要领域:数据挖掘

举办时间2016.08.13-17

举办地点:旧金山

SIGKDD全称是ACM SIG Knowledge Discovery and Data Mining(国际知识发现与数据挖掘大会),是由ACM举办的数据挖掘方面最好的会议,由研究热点丰富,涵盖社交网络与图象识别、机器学习与数据挖掘等课题,近些年来一直保持很高的热度,每年吸引全球数据挖掘领域的学者为之疯狂。

KDD2016吸引了来自全球的专家学者3000余人,涵盖数据挖掘、知识发现、数据科学等领域。作为数据科学的顶级盛宴,KDD的演讲报告、接受论文都代表了人工智能领域的最新进展和最前沿应用。

亚热带地中海气候赋予了这个城市独特的冬暖夏凉、阳光充足,同时也造就了独一无二的旧金山湾区、金门大桥和渔人码头。旧金山因怡人的气候,美丽的风光造就了这个城市的繁荣文化。这里聚集了众多的公园和风景区,有世界最好的教育资源,斯坦福大学、加州大学伯克利分校,同时邻近高新技术产业区硅谷。

作为KDD2016的举办城市,旧金山有着其独特的优势与魅力,这将是怎样的一场地中海气候与学术激情的碰撞。

主题报告

本次KDD特别邀请了5位来自不同行业不同机构、拥有不同背景的学者,分别给所有参会者做 1 小时的报告。特邀报告代表了领域最前沿的发展和前景展望,因其内容新颖、创意大胆,并且与工业界结合紧密,因而不少与会者能从中获取研究和创新方向。

Jennifer Chayes

微软剑桥研究院  主管

Graphons 和机器学习:建模和大规模稀疏网络估算

Jennifer Chayes的报告回顾了graphons理论,以及在过去的十年中,描述稠密图的限制。并且探讨了大规模稀疏网络中(特别是互联网、万维网和在线社交网络)如何建立模型并学习这些网络。最后说明如何在这些稀疏网络的非参数模型中使用graphons理论,得到一致性的估算和预测,并用于网络上个人隐私的保护。

Joe Hellerstein

加州大学伯克利分校  教授

人、计算机和现实世界大数据

 

Joe Hellerstein分享了在他的研究工作中的一些经验和奇闻轶事。在他的观点中,敏捷分析和分析路径的确立涉及到人机交互和基础设施。终端到终端的数据分析很少是一个干净的过程,数据评估,噪音和特征提取是耗时的和主观的。导出数据产品应用的模型和算法是数据源属性、代码和应用需求的时间变化属性而高度情境化的。

Greg Papadopoulos

全美教育协会  合伙人

早期系统、软件和半导体公司

 

Greg的演讲主题是:从VC的角度看机器学习领域的投资。他认为三级算法的改进,便宜的周期,和网络数据的捕获都是数据科学应用的催化剂。在每一个行业,我们关注的更多是数据的基础设施以及最终应用的企业的生态价值。工具的巨大的集体进步,技术和教育实际上将是潜在的差异化产品。

Whitfield Diffie

斯坦福大学  国际安全与合作中心

信息安全升级的意义

 

Whitfield Diffie说,当您在开发的安全系统时,新的渗透技术似乎是为响应新的安全措施而出现,而流量却通常是以其他的形式:安全因威胁的演变而存在和发展。他在报告中分析了信息安全的趋势,及其咋网络通信中的意义。

Nando de Freitas

牛津大学  教授(谷歌deep mind成员)

学习与深层递归神经网络组合

神经网络表示在计算机视觉、语音、计算语言学、机器人学、强化学习等多个数据丰富的领域中发挥着重要的作用。在这次演讲中,Nando de Freitas阐述了学习和创作是处理知识转移、处理小数据的体系和继续学习的关键因素,并列举了三个例子:学习算法、神经网络程序员及解释器、学习通信。

研讨会

本届的KDD总共有6个全天研讨会,相关的主题和具体涉及的内容主要如下:

Mining and Learning with Graphs

用图表进行挖掘和学习

了解不同的算法、模型的技术适用性

处理数据的不均匀性

信息整合与集成的共同需求

处理动态和变化的数据

在一定规模上解决每个问题

 Large-Scale Sports Analytics

大规模运动分析

视频、文本和社会媒体分析

特征选择和降维

特征学习与潜因子模型

实时预测建模

交互式分析和可视化工具

传感器技术及其可靠性

Data Science for Food, Energy and Water

食品、能源和水的数据科学

将食品、水和能源的数据科学的新型领域引入KDD社区

邀请科学家和医生进入这些领域,让他们来改善我们的技术

通过汇集多学科的人才,来创造新的技术

Mining and Learning from Time Series

时间序列的挖掘与学习

搜索、分类、聚类、预测和规则挖掘

使用GPU硬件加速技术,FPGAs和专用处理器

隐私保护的时间序列挖掘与学习

多变量、高维、异质性等的时间序列

具有稀疏或不规则采样的时间序列

深学习和子空间聚类的时间序列分析

时间序列分析和挖掘中的新的、开放的或未解决的问题

The 5th International Workshop on Urban Computing

第五届城市计算国际研讨会

城市信息学:大数据的采集、聚集和分析

城市交通建模,可视化,分析,预测

城市范围的人的流动性建模,可视化和理解

城市智能交通系统

城市中的异常检测与事件发现

城市空间中的社会行为建模、理解与模式挖掘

基于位置的社交网络,使城市计算方案

城市空间中的智能建议

城市智能配送服务

城市物联网中的数据挖掘

Interactive Data Exploration and Analytics

交互式数据探索和分析

交互式数据挖掘算法、可视化

快速,高层次的数据分析方法

可视化分析方法和在线算法

自适应流挖掘算法

即时数据挖掘的理论/复杂性分析

主动学习/挖掘

特邀演讲

总共12位特邀嘉宾在本次的KDD上作了演讲,其中腾讯的社交广告总经理罗征发表了演讲——“Building User Profiles from Online Social Behaviors, with Applications in Tencent Social Ads(基于社交行为数据的用户画像构建及其在腾讯社交广告中的应用)”。

 

特邀演讲嘉宾

 

KDD2016落幕,雅虎获最佳论文,附10年最佳论文合集 KDD2016落幕,雅虎获最佳论文,附10年最佳论文合集 KDD2016落幕,雅虎获最佳论文,附10年最佳论文合集 KDD2016落幕,雅虎获最佳论文,附10年最佳论文合集

腾讯社交广告部总经理罗征深入解读了腾讯社交广告如何通过数据分析更准确、全面地了解用户,提升用户广告体验,为品牌与用户建立更有价值的连接。

 

Verizon 首席数据科学家 Ashok Srivastava结合Verizon的真实案例,分享近来公司在对海量现实世界数据进行大规模机器学习及应用时的创新。

 

微软首席研究员Ralf Herbrich重点介绍CSS(社会计算科学)出现前一些无法解决的问题,并由此展示CSS的应用潜力及局限,并讨论他个人对CSS未来发展的一些看法。

 

12位嘉宾的演讲精彩纷呈,几乎都代表着各自领域的最高水准,让人叹为观止。

接收论文

2016 KDD共吸引了1115篇论文投稿,最终接收208篇,总体录用率不到20%,足见会议的标准之高,竞争程度相当激烈。

从本届KDD接受的论文可以发现,研究的方向与实际问题结合相当紧密,这也是数据挖掘和人工智能的发展方向。

论文内容整体更偏重实际应用中所产生的大规模数据和非结构化数据所覆盖的应用范畴包括商务、工业、健康、医疗、安保、隐私、环境、教育、交通等等。

本次KDD也收录了国内的学者的高质量论文,部分展示如下

NetCycle: Collective Evolution Inference in Heterogeneous Information Networks
Author(s): Yizhou Zhang*, Fudan University; Xiong Yun, ; Xiangnan Kong, Worcester Polytechnic Institute; Yangyong Zhu, Fudan University

 

Robust Extreme Multi-label Learning
Author(s): Chang Xu*, Peking University; Dacheng Tao, University of Technology Sydney; Chao Xu, Peking University

 

Come-and-Go Patterns of Group Evolution: A Dynamic Model
Author(s): Tianyang Zhang*, Tsinghua University; Peng Cui, Tsinghua University; Christos Faloutsos, Carnegie Mellon University; Wenwu Zhu, Tsinghua University; Shiqiang Yang

 

Partial Label Learning via Feature-Aware Disambiguation
Author(s): Min-Ling Zhang*, Southeast University; Binbin Zhou, Southeast University; Xu-Ying Liu, Southeast University

 

Structural Deep Network Embedding
Author(s): DAIXIN WANG*, TSINGHUA UNIVERSITY; Peng Cui, Tsinghua University; Wenwu Zhu, Tsinghua University

 

Asymmetric Transitivity Preserving Graph Embedding
Author(s): Mingdong Ou*, Tsinghua University; Peng Cui, Tsinghua University; Jian Pei, Simon Fraser University; Wenwu Zhu, Tsinghua University

 

Portfolio Selections in P2P Lending: A Multi-Objective Perspective
Author(s): Hongke Zhao*, USTC; Guifeng Wang, USTC; Yong Ge, UNC Charlotte; Qi Liu

 

Diversified Temporal Subgraph Pattern Mining
Author(s): Yi Yang, Fudan University; Da Yan, CUHK; Huanhuan Wu, CUHK; James Cheng*, CUHK; Shuigeng Zhou, Fudan University

 

Probabilistic Robust Route Recovery with Spatio-Temporal Dynamics
Author(s): Hao Wu, Fudan University; Jiangyun Mao, Fudan University; Weiwei Sun*, Fudan University

最佳论文

来自卡内基梅隆大学和来自雅虎公司的两篇论文斩获本次KDD的最佳论文大奖,前者论述的重点就是在存在伪装或者真实账号被黑了的情况下发现骗子,而雅虎则是总结了Yahoo搜索20年的成果和最前沿的技术,提供了一系列实用的相关性解决方案。

FRAUDAR: Bounding Graph Fraud in the Face of Camouflage

Authors:Bryan Hooi , Hyun Ah Song , Alex Beutel , Neil Shah, Kijung Shin, Christos Faloutsos (Carnegie Mellon University)

 

摘要

如何通过用户及其产品评论的二分图检测虚假评论或跟帖?现有的欺诈检测方法(比如spectral)是通过检测密集子图的节点是否与图的其他部分呈稀疏连接。而通过在真实账号或在真实账号后面添加评论,就可以骗过程序,让虚假看起来跟正常的一样。更糟的是,一些骗子还会黑了真实用户的账户,进一步增强伪装。

Ranking Relevance in Yahoo Search

Authors:Dawei Yin , Yuening Hu, Jiliang Tang , Tim Daly, Mianwei Zhou , Yi Chang.etc (Yahoo! Inc.)

摘要

Relevance对商业搜索引擎至关重要,学界和产业界都有很多研究者就此进行了几十年的研究。在现代搜索引擎中,Relevance远远不止文本匹配,还包括很多其他的问题。查询(Query)和URL的语义差距(semantic gap)是提高基本 relevance的主要障碍。Click 有助于分析提高相关性,但对于大多数的tail query,click的信息太疏松、噪音太大,或者彻底缺失。此外,要建立完善的相关性,新近(recency)和返回结果的位置敏感性也十分重要。

附录:KDD10年最佳论文

作为数据挖掘领域的顶级会议,KDD每年的最佳论文可以说是备受关注,代表着数据挖掘领域的超高水准和最前沿的进展。在此我们搜集了KDD近10年来(2007-2016)的最佳论文合集(附原文件下载),算是对数据挖掘发展的一个汇总。

2007

Predictive Discrete Latent Factor Models for Large Scale Dyadic Data

Deepak Agarwal; Srujana Merugu,Yahoo! Research

2008

FastANOVA: an Efficient Algorithm for Genome-Wide Association Study

Xiang Zhang;Fei Zou;and Wei Wang,University of North Carolina at Chapel Hill

2009

Collaborative Filtering with Temporal Dynamics

Yehuda Koren,Yahoo! Research

2010

Large Linear Classification When Data Cannot Fit In Memory

Hsiang-Fu Yu,Cho-Jui Hsieh,Kai-Wei Chang,Chih-Jen Lin

Connecting the Dots Between News Articles

Dafna Shahaf;Carlos Guestrin,Carnegie Mellon University

2011

Leakage in Data Mining:Formulation, Detection, and Avoidance

Shachar Kaufman,Saharon Rosset,Claudia Perlich

2012

Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping

Thanawin Rakthanmanon, Bilson Campana, Abdullah Mueen .etc

2013

Simple and Deterministic Matrix Sketching

Edo Liberty

2014

Reducing the Sampling Complexity of Topic Models

Aaron Q. Li,Amr Ahmed,Sujith Rav,Alexander J. Smola

2015

Efficient Algorithms for Public-Private Social Networks

Flavio Chierichetti,Alessandro Epasto,Ravi Kumar .etc

 

中国大数据生态图谱&大数据交易市场专题研究报告
R语言实战(中文完整版)
精选各名校数学专业考研初试试卷
R语言神经网络模型银行客户信用评估数据

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:1   其中:访客  1   博主  0

    • avatar 跨境电商平台 0

      非常不错!!!!