时间: 2015年4月23~25日
地点: 北京·国际会议中心

专题: 基于大数据的机器学习和数据挖掘

Day of week:

最近10年, 是以深度学习为引领的人工智能相关技术飞速发展的时期, 同时也是互联网产业飞速发展的时期, 两者相互推动促进。 新一代人工智能技术离不开大数据, 而互联网企业一直在思考如何利用这些天然拥有的大数据,因此,谷歌, 微软, 百度等公司也成为了这波浪潮的领军人物。 我们将利用这次机会, 向大家介绍深度学习技术的发展过程, 逐步揭示它能够成为当前最为成功的机器学习模型之一的内在因素。 产业需求包括万象, 深度学习技术同样涵盖众多变化, 我们只有深入的了解这些, 才能最大限度的发挥出新技术的优势, 这也正是这次专题要给大家带来的。 除了机器学习技术本身形式多样, 和数据的结合方式也同样值得深入探讨, 尤其是个性化信息引入, 直接导致了数据数量和数据维度的急速碰着, 真正进入了海量信息时代, 而这些信息正是互联网公司专注的核心, 让用户享受更好的体验和服务。今天请来的都是互联网产业领域的技术专家, 希望通过他们的分享, 带动大家更好的理解并参与到这场人工智能的变革中来。

专题出品人:
周杰
百度深度学习实验室科学家 ,深度学习技术组负责人

周杰,中科院理论物理研究所博士, 当前工作于北京的百度深度学习实验室, 深度学习技术组负责人, 主要研究方向为自然语言理解, 大规模机器学习算法和 深度学习算法, 以及推动这些算法在产品领域的应用。 喜欢钻研和探索未知领域, 希望投身于利用人工智能技术来引领社会变革。 对传统的各种机器学习技术以及深度学习技术有着深入的了解, 同时在互联网产业界拥有多年将技术与产品相结合的经验。 希望能够通过对新技术的不断探索和和理解, 将他们的社会影响力最大的发挥, 造福于社会。 闲暇时间爱好户外旅游和摄影, 享受大自然带来的美, 喜欢在冥想中获得灵感, 帮助自己不断的超越。


by 邓澍军
猿题库 研究部总监

作为国内在线教育领域的典型代表——猿题库一直在为K12用户寻找最优的能力成长之路,这其中广泛用到各种基于大数据的机器学习技术。我们将传统教育中的能力反应模型(IRT)和一些经典的机器学习模型(LR、FTRL)相结合用来预测用户的高考分,利用推荐系统算法来为用户挑选最能提升其能力的题目,利用深度学习技术来做拍照搜题,还有很多图像处理、自然语言处理相关的应用。


by 王栋
美团网技术总监

近来随着移动互联网的飞速发展,通过线上完成消费决策及交易,线下实际消费的O2O模式也吸引了越来越多的用户。作为国内最大的本地生活电商平台,美团网已经积累海量的线上用户行为及线下消费的相关信息,以及对应的商家信息。如何利用这些信息提供个性化的服务,更快满足用户需求;如何利用这些信息刻画消费者需求的统计特征,并辅助商家改进决策,为消费者提供更有针对性的服务:都是过去几年美团一直深入研究探索的问题。

本次分享将介绍美团在C端和B端的一些学习和挖掘的案例,展示数据和智能算法在O2O领域的魅力。更具体的,您将听到:

在C端,数据+个性化的推荐搜索技术如何大幅度提升用户的转化率;

在B端,包括电影票房预估、团购单质量评估及精准广告投放等技术如何帮助商家和美团改进运营效率;以及美团机器学习平台的建设思路和努力方向。


by 夏粉
百度研究院大数据实验室高级科学家

随着数据采集技术的飞速发展以及数据源的日益丰富,数据规模已经爆炸性增长。作为人工智能研究领域中一个重要的方向,机器学习是公认的处理和学习这些数据的最有效手段之一。

面向大数据量的机器学习,通常需要做分布式的算法,来容纳上亿特征和数据。本报告将向大家分享了大规模机器学习和数据挖掘方面的话题和研发成果, 将以广告大数据上的点击率预估,介绍大规模机器学习与传统机器学习问题的区别,大规模机器学习面临的问题,大规模机器学习的过程,并介绍最新的大规模机器学习技术。


by 王峰
搜狗搜索广告研发部高级经理/资深研究员

在计算广告系统中,尤其是搜索广告系统中,每次广告的展示都会涉及到用户、客户以及媒体三个实体间利益的平衡。虽然这三者利益的表述和评价在形式上会有很大的区别,甚至从表面上看还会存在一定的矛盾,但是从基础上来看,三者的利益最终在相关性上达成了一致。相关性高的展示不仅可以提升用户的搜索和浏览体验,而且也会提高客户广告的转化效果ROI,进而推动媒体、搜索引擎广告收益的提升。在广告系统相关性中,最核心的问题就是查询和关键词的语义相关性计算。然而,受到计算文本过短、文字歧义较大、长尾问题过多、准确率和覆盖率要求过高等因素的制约,用户查询词和广告之间相关性计算问题对于从业的算法设计人员来说始终是一个巨大的挑战。本报告就搜狗搜索广告团队实际经验,对广告系统中短文本相关性的常用计算方法以及在广告系统中的具体应用进行分享和探讨。

听众受益:

1.了解搜索广告中短文本相关性的计算算法。

2. 了解实际系统中算法调优相关经验。

3. 探讨广告系统中文本之外的影响相关性因素。


by 陈超
阿里巴巴1688事业部高级算法专家

随着互联网飞速发展,作为国内最大的B2B网站,1688积累了海量的用户行为和企业信息。如何通过基于大数据的机器学习技术,为买家提供最好的批发采购体验,为卖家提供物超所值的营销效果,建立高效公平的市场机制,一直以来是我们深入研究的课题。本次分享将介绍1688在机器学习和算法平台建设方面的最新进展,具体包括以下内容:

1.电商搜索面临的算法挑战以及基于大规模机器学习的解决方案

2.如何基于搜索系统,兼顾推荐需求

3.如何基于搜索系统,实现更多导购场景核心环节的数据化运营

4.如何设计搜索系统,实现在多场景和多行业下的复用性和扩展性


by 鹿晓亮
科大讯飞算法与引擎研发部经理

近几年,由于深度学习、大数据以及云计算在语音识别、图像识别等感知智能中得到广泛应用,语音识别、图像识别等感知智能的核心效果得到了长足的进展,然而其背后的超大规模深度学习平台还不为众人所知,本演讲为大家揭开基于深度神经网络人工智能的深度学习平台的神秘面纱。

听众受益:

1、了解深度学习的基本知识;

2、了解深度学习平台的基本架构;

3、了解深度学习训练算法的加速方案;


by 李成华
京东DNN Lab首席科学家

自动问答技术是人工智能领域中一个非常热门的研究方向,它综合运用了自然语言处理,信息检索,语义分析,机器学习,人工智能等技术的一种新型信息服务技术,自动问题系统将会自动分析和理解用户自然语言的提问,直接返回用户想要的答案。深度学习作为近年来研究和应用的热点,已经在图像处理和语言识别领域取得了巨大的成功,那么它在自然语言处理和自动问答系统方面将会有什么样的应用。本报告将分享自动问答系统的相关技术以及发展历程;深度学习的相关技术以及在自然语言处理中的研究进展;深度学习在自动问答系统里面的一些应用成果;智能客服问答系统的相关技术,以及这些技术怎么在业务中发挥价值,提高自动问答系统的准确性,用户满意度等。

演讲专题

Covering innovative topics

4月23日,星期四

  • 敏捷之后,是什么

    敏捷实践在大型组织中现在已经有哪些应用了呢?从小型团队中兴起的敏捷,到了大型组织中如何才能够取得成功呢?

  • 知名移动案例分析

    移动互联网高速发展,我们每天花在移动设备上的时间越来越多。怎么做出一款大众喜爱的应用,从众多 App 中脱颖而出?听听那些耳熟能详的 App 背后的成长故事,也许能找到答案。

  • 新时代的安全

    高危漏洞频发,隐私泄露,普通开发者该如何避免和防范;开发者如何从逻辑上避免风险?

  • 互联网金融背后的技术架构

    何为互联网金融?是互联网公司做金融业务,还是金融公司使用“云计算“,”大数据”等“时髦”技术?这些说法都不足以描述互联网金融的本质。

  • 微服务架构

    过去的一年,微服务架构在社区中讨论广泛。微服务在企业中的实践现状如何?本专题将关注它对企业计算架构的影响,以及一线互联网公司的团队是如何应对实践中的问题与挑战的。

  • 永不止步的前端

    过去一两年,在前端迅猛发展的同时,深深感觉到前端才刚刚开始。前端工程师正在演化成产品工程师,虽有迷雾,但路就在脚下,永不停息。

  • 云计算高可用架构设计与实践

    以分布式系统为基础的云平台需要对CAP原则做很好的平衡,当上层业务需要高可用支撑时,就需要对中间服务层及底层基础架构、操作系统层实现高可用,如何低成本的实现高可用就成为云平台设计的难点。本专题将以透过余额宝等金融服务的高可用服务,揭示底层的数据平台、虚拟化平台、跨数据中心的高可用架构。

4月24日,星期五

  • 可扩展、高可用架构设计

    本专题主要讨论大型复杂的互联网的架构设计、代码与运维体系。

  • 新兴大数据处理技术与工具

    Hadoop之后,又有哪些值得关注的大数据处理工具?

  • 自动化运维

    运维领域经过十多年发展,有什么海量和自动化理论实践供我们借鉴?云和开源运维管理系统的快速发展给我们的运维模式带来什么样的改变?如何在费时的质量问题分析时找到高效和巧妙的方法?

  • 云计算平台构建与应用

    云计算方兴未艾,各种技术与服务层出不穷,各种技术如何取舍?是搭建自己的云平台还是使用公有云服务?如何多快好省建设云平台,又如何在多个公有云服务中快速灵活迁移呢?了解云计算最新技术动态,行业最新内幕,应用最佳实践,就来云计算平台构建与应用专场。

  • 移动开发最佳实践

    移动互联网带来了新的一波创业潮,业务的飞速发展需要技术团队的良好支撑。面临不同时期不同量级的业务时,技术选型和策略可能会完全不同。让我们来看看业内的一些团队是怎么做的。

  • 编程语言实战

    各种不同的编程语言优劣一直是大家热议的话题,这个专题不是为了引起大家的争论,而是展示不同的编程语言在特定的场景解决了哪些问题,以实际的效果来说话,将优劣的问题留给大家来思考。

  • 云计算与大数据应用选型

    无论是云还是大数据,找到合适的解决方案、做好数据选型都是十分关键的。本专题将邀请来自主流云及大数据服务商的技术工程师,旨在帮助企业和个人充分了解主流解决方案的优势与特点,从而更好的进行技术选型。

  • 亚马逊AWS技术应用实践

    作为全球最成功的云计算服务商,亚马逊AWS在技术、功能和生态系统建设方面都有非常丰富的积累与经验。本专题将邀请亚马逊AWS的架构师及客户,分享在亚马逊AWS构建服务的实践,涉及混合云、大数据、移动应用和运维。

4月25日,星期六

  • 团队建设

    关注中小型团队如何走向成功。

  • 服务质量

    O2O潮起,“连接人与服务”成为焦点。我们邀请到一些优秀的服务平台或服务提供商,分享他们是如何针对O2O服务具有的地域性、时效性、闭环性、碎片化等特点,做好服务质量保证的。

  • 挑战全栈开发

    全栈是最近一两年里才流行起来的开发概念,代表一种新的工作模式。全栈工程师是否需要精通整个技术栈的所有技术,是精通单一领域,还是全面发展?全栈工程师在工作中要扮演什么不同的角色,工作过程究竟有何不同?

  • 思考开源

    开源的力量有目共睹,但如何应用开源、如何参与开源软件开发、如何融入和回馈开源社区、如何开源自己的软件等问题,都是很多公司的工程师非常关心的问题。这些问题的答案是什么呢?

  • 基于大数据的机器学习和数据挖掘

    该专题关注于当今最为前沿的机器学习技术, 包括深度学习, 大数据,以及个性化数据挖掘等领域。 我们将邀请该领域的资深专家, 详细介绍这些前沿技术给互联网产业带来的革命性的变化。

  • 技术创业

    在中国,技术创业是个艺术活儿——Google技术牛创业实战干货分享。

  • 移动开发平台与工具应用实践

    一款移动应用要经历从开发、测试、语音IM集成到运营监控的全生命周期,因此如何以低成本、快速的完成以上阶段就成为应用成败的关键。利用第三方开发平台或工具,开发者将以更低的成本获得全生命周期的技术支持,让开发者更专注应用的研发工作。本专场将主要分享移动应用开发过程中可使用的各种平台与工具的特点与应用实践,了解移动IM、IP电话、推送、广告系统背后的技术难点,以及详细解析第三方组件是如何解决用户数据管理、复杂网络、大并发等问题的。