产品中心
我们将会把火狐直播的产品和经验直接服务于更多的客户
为中国经济腾飞做出贡献
第十届中国R会议(北京)演讲嘉宾介绍(六)
发布日期:2023-10-22 作者: 产品中心

  2017年,是中国R会议值得纪念的第10个年头,本届R会议将于5月19-21日在美丽的清华大学举办。在这样一个值得纪念的时刻,让我们相聚清华大学统计学研究中心,相聚R会议十周年庆典,相聚这场数据与统计的盛宴!本届会议覆盖数据科学多个领域,我们很期待您的到来,希望您的演讲能让听众更多受益,能让会议更加精彩!

  中国R会议是由统计之都发起,并同国内高校共同举办的极有特色的数据科学会议。2008年,中国R会议在中国人民大学举办第1届,2016年已发展至全年9个城市先后举办,服务数据科学在校师生和业界人士数万人,内容覆盖数据科学相关的多个行业,R会议非常有幸见证了数据科学在中国的蓬勃发展。

  2017年,清华大学统计学研究中心、北京大学商务智能研究中心和统计之都携手共同主办第10届中国R会议。本届会议的主题包括医疗健康、生物信息、消费金融、量化投资、工业工程、人机一体化智能系统、软件工具、计算平台、概率统计、机器学习、人工智能、自然语言、天文地理、城市规划、环境科学、社交网络、政务数据、商务统计、人文科学等诸多线日特邀演讲会场设于清华大学新清华学堂,20-21日将举办上述主题的平行分会场。

  下面为您奉上本次R会议【汽车联网】、【教育培训】、【商务统计】以及【机器学习】分会场演讲嘉宾介绍:

  车联网作为物联网领域的先行者,无人驾驶的必由之路,目前已确定进入高速成长期。随之产生的大量多源异构的数据,这其中又以时空轨迹数据为主体。本次报告主要分享如何挖掘如此庞杂的时空数据宝藏,洞察隐藏在数据背后的商业经济价值。主要围绕三个主体业务模块进行介绍:事件识别、行为评价、用户画像。

  摩拜单车在最近的一年里发展飞速,许多实际问题亟待通过数据驱动的方法去解决。本次演讲将主要从供应链优化的角度,谈一谈在运营效率的提升方面,摩拜数据科学应用的现状以及对策。

  介绍斑马互联网汽车的数据应用,包括轨迹poi分析,驾驶行为分析,硬件使用分析和用户使用分析。通过介绍专车识别,驾驶评分,油耗预测等业务模型,分享建模工作中的心得。

  每天滴滴出行平台产生海量出行数据,而滴滴正利用这一些数据不断建立各种机器学习模型来优化线上产品体验,从分单到定价,滴滴的机器学习和传统网络公司的推荐广告算法的差异很大,这次分享会介绍滴滴平台典型的机器学习应用,进一步会介绍在顺风车场景如何利用机器学习来构建更加智能理性的大数据运营引擎。

  在移动互联网时代,多屏媒体,O2O多维互动,给消费者购物带来了更多信息和更多选择。也给了企业更丰富,更有挑战的营销环境。

  在众多影响决策的微时刻(micro-moment)和关键时刻(moment of truch)中,汽车消费者的思维已经不知觉的进入了“车型鄙视链” 的精神世界和换车魔力象限的领域。

  利用车轮查违章,车轮社区(覆盖2亿真实车主的APP应用)中用户对车型PK投票的数据,我们真实再现了这个车型鄙视链,从中会发现每一款车,你都能够找到选择他的理由。这为更加细分,更加个性化的汽车市场提供了理论支撑。以此报告希望可以协助用户选到最对自己最合适的车,也协助车厂在细分市场更精准的定位,还可以预测未来的汽车销量。

  报告主要介绍了汽车驾驶员驾驶行为数据分析的思路和结果。本例的驾驶行为数据主要采集自车辆的CAN总线与陀螺仪数据,报告首先介绍了数据的预处理方案,包括数据的滤波方法及坐标转换方法,然后介绍了常规类驾驶行为与特殊驾驶行为的识别算法,最后介绍了驾驶行为的统计结果以及对车辆性能的预估。本报告所涉及的数据处理、数据分析基本都使用R语言进行,相关的R包包括ggplot2、dtw、corrplot、sqldf等。

  统计是动态的历史,历史是静态的统计。如果大数据是海洋,那么统计学定是汇入这海洋的主干河流之一。纵向梳理公元前至今统计历史长河中的年代大事,横向比较数据统计分析的重要科学发现,探究人类科学广场上雄伟的统计智慧殿堂。

  大数据时代中,技术变革和人才稀缺成为两个核心话题。作为服务了数十万公司的移动互联网招聘平台,BOSS直聘积累了海量人才大数据,清楚地看到当下企业应用大数据技术,与人才断层下的几个困境。构建自我进化的生态系统,或许可成为处理问题的一个方法。

  数字金融-实验室项目模拟系统 ——银行数据仓储,数据测试,数据安全三位一体的就业驱动项目训练系统平台

  教育部《关于“十三五”期间全面深入推荐教育信息化工作的指导意见》提出“信息化已成为国家战略,教育信息化正迎来重大历史发展机遇”。文思海辉以就业为驱动的金融训练系统平台,整合了集团数字金融解决方案的银行数据仓储工坊系统、数据测试ATQ管理系统与数据安全攻防产品系统,形成三位一体的实验室项目训练系统,并为校企合作专业共建和教学实验室建设提供了应用层、测试层、信息安全层,提供了一个完整的培养体系解决方案。

  通过介绍博雅大数据学院在数据科学相关专业建设、大数据教育实训平台建设方面的经验,探讨大数据人才培养的模式,交流大数据教育和学科建设的经验。

  当前在线教育市场方兴未艾,作为细致划分领域的大数据教育更是处于摸索发展阶段。《大数据教育实训平台的建设与探索》结合大数据教育的现状,剖析行业痛点,从教、学两大主题,通过介绍北京大数据研究院博雅大数据学院产品数据嗨客,交流在大数据教育实训平台建设上的实践经验。

  通常大家认为,模型预测准确性越高,越有利于做决策。但现实中,却存在精度高的模型导致错误决策的现象。因此,盲目追求模型精度是不科学的。事实上,作为一家决策型公司,我们得知模型的正确性才是至关重要的,即使预测精度不是很高。我们在这里介绍一种广泛使用的模型诊断方法,利用提供的数据,检验当前使用的模型(可以是非参数或者半参数的)是否适用。这是数据分析和决策中很关键的一步,而恰恰容易被忽略。

  针对尚未走出校门的统计学生,介绍数据科学家在实际在做的工作中的工作方式、理念和工作内容,包括一些常用的R包和函数。并将结合一个完整的从业务目标分析,到接入外部数据源,最后到模型部署上线的实际案例进行演示。

  本次报告主要关于TUrank在影响力算法的进化和应用,以及CNN在图像场景识别的应用。

  阿里客服体系,每天5万热线万人在线咨询问题,服务成本高、服务效率低且使用者真实的体验差。我们基于语音识别、语义理解、个性化推荐、客户模型等技术,构建一整套完整的智能服务解决方案。包括陪伴用户的智能助理式机器人、人工咨询的智能推荐系统、交易纠纷的智能决策系统等等,用数据和智能提升使用者真实的体验,降低服务成本。报告会先演示智能机器人产品系列功能,包括语音识别、咨询服务、生活助理等,然后介绍客服整体智能解决方案、技术架构、关键算法、以及数据驱动理念。

  随着可再次生产的能源行业的加快速度进行发展,慢慢的变多的从业主体希望数据分析能够在实际业务中发挥更多的作用。R语言作为一种易于上手的开源语言,成为了许多从业者的首选分析工具。演讲将以新能源行业的基本特点入手,通过环境特征分析、设备性能分析、运营管理分析、行业信息与舆情分析四个业务方向,介绍新能源领域数据分析的重要价值与工作方法,最后分享基于公有云R语言分析平台的建设经验,展示R语言并行处理海量数据的思路与方法。

  大规模线上实验在京东每一天都在发生,大到一个全新的模块乃至平台上线,小到一个icon颜色,样式的更改,主要以AB试验的形式进行。大多数试验遵循直觉,数据收集和整理的工作冗长,但是对需要测试的指标以及收集到的数据的验证工作最简单,易引起区分度不足乃至和真实结论南辕北辙的情况。本次报告会详细的介绍线上实验的基本科学原则,实施细节,容易犯的错误;并结合google,微软,LinkedIn,Amazon等公司的最新研究论文,以及京东个性化推荐中的实践,从案例中学习怎么样使用机器学习和人工智能技术来验证数据一致性,降低误差等。

  长期以来因为数据和技术的限制,业内的广告系统大多只将广告的效果优化止于展现和点击阶段。我们系统中是如何衡量和优化广告转化效果的呢?此次分享首先从营销漏斗开始介绍什么是转化。接着以电商和App为例讲解转化归因和转化跟踪技术。然后讲解转化率预估的建模方法、挑战和技术实现。最后介绍转化率在广告出价排序阶段的应用。希望能够通过分享让大家对转化闭环生态体系中的有关技术应用有一个整体的了解和认识。

  推荐系统里面有两个经典问题:EE问题和冷启动问题。前者涉及到平衡准确和多样,后者涉及到产品算法运营等一系列东西。bandit算法是一种简单的在线学习算法,常常用于尝试解决这两个问题,本文为你介绍基础的bandit算法及一系列升级版,以及对推荐系统这两个经典问题的思考。

  目前第一阶段报名已截止,少数参会名额将于5月12日 20:00-24:00 开放,票务紧张,先报先得!

  往期推送:进入统计之都会话窗口,点击右上角小人图标,查看历史消息即可。返回搜狐,查看更加多