【北京_5月1日_数据挖掘培训】 数据挖掘实战应用

现场

4500元 / 3500元 (凭学生证优惠价)

远程

4500元 / 3500元 (凭学生证优惠价)
上课地点:北京市朝阳区对外经贸大学 讲师:数据挖掘实战应用讲师团队 报名时间:2014-3-20 - 2014-5-1 开课时间:2014-5-1至5-3 (3天)

课程特色:

  • 本次课程将通俗易懂地系统讲述经典数据挖掘算法,通过代码实现让学员深入理解算法内部;

  • 实战讲解数据挖掘主流应用:推荐系统、搜索广告,快速提升学员实战能力;

  • 三位讲师曾就职于多家知名互联网公司,使学员可以充分的掌握数据挖掘在不同业务场景中的应用。
     

学员对象:

  • 企业员工,想对数据挖掘的理论进一步深入梳理,并想增加数据挖掘的实战案例储备;

  • 对数据挖掘有兴趣或者想转行为数据挖掘的人员,但要求对数据挖掘及其中模型和算法有基本了解;

  • 在校硕士和博士研究生,有一定的数据挖掘知识基础。


培训目标:

  1. 使学员对数据挖掘模型和算法有一个系统、深入的理解,并具备对数据挖掘高级部分的自学能力;

  2. 通过实战讲解当前数据挖掘主流应用:推荐系统、搜索广告,提升学员的数据挖掘实战能力,甚至可以将培训课程中的实战案例直接应用于项目之中;

  3. 三位讲师在多家知名互联网公司的工作背景,使学员充分的了解数据挖掘在不同业务场景下的实际应用。

     

讲师介绍:

钟超,毕业于哈尔滨工程大学,现任京东商城商业智能部高级数据挖掘工程师。

主要研究方向为:最优化方法,机器学习,推荐系统,搜索引擎算法。同时关注大规模机器学习算法的实现,专注于机器学习算法在电商中的应用。

负责和参与了京东多个重要的数据挖掘应用项目,理论基础扎实、擅长算法代码实现,实战经验丰富。将主讲本次课程中的数据挖掘算法及实现部分。


Peter Wang,中国科学技术大学硕士,曾就职于IBM、百度等知名IT/互联网企业,任资深数据挖掘算法研究员、高级架构师等职位。

主要研究方向为:数据挖掘、机器学习、大数据技术、搜索、广告等系统平台架构规划、算法优化。将主讲本次课程中的搜索广告部分。
 

李少伟,清华大学软件工程硕士,曾就职于新浪微博、奇虎360等知名互联网企业,任资深数据挖掘工程师职位。

主要研究方向为:个性化推荐、数据挖掘、机器学习,尤其是各种数据挖掘算法基于大数据的实现。曾在个性化推荐领域发表两篇专利。

负责和参与了新浪、奇虎360各个应用场景下的推荐系统的构建与开发,理论基础扎实,实战经验丰富。将主讲本次课程中的个性化推荐部分。

 

课程大纲:

第一部分 (钟超老师主讲)

一 数据挖掘概述

   1 统计学习

    2 监督学习

    3 模型评估与选择

    4 模型的泛化能力

二 预测算法

   1 一元线性回归

     1.1为什么用回归

     1.2一元线性回归模型

   2 最优化方法-梯度下降法

   3 基函数与核函数

     3.1多项式回归

     3.2回归模型中的基函数

    4 欠拟合与过拟合

     4.1欠拟合

     4.2过拟合

    5 多元线性回归

    6 应用实例

三 分类算法

   1 线性分类器-感知器

     1.1感知器

     1.2感知器的学习策略

     1.3优化损失函数

     1.4代码实现

    2 线性分类器-逻辑回归

     2.1逻辑回归分布

     2.2二项逻辑回归

     2.3参数估计

     2.4基函数

     2.5过拟合(正则化)

     2.6参数的矩阵表示

     2.7代码实现

    3 贝叶斯分类器

     3.1贝叶斯公式

     3.2高斯贝叶斯分类器

       3.2.1理论简介

       3.2.2代码实现

     3.3多项式贝叶斯分类器

       3.3.1 构造数据集信息

       3.3.2 计算特征(单词)概率

       3.3.3 计算整篇文档的频率

       3.3.4 贝叶斯公式

       3.3.5 选择分类

       3.3.6 费舍尔方法

       3.3.7 增量式训练

    4 应用实例-主动客服

四 聚类算法

   1 KMEANS

    2 谱聚类

    3 应用实例-网格化配送

五 降维算法

   1 主成分分析(PCA)

     1.1 主成分应用

     1.2  一个例子

       1.2.1求主成分和主成分得分

       1.2.2确定分析精度

       1.2.3分析结果

       1.2.4程序解析

    2 隐性语意分析(LSA)

     2.1基于LSA的文本摘要算法

     2.2文本降维

    3 应用实例-文本聚类

六 模型选择

   1 交叉验证

    2 准确率、召回率、F-得分

    3 混淆矩阵

 

第二部分 (Peter Wang老师主讲)
 

一 计算广告学的基础背景

   1  广告的基本知识及发展历史

    2  在线广告的特点及市场分析

    3  计算广告的定义及研究范围

    4  广告投放模式详解

二 计算广告学中常用的数据挖掘算法

   1 回归

    2 聚类

    3 支持向量机

    4 决策树

    5 逻辑回归

    6 主题模型

    7 贝叶斯网络模型

三 搜索广告算法精解

   1 搜索广告匹配概览

    2 搜索广告匹配模式

    3 广告检索子系统介绍

    4 Query与广告的匹配方法

    5 Query rewrite技术

    6 关键词推荐

四 个性化广告投放概述

五 展示广告匹配概述

六 展示广告点击率预测

   1 击率预估背景

    2 点击率预估特点

    3 点击率预估模型

七 广告反作弊技术及方法


第三部分 (李少伟老师主讲)

一 推荐系统概述

   1 什么是推荐系统

    2 推荐系统应用场景

    3 推荐系统的评测

二 推荐方法简介

   1 协同过滤推荐

    2 基于内容的推荐

    3 基于知识的推荐

三 推荐系统中经常会用到的数据挖掘算法

   1 聚类

    2 Svm

    3 决策树

    4 逻辑回归

    5 SVD

    6 贝叶斯

四 推荐系统冷启动问题

   1 冷启动问题简介

    2 解决方案

五 推荐系统中经常遇到的问题以及解决方案

六 推荐系统实例

   1 电商网站推荐系统构建

    2 社交平台推荐系统构建

    3 移动app分发平台推荐系统构建

    4 新闻网站推荐系统构建说

 

PS:现场班后会赠送学员VIP1豪华版;同时分享学员通讯录,建立QQ群方便后期交流。
 

联系方式:

魏老师

QQ: 1143703950

Tel: 010-68478566

Mail:vip@pinggu.org