【北京_1月17日_R语言培训】153分钟学会【R】——刘思喆 邓一硕

现场

3000元(全日制学生2000元)

远程

3000元(全日制学生2000元)
上课地点:北京;中国人民大学 讲师:刘思喆 邓一硕 报名时间:2013-2-6 - 2014-1-31 开课时间:2014年1月17日至19日

培训时间:2014年1月17日-19日(3天)

培训地点:北京,中国人民大学

培训费用:3000元。(包含发票,讲义,教材,工作餐)

                全日制学生优惠价格2000元,不含发票。差旅及食宿费用自理。

授课安排:                 

(1) 授课方式中文多媒体互动式授课方式。

(2) 授课时间上 午9:00-12:00下午13:30-16:30(16:30-17:00答疑)

 

讲师介绍

 

刘思喆老师,中国人民大学统计学院科班出身,国内资深R领域专家,拥有10 R 语言使用经验,中国R 语言会议联合发起人。153 分钟学会R作者,《R reference card》译者。统计之都 理事会成员,R 语言版版主;电信、互联网、彩票行业资深数据挖掘专家。CSDN 大数据技术论坛、DATA World Forum、中国人民大学数据挖掘中心特邀讲师。

 邓一硕老师,中央财经大学统计学院科班出身,拥有6年R语言使用经验;《R语言书籍学习路线图》作者、《R金融时间序列分析常见问题集》整理者、《R in a nutshell》、《R Graphics cookbook》等书的译者;中国R语言会议理事、COS沙龙联合发起人;“统计之都”理事会成员、版主;主要兴趣是数据挖掘、计量经济学和金融投资分析。

R 语言简介

1997 年,R 语言在新西兰的奥克兰大学诞生,专注于统计计算和统计图形两大数据分析领域。经过十多年的发展,各项功能日趋成熟,活跃于数据分析的各个领域。保守估计,全球范围约有超过两百万的分析师、统计学家、数据科学家在应用R 语言,并通过这个平台在企业中创造价值或节约成本。这些企业其中包括MicrosoftGoogle Facebook 等,甚至一些大型的制药企业,例如PfizerJohnson&Johnson 等。

R 是一个世界范围统计工作者共同协作的产物,至2013 年2 月共计近5000 个包可在互联网上自由下载,这些都是各行业数据分析同行的工作结晶。

来自于2012 KDnugget 的数据分析、数据挖掘领域的公开调研显示,R 言是最流行的数据分析环境(语言),灵活的数据分析方式、开放的接口、成熟的协作社区是其成为数据分析领域最佳选择的三个重要的原因。

 

 

 

培训目的和特色

1. 通过三天对R 语言“系统” 学习,帮助学员了解并熟悉R 语言的应用技术,有效提高实际工作的效率;

2. 提供更加开阔的解决问题的数据手段;

3. 真实的案例:学员可以马上应用到实际工作当中。

2013 年被称为大数据元年,划时代的技术和应用层出不穷,数据分析从来没有如此的受到世人的关注。但令人惋惜的是,与之相适应的数据分析人才却远远没有形成足够的供给。更加让人遗憾的是数据分析并不是一蹴而就的速成技能,需要较长时间的积淀和领悟。因此在本次培训中,我将尝试以R 语言为主线,系统地讲授各类常用数据分析方法的原理、实现以及应用场景,帮助学员在最短的时间内了解甚至掌握相关技能。

课程大纲


 

1.1 R 语言历史和沿革0.5h
R 为什么是R
R 同其他商业数据分析软件相比优势在哪里?
荣誉及发展方向
1.2 相关资源介绍0.5h
国内和国际
学习轨迹及线路
商业支持
2.1基本概念0.5h

对象

工作空间

2 数据的基本操作0.5h
数据创建
读入与写出
选取、分割、变换
多文件
重复case
排序和秩
2.3 数学运算和矩阵运算0.5h
数学函数
矩阵运算
2.4 日期和字符0.5h
一般字符函数
正则表达式
时间处理
2.5 高级数据操作1h
隐式循环和显式循环
重编码
离散化和插补
长纵表转换
索引与合并
3.1 
提高你的工作效率2h
控制流
自编函数
获得网络公开数据
案例1:如何获取某电子商务网站商品相关信息数据
案例2:获取新浪微博信息
案例3:获取豆瓣电影信息
自动化报告
案例4:解放你的双手,三分钟完成分析报告

4.1 基础统计2h
描述统计
频数和交叉列联表
相关假设检验
案例1:假设检验的另类应用

案例2:假设检验在投资中的应用

5.1 统计模型及其他3h
对应分析主成份分析因子分析
聚类分析判别分析方差分析
多尺度分析生存分析
最小二乘回归广义线性回归
非线性回归分位数回归
时间序列蒙特卡洛模拟
AHP 层次分析法
案例1:对应分析
案例2:如何使用非线性回归对市场饱和度进行拟合
案例3:聚类在金融投资分析中的应用
案例4:蒙特卡洛在金融投资分析中的应用
6.1 统计绘图3h
基础图形
高级图形
图览
地图
动画

R 语言的图形非常绚丽,本部分将通过若干统计图形的例子来说明

如何

使用生动活泼的图形来解决严肃的问题。

7.1 高效编程1h
并行计算
优化算法
向量化
其他语言的调用

有再好的分析思路,程序跑不出来结果,无论怎样也是无用功!

7.2 代码规范0.5h

方便与同事的分享及复用

8.1 数据挖掘3h
数据库与R
分类(knn、决策树、支持向量机、随机森林等)
聚类(K 均值、层次聚类、模糊聚类等)
关联规则与协同过滤
案例分享1:如何识别企业的流失用户

案例2:基于hadoop的协同过滤算法
案例3:支持向量机在金融投资中的应用

9.1 文本挖掘1.5h
中文分词
tm 包的应用
主题的识别
案例分享1:新闻自动分类引擎的构建


 讨论和建议:
人大经济论坛计量版之R专版:
http://bbs.pinggu.org/forum-69-1.html

报名流程及咨询:
1.点击页面底部"我要报名"填写报名信息
2.交费.
(1)在此页面的左上角"交费信息",点击查看收款方式。
(2)或者在填写报名信息后,点"继续交费"可看到交费的相关信息。
3.联系我们,确认交费信息

曾老师
电话:13501012363  (010)68454276
QQ:493566698
 
交费后请通知我们,
工作时间周一至周五(8.30-17.30)请致电(010)68456523,
其它时间请发手机短信至13811729406(李老师),
请说明使用何种方式何时汇的款,以便及时处理,谢谢!
 

相关课程推荐:

 人大经济论坛-让数据更有意义!

 

现代数据分析同传统的数据分析理念有着巨大差异,很难想象:在数据如此丰富多样化的时代,一个不会编程的数据分析师能够轻松地胜任本职工作。R 语言以近乎完美的方式平衡了当前数据分析同程序开发的矛盾,兼顾了数据分析自身灵活性和运行效率,以及正式的和非正式的编程环境。