近期现场/远程培训 Python师资培训-文本分析遇见AI 2024 new
近期专题培训 2024DID专题丨深度解析顶刊中的DID刊文趋势与模型应用
培训时间:2014年1月17日-19日(3天)
培训地点:北京,中国人民大学
培训费用:3000元。(包含发票,讲义,教材,工作餐)
全日制学生优惠价格2000元,不含发票。差旅及食宿费用自理。
授课安排:
(1) 授课方式:中文多媒体互动式授课方式。
(2) 授课时间:上 午9:00-12:00,下午13:30-16:30(16:30-17:00答疑)
讲师介绍
刘思喆老师,中国人民大学统计学院科班出身,国内资深R领域专家,拥有10 年R 语言使用经验,中国R 语言会议联合发起人。《153 分钟学会R》作者,《R reference card》译者。“统计之都” 理事会成员,R 语言版版主;电信、互联网、彩票行业资深数据挖掘专家。CSDN 大数据技术论坛、DATA World Forum、中国人民大学数据挖掘中心特邀讲师。
邓一硕老师,中央财经大学统计学院科班出身,拥有6年R语言使用经验;《R语言书籍学习路线图》作者、《R金融时间序列分析常见问题集》整理者、《R in a nutshell》、《R Graphics cookbook》等书的译者;中国R语言会议理事、COS沙龙联合发起人;“统计之都”理事会成员、版主;主要兴趣是数据挖掘、计量经济学和金融投资分析。
R 语言简介
1997 年,R 语言在新西兰的奥克兰大学诞生,专注于统计计算和统计图形两大数据分析领域。经过十多年的发展,各项功能日趋成熟,活跃于数据分析的各个领域。保守估计,全球范围约有超过两百万的分析师、统计学家、数据科学家在应用R 语言,并通过这个平台在企业中创造价值或节约成本。这些企业其中包括Microsoft、Google 和Facebook 等,甚至一些大型的制药企业,例如Pfizer、Johnson&Johnson 等。
R 是一个世界范围统计工作者共同协作的产物,至2013 年2 月共计近5000 个包可在互联网上自由下载,这些都是各行业数据分析同行的工作结晶。
来自于2012 年KDnugget 的数据分析、数据挖掘领域的公开调研显示,R 语言是最流行的数据分析环境(语言),灵活的数据分析方式、开放的接口、成熟的协作社区是其成为数据分析领域最佳选择的三个重要的原因。
培训目的和特色
1. 通过三天对R 语言“系统” 学习,帮助学员了解并熟悉R 语言的应用技术,有效提高实际工作的效率;
2. 提供更加开阔的解决问题的数据手段;
3. 真实的案例:学员可以马上应用到实际工作当中。
2013 年被称为大数据元年,划时代的技术和应用层出不穷,数据分析从来没有如此的受到世人的关注。但令人惋惜的是,与之相适应的数据分析人才却远远没有形成足够的供给。更加让人遗憾的是数据分析并不是一蹴而就的速成技能,需要较长时间的积淀和领悟。因此在本次培训中,我将尝试以R 语言为主线,系统地讲授各类常用数据分析方法的原理、实现以及应用场景,帮助学员在最短的时间内了解甚至掌握相关技能。
课程大纲
1.1 R 语言历史和沿革0.5h R 为什么是R R 同其他商业数据分析软件相比优势在哪里? 荣誉及发展方向 1.2 相关资源介绍0.5h 国内和国际 学习轨迹及线路 商业支持 |
2.1基本概念0.5h
包 对象 工作空间 2 数据的基本操作0.5h数据创建 读入与写出 选取、分割、变换 多文件 重复case 排序和秩 2.3 数学运算和矩阵运算0.5h 数学函数 矩阵运算 2.4 日期和字符0.5h 一般字符函数 正则表达式 时间处理 |
2.5 高级数据操作1h 隐式循环和显式循环 重编码 离散化和插补 长纵表转换 索引与合并 3.1 提高你的工作效率2h 控制流 自编函数 获得网络公开数据 案例1:如何获取某电子商务网站商品相关信息数据 案例2:获取新浪微博信息 案例3:获取豆瓣电影信息 自动化报告 案例4:解放你的双手,三分钟完成分析报告 |
4.1 基础统计2h 案例2:假设检验在投资中的应用 |
5.1 统计模型及其他3h 对应分析主成份分析因子分析 聚类分析判别分析方差分析 多尺度分析生存分析 最小二乘回归广义线性回归 非线性回归分位数回归 时间序列蒙特卡洛模拟 AHP 层次分析法 案例1:对应分析 案例2:如何使用非线性回归对市场饱和度进行拟合 案例3:聚类在金融投资分析中的应用 案例4:蒙特卡洛在金融投资分析中的应用 |
6.1 统计绘图3h 基础图形 高级图形 图览 地图 动画 R 语言的图形非常绚丽,本部分将通过若干统计图形的例子来说明– 如何 使用生动活泼的图形来解决严肃的问题。 |
7.1 高效编程1h 并行计算 优化算法 向量化 其他语言的调用 有再好的分析思路,程序跑不出来结果,无论怎样也是无用功! 7.2 代码规范0.5h方便与同事的分享及复用 |
8.1 数据挖掘3h 案例2:基于hadoop的协同过滤算法 |
9.1 文本挖掘1.5h 中文分词 tm 包的应用 主题的识别 案例分享1:新闻自动分类引擎的构建 |
讨论和建议:
人大经济论坛计量版之R专版:
http://bbs.pinggu.org/forum-69-1.html
报名流程及咨询:
1.点击页面底部"我要报名"填写报名信息
2.交费.
(1)在此页面的左上角"交费信息",点击查看收款方式。
(2)或者在填写报名信息后,点"继续交费"可看到交费的相关信息。
3.联系我们,确认交费信息
现代数据分析同传统的数据分析理念有着巨大差异,很难想象:在数据如此丰富多样化的时代,一个不会编程的数据分析师能够轻松地胜任本职工作。而R 语言以近乎完美的方式平衡了当前数据分析同程序开发的矛盾,兼顾了数据分析自身灵活性和运行效率,以及正式的和非正式的编程环境。