自从1991 年诞生以来,Python 已经成为最受欢迎的动态编程语言之一,而且这种趋势还在上升(当然还有Perl、Ruby 等等)。许多人一开始接触Python 就爱上了这个语言,这其中也包括我。经常能够看到有网友在论坛里为了哪个软件更好用而争个不停,其实没有最好的软件,因为任何软件都有它的局限性,任何人心里的“最好”都是“合适自己使用”的代名词。所以我不会尝试说服你认为Python 是最合适科学计算和数据分析的工具。
不过包括麻省理工学院在内的国外很多高校,都已经选用Python 作为教学语言,更不用说越来越多的科研人员使用她来处理实验数据、制作图表,甚至开发科学计算应用程序。
其实我只是想告诉你,Python 是一个既人性化,又优雅,而且单纯的工具。不管你是熟练使用其他软件的程序员/数据分析师,抑或是编程小白,都可以轻松的掌握Python,并使用她进行数据处理和分析,这也是我们这次课程的根本目标——学以致用。
讲师介绍:
阎老师,长期从事数据分析的理论研究、教学和实践工作。
长期关注Python的发展和国内外各行业的应用情况,一直保持着与统计应用前沿的密切接触,在数据挖掘应用、市场研究应用等领域经验丰富。
擅长企业数据分析和企业诊断,参与多项国家级、省级课题的科研工作,曾任多家电商企业的运营顾问和培训师,积累了大量实战经验。
课程大纲:
01. 线性代数的实践
1.1 创建矩阵
1.2 矩阵的基本运算
1.3 解多元一次方程
1.4 判断正定矩阵
1.5 求解协方差矩阵
1.6 求相关系数矩阵
1.7 线性规划选址
02. 统计分析:回归模型探讨
2.1 线性回归拟合
2.2 广义线性回归拟合
2.3 Logit回归拟合
2.4 Robust回归拟合
2.5 分位数回归
2.6 岭回归
03. 统计分析:假设检验
3.1 T检验
3.2 单因素方差分析再探讨
3.3 重复抽样的单因素方差分析
3.4 多因素方差分析
3.5 单因素卡方检验
3.6 双因素卡方检验
04. 预测算法:回归模型的机器学习应用
4.1 机器学习数据概览
4.2 广义线性回归模型的机器学习应用
4.3 岭回归的机器学习应用
4.4 Logistic回归的机器学习应用
05. 分类算法:判别分析与聚类
5.1 决策树分类器
5.2 kmeans聚类算法及可视化表达
5.3 谱聚类及可视化表达
5.4 主成分分析
5.5 判别分析
0.6 时间序列分析
6.1 平稳性检验
6.1.1 自相关或偏相关系数的平稳性检验
6.1.2 ACF和PACF可视化展示
6.1.3 单位根检验
6.2 平稳时间序列模型预测
6.2.1 平稳时间序列分析
6.2.2 绘图判断残差正态性
6.2.3 平稳时间序列模型预测
6.3 非平稳时间序列处理
6.4 VAR模型
07. 绘图工具深入学习
7.1 Matplotlib绘图
7.1 1 Matplotlib基本设置
7.1.2 修改参数,移动坐标轴
7.1.3 添加文字注释
7.1.4 Matplotlib基本图形的绘制
7.2 Chart绘图
联系方式:
尹老师
电话:010-53352991
QQ:42884447
WeChat:yinyinan888