首页论坛企业培训学习券付款方式金融培训软件培训(Peixun.net)
人大经济论坛-Peixun.Net
统计软件培训班
全国-CDA数据分析师现场培训
 
北京CDA数据分析师Level I 培训
远程CDA数据分析师Level I 培训
北京CDA数据分析员培训
远程CDA数据分析员培训
太原CDA数据分析师培训
成都CDA数据分析师培训
武汉CDA数据分析师培训
长沙CDA数据分析师培训
【北京_1月_HLM培训】HLM多层线性模型初级+进阶
课程导航
 
视频培训班大全
近期现场班
新上线课程
课程促销
名师课程系列
现场培训
 
【北京_12月_R计量培训】R语言的计量经济学应用
【北京_12月_Python培训】Python量化投资
【北京_1月_Stata培训】Stata初级班
【北京_1月_Stata培训】Stata高级班
【北京_1月_SPSS培训】SPSS市场调查:问卷设计与数据分析
【北京_1月_R培训】R数据挖掘与机器学习基础班
【北京_1月_R培训】R数据挖掘与机器学习高级班
【北京_3月5日_CDA数据分析师Level I 系统培训(第15期】系统认证培训,颁发证书!
CDA大数据分析分析师
近期现场培训
Stata视频班
 
Stata论文专题视频课程
Stata初级班
Stata高级班
Panel Data专题A
计量经济学理论-视频班
 
计量经济学理论与应用—基础班
计量经济学理论与应用—高级班
SPSS视频班
 
SPSS初级班
SPSS高级班
SPSS视频课程—张文彤主讲
 
SPSS初中级视频课程—张文彤主讲
SPSS高级视频课程—张文彤主讲
SPSS数据挖掘与实战案例分析视频课程---张文彤主讲
SAS视频班
 
SAS初级班(升级版)
SAS初级班
SAS中级班(应用班)
SAS高级班(建模班)
SAS数据处理与ORACLE数据库交互
SAS数据挖掘专题
SAS/IML视频课程
SAS BASE 认证培训
SAS Advance认证培训
SAS金融数量分析技术
SPSS+SAS认证视频课程促销活动
EViews视频班
 
EViews6.0计量经济与时间序列分析班
Matlab视频班
 
Matlab基础班
Matlab蒙特卡洛应用班
Matlab数据库应用班
Matlab金融数量分析
matlab-exlink-excel
R视频班
 
R初级班
R高级班
R—时间序列专题(初级班)
R—时间序列专题(中级班)
R—时间序列Rolling分析专题
R—时间序列:多元波动率专题
R—时间序列:案例集_股指期货
Excel视频班
 
EXCEL函数应用班
Excel-数据分析与决策
Excel2013初级教程
结构方程视频班
 
AMOS论文攻略(中高级)
AMOS论文攻略(基础班)
AMOS基础班
AMOS高级班
Lingo视频班
 
Lingo统计软件培训班
Minitab视频班
 
Minitab应用班
Gauss视频班
 
Gauss应用班
Mathematica培训班
 
Mathematica初级班
大数据
 
Python初级班
Python高级班
Hadoop大数据分析师视频班
数据库
 
SQL Server 2008 初中级教程
SQL Server 2008 高级教程
MySQL初级视频教程
PPT视频班
 
PPT初中级培训班
教学课件PPT制作案例班
BI视频班
 
BI基础班
统计从业资格考试
 
统计基础知识与统计实务
统计法基础知识
历届现场班
 
【Stata】实证论文专题现场班
【北京_5月1日_R培训】R语言统计计量无忧班
【北京_AMOS培训】AMOS论文攻略—张伟豪
【计量经济学现场培训】应用计量经济学理论与应用
【北京_Matlab培训】Matlab初中级+高级—谢中华/郑志勇
【北京_SAS培训】SAS数据分析及应用—杨群
【SPSS现场培训】SPSS统计分析及应用(论文专题)
【北京_R培训】R基础+高级应用班—方匡南
【北京_12月_R计量培训】R语言的计量经济学应用
【R现场培训】方匡南—R基础及提高班(上海)
【MATLAB现场培训】MATLAB基础及金融数量分析技术
【北京_5月1日_数据挖掘培训】 数据挖掘实战应用
数据挖掘分析与实践
【北京_SPSS培训】25个案例玩转SPSS—张伟豪
【上海_SAS培训】SAS实务案例应用班—杨群
【EViews北京】EViews应用提升班
【北京_5月24日_SAS EG培训】SAS业务分析师权威认证
【R培训】用R秒杀统计计量问题
现场班套餐组合优惠
【北京_5月31日_Minitab培训】Minitab初中级培训
【北京_3月_R培训】R语言数据挖掘实战
北京:SPSS暑期特训班——张文彤
EViews 7计量经济与时间序列分析——张晓峒
上海_5月31日_SPSS数据分析与挖掘实战案例班——张文彤 钟云飞
【上海_7月11日_ Matlab培训】 Matlab初中级现场培训---王小川
广州:SPSS统计分析高级培训班----张文彤
上海:SPSS统计分析高级培训班----张文彤
Excel高效数据分析之道——韩小良
【北京_1月17日_R语言培训】153分钟学会【R】——刘思喆 邓一硕
【北京_12月30日_SAS金融培训】SAS 金融投资应用与实战
【北京_1月18日_R论文培训】学术论文写作与R实践
AMOS培训】AMOS论文攻略—张伟豪
【上海_8月16日_R培训】R语言初中级实战应用培训----肖凯
【北京_1月11日_SAS培训】SAS数据统计分析师培训
【北京_12月14日_SPSS培训】数据统计分析师认证培训
【上海_R培训】R经典案例应用班—方匡南
网络舆情分析师研修班
SAS统计分析现场培训——胡良平主讲
【名师系列】【SPSS/EXCEL/R/Matlab】
春季名师培训课堂
《项目数据分析师认证培训》@北京
当前选择: Hadoop大数据分析师视频班 
主讲教师: 曹正凤 
学费: 3500 
上课时间: 随报随学  
上课地点: 下载到本地计算机观看  
报名开始时间: 随报随学  
报名结束时间: 随报随学  
详细说明:

大数据,一个热的发烫、众人论调词眼。一波又一波新的资讯浪潮袭来,至于它到底有什么内涵、将会如何影响我们、又要把我们冲到哪里去……即便看过许多炫目的报导,晓得它有许许多多的应用实例,威力无穷,但对大多数人来说,不免都把巨量数据视为一种新颖的科技问题,是属于硬体配置或软体设计的技术问题,不是一般人能够驾驭的。




  我们就好像在看一场精采的马戏团表演,看得好热闹,却看不出门道来。

    而Hadoop大数据分析课程给你的就是 把握时代脉博,掌握大数据时代前沿。

    能深入实际的项目案例进行大数据的实战开发;达到大数据分析师的理论和实战要求。


《CDA-Hadoop大数据分析师》第二期


课程介绍:

   本课程以大数据分析师为目标,从数据分析基础、JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境,详细演示hadoop三种模式的安装配置,以案例的形式,重点讲解基于mahout项目的大数据分析之聚类、分类以及主题推荐。区别于普通的JAVA程序员,本课程的重点是培养基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。从入门知识学起的课程体系设计和面向大数据分析师的培训理念,引导学员一步步深入学习,适合零基础学员从零学起。

 

讲师介绍:

曹正凤

软件工程专业硕士,统计学专业博士,具有多年的JAVA程序设计和统计教学经验,人大经济论坛CDA金牌讲师,研究方向为数据挖掘领域的前沿算法研究,包括随机森林算法、神经网络等内容,发表多篇论文,且发表的EI核心收录论文受到多次检索。目前致力于大数据分析前沿领域研究,主持人大经济论坛基于hadoop架构的论坛主题推荐系统项目,参与《大数据背景下基于中国烟草消费需求的供给结构分析研究》、《基于数据整合的空气质量测度方法研究》等大数据项目,并和中国人民大学院大数据中心、厦门大学大数据中心、台湾辅仁大学大数据中心有密切的联系。

培训内容目录:

(一)基础理论部分

1.数据分析基础

(1)数据分析过程概述

(2)概率论与数理统计介绍

(3)抽样估计与假设检验

(4)方差分析与回归分析


 

2.java基础

(1)JDK的安装配置,Java基本知识、数据类型以及基本语法

(2)Eclipse的编程入门

(3)面向对象的思想基本介绍,类、对象、接口、封装、继承

(4)Java的集合类——数组、Set、List、Map、Queue

(5)异常处理——CheckedException、Unchecked Exception,如何通过异常信息捕获错误

(6)Java的垃圾回收机制以及多线程简介

(7)Java的文件操作、包的概念及如何打包

(8)数据库基础知识及SQL语法

(9)基于servlet技术的B/S应用开发及代码实现案例详解


 

3.linux基础

(1)linux的介绍

(2)Linux入门:选择合适的Linux发行版、如何安装Linux

(3)linux操作系统命令及使用命令编辑文件

(4)Linux下SSH命令使用方法详解


 

(二)hadoop理论课程

1.hadoop安装配置及运行机制解析

该内容是大数据分析的环境搭建课程,偏重于上机操作,主要讲述基于unbuntu的hadoop的单机模式和伪分布模式安装和配置过程,以及在linux集群上安装和配置hadoop集群的过程。对于不熟悉的unbuntu等 linux操作系统的学员,课程中会通俗易懂地引导他们了解常用的命令,实现零基础的进阶。通过讲师手把手、面对面的交流,教会学员自己搭建一个真实的基于hadoop的大数据分析环境,并在三种环境下运行hadoop自带的小程序,引导学员了解数据分析的基本思想。主要内容包括:

(1)介绍分布式系统设计的基本思想

(2)介绍Hadoop 概念、版本、历史

(3)详细讲解Hadoop 单机、伪分布及集群模式的安装配置过程和内容

(4)使用蒙特卡罗法求π值的案例分析比较hadoop三种模式的运行效率,并剖析数据分析的基本思想

(5)介绍如何通过命令行和浏览器观察hadoop的运行状态

(6)介绍hadoop的安全模式

(7)介绍如何查看hadoop 运行的日志信息


 

2.Hadoop分布式文件系统深入剖析

对hadoop架构的分布式文件系统HADFS进行深入的分析,hdfs是hadoop架构的基础,它是hadoop的核心内容之一。主要的内容包括:

(1)介绍google的GoogleGFS 文件系统,一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。

(2)HDFS的概念及设计

(3)Hdfs体系结构及运行机制详述

(4)NameNode、DataNode、SecondaryNameNode的作用及运行机制

(5)block 的划分原理、存储方式和配置文件

(6)hdfs的备份机制和文件管理机制

(7)HDFS文件系统的常用命令

(8)使用命令及JAVA语句操作hdfs中的文件


 

3.MapReduce理论及实战

(1)介绍google的MapReduce编程模型

(2)hadoop中的MapReduce工作原理

(3)通过演示单词计数程序,详细讲述mapreduce运行过程中类的调用过程

(4)详细讲述如何覆盖 Mapper 功能、如何覆盖 Reducer 功能。

(5)MapReducejob的生命周期中job提交、task分发和task执行

(6)MapReduce中block 的调度及作业分配机制

(7)基于MapReduce模型的wordcount运行详解

(8)基于MapReduce模型的三个初级案例:数据去重、数据排序和求平均成绩

(9) 基于MapReduce模型的高级案例,详细介绍如何在eclipse中编写MapReduce程序,打包成可在hadoop上运行的jar,并在集群上运行


 

4.hbase理论及实战

(1)Hbase简介,包括HBase的基础概念 、数据模型、存储模型

(2)hbase的伪分布和集群的安装及配置

(3)一个例子讲解hbase shell常用的操作命令


 

5.hadoop生态环境介绍

(1)ZooKeeper简介,包括ZooKeeper的安装、运行及示例

(2)Pig简介,包括Pig的安装、运行及示例

(3)Hive简介,包括Hive的安装、运行及示例

(4)sqoop简介,包括Sqoop介绍、命令、原理及流程


 

(三)大数据分析思想、工具及实战案例

1.大数据分析思想介绍

(1)大数据的时代背景

(2)大数据分析的思维转变

(3)几种典型的大数据架构分析

(4)大数据时代的数据分析思想的变革


 

2.Mahout,大数据分析的利器

Mahout 是 Apache SoftwareFoundation(ASF)旗下的一个开源项目,它通过和hadoop配合,实现在推荐、聚类和分类等领域中的大数据分析。

(1)Mahout的下载、安装与部署

(2)Mahout之分类算法:logstic算法(SGD)与朴素贝叶斯算法(new bayes)详解

(3)使用UCI经典数据集--20Newsgroups数据集进行朴素贝叶斯算法大数据分析之分类实战演练

(4)Mahout之聚类算法:Kmeans算法与canopy算法详解

(5)使用UCI经典数据集--质量管理数据集进行canopy算法和Kmeans算法的大数据分析之聚类实战演练

(6)Mahout之主题推荐算法:基于物品或用户的推荐算法

(7)使用基于物品的推荐算法实现基于大数据分析的电影推荐系统


 

3.RHadoopR语言从小数据分析到大数据分析的化丽转身

(1)R语言简介

(2)安装并运行RHadoop

(3)RHadoop的逻辑结构

(4)Rhadoop实战案例—wordcout


 

4.三个真实的大数据分析案例

1)人大经济论坛日志分析,介绍日志分析的相关知识,以及人大经济论坛现在的日志管理现状,设计并实现适合人大经济论坛的基于hadoop架构的大数据日志分析系统,手动编写日志分析MapReduce程序,并在集群环境下运行自已的jar文件,实现从零起步到hadoop架构,直到实际的大数据分析真实案例的飞跃。


 

2)基于旅游点评网站的文本挖掘,介绍文本挖掘的相关知识,使用网页爬虫抓取旅游点评网站的实际数据,实现数据的清洗和预处理,制定定时更新机制,并尝试使用手动编程实现MapReduce程序,在hdfs上运行和处理采集的数据,真正参与基于实际项目的大数据分析过程。


 

3)基于Mahout的人大经济论坛主题推荐,介绍推荐系统和汉字主题推荐涉及的文本挖掘等相关知识,以及人大经济论坛主题推荐的项目背景,项目的需求分析以及基于hadoop+Mahout算法模型和系统架构设计解析,利用Mahout提供的主题推荐算法解决人大经济论坛的主题推荐。

 

购买流程
1.点击页面底部我要报名,在线填写报名信息
2.按页面左上角“付款方式”说明付款
3.通知我们,发送课程到邮箱
 
报名咨询
曾老师
手机:13501012363
电话:(010)68472925 
QQ:  28819897152881989715
邮箱: training@pinggu.org
 
交费后请通知我们,
工作时间周一至周五(8:30-17:30)请致电(010)68472925,
其它时间请发手机短信至13501012363(曾老师)
请说明使用何种方式何时汇的款,以便及时处理,谢谢!


 

 

 
我要报名

咨询电话:(010)68472925 京icp备05006052号 主办单位:人大经济论坛

友情链接:英语作文 | 数据分析师 | matlab技术论坛 | spss培训 | spss教程 | Matlab教程