课程简介
数据是信息时代的“新能源”。从金融到零售,从电商到体育,数据科学都成为成功决策的基础,广泛应用在营销优化、风险控制、客户关系等商业领域。 【CDA数据分析周末集训班-python方向】以CDA数据分析师标准等级大纲要求出发,从数据获取(Python爬虫、Mysql数据库)—统计学理论方法—数据分析与软件应用(Python)—数据挖掘和机器学习(Python)—数据可视化(Matplotlib,Seaborn等)整套数据分析流程技术系统讲解,还将结合量化投资、金融、银行、电信等行业真实需求出发全部用实际案例教学来使所学项目课程更能符合企业要求。
学习目标
使用Python爬虫获取网络数据,使用Mysql进行数据的存储和查询
掌握数据分析基础理论和常用分析法,使用统计分析方法进行验证
结合机器学习方法进行预测并清晰传达你的洞察
使用可视化方法Matplotlib,Seaborn,Pyecharts等发现数据中的模式规律
掌握使用Python进行数据分析全流程
学习对象
学生、转行欲从业人士
在职数据分析师
对Python数据分析和挖掘感兴趣的业界人士
学习前有统计基础**
课程大纲
**阶段:Python编程基础与Pandas数据分析(线下)
1.数据分析的武器库
2.数据分析工具Python介绍
3.Python的基本数据类型与数据结构
4.Python的程序控制
5.Python的函数与模块
6.使用Pandas读取结构化数据
7.描述性统计与探索型数据分析
8.Pandas高级:分组汇总及交叉表
9.使用Python绘制统计图形
10.Pandas数据整合与数据清洗
第二阶段:Mysql数据库基础(线上)
1.Mysql数据库知识介绍
2.Mysql数据库的基本操作
3.Mysql数据表的基本操作
4.数据类型和约束条件
5.数据的CRUD操作之增加、删除、修改数据表
6.SQL数据库单表查询和联合查询
7.SQL操作符和函数
8.SQL综合案例:彩票数据核对练习
9.SQL综合案例:电商数据查询练习
第三阶段:数据分析之统计学基础(线上)
1.数据分析行业与知识简介
2.概率论基础知识
3.描述性统计分析
4.统计量与抽样分布
5.参数估计:点估计和区间估计
6.假设检验方法
7.方差分析的基本原理和操作
第四阶段:使用Python进行网络爬虫(线下)
1.网络爬虫基础知识
2.网络请求及响应-requests库
3.HTML文档解析-BeautifulSoup库
4.常见反爬虫机制及应对
5.网络爬虫 VS 网络数据抓取
6.实战1:批量**头像
7.实战2:抓取豆瓣书籍简介
8.实战3:模拟浏览器selenium抓取电商商品信息及评论
第五阶段:Python进行统计分析和回归分析(线下)
1.使用Python SQL进行数据整合
2.使用Python进行描述性统计分析
3.使用Python进行数据清洗
4.使用Python进行数据分组与抽样
5.使用Python进行统计推断
6.使用线性回归做客户价值预测
7.使用逻辑回归构建初始信用评级
8.案例1:RFM分析方法获取客户消费行为信息
9.案例2:转化漏斗与A/B Test
第六阶段:Python进行降维分析(线下)
1.连续变量关系和探索变量压缩:主成分因子分析
2.对应分析方法
3.多维尺度分析方法
4.案例1:经济数据降维与聚类分析
5.案例2:用户特征与消费行为对应分析
6.案例3:美国城市地理位置分析
7.案例4:iris数据聚类-结合降维与数据预处理
第七阶段:Python时间序列和综合案例分析(线下)
1.时间序列分析简介
2.时间序列模型介绍-AR和MA
3.平稳的时间序列模型-ARMA
4.非平稳的时间序列模型-ARIMA
5. BOX-JENKINS建模流程
6.案例:量化投资行业时间序列分析
7.寻找**模型
8.干预分析模型-ARMAX
9.企业案例1:电信公司网络咨询电话呼入人数预测
10.企业案例2:Google 关键字之Python 趋势预测
第八阶段:Python数据可视化(线上)
1.绘图思想的基本原理
2.Python数据可视化包-Matplotlib介绍
3.使用Matplotlib进行基本的图形绘制
4.使用Python数据处理包Pandas做可视化
5.Python数据可视化包-Seaborn与图形绘制
6.Python数据可视化包-Pyecharts与图形绘制
7.使用Python进行地图绘制-Pyecharts
第九阶段:期中项目作业与答辩(线下)
课题1:电商客户价值预测
课题2:网站流量数据分析
课题3:信用卡客户流失预警
课题4:银行电话营销响应分析
以上课题仅供参考
第十阶段:Python数据挖掘基础及数据前处理技术(线下)
1.R语言数据挖掘简介
2.数据挖掘方法论CRISP-DM介绍
3.数据挖掘技术概述
4.数据前处理方法
5.关键变量发掘技术
第十一阶段:Python实现预测型数据挖掘技术(线下)
1.初级分类器KNN算法与Python实现
2.朴素贝叶斯分类算法原理与实现
3.决策树建模思路与原理
4.高级分类器-支持向量机算法
5.神经网络算法原理与实现
6.集成学习:Bagging、Boosting、随机森林
7.案例1:使用决策树进行初始信用评级
8.案例2:使用神经网络预测销量高低
9.案例3:使用支持向量机进行水色图像的水质评价
第十二阶段:Python进行描述性数据挖掘技术(线下)
1.聚类算法的概述
2.聚类算法基本概念
3.案例:通信客户业务使用偏好聚类
4.关联规则的一些基本概念
5.关联规则Ariori算法的原理与Python实现
6.关联规则FP-growth算法
7.序列模式的简介与概念
8.序列模式AprioriAll算法与Python实现
9.基于用户和商品的的协同过滤算法
第十三阶段:期末项目作业与答辩(线下)
课题1:银行客户聚类分析
课题2:房贷客户进件违约风险预测
课题3:零售业客户忠诚预测
课题4:电信业营销响应预测模型
以上课题仅供参考
**认证
** 经管之家CDA LEVELⅢ数据科学家认证证书,行业顶尖人才认证,已获得IBM大数据大学,中国电信,苏宁,德勤,猎聘,CDMS等企业的认可。
专业 CDA认证是根据商业数据分析专业岗位设立的一套体系化、科学化、正规化的人才标准。全国统考、专家命题、评分公平、流程严格,更具含金量。
权益 持证人享有系列特殊权益。证书皆绑定考生真实身份,可在CDA**查询,确保唯一性与防伪性。证书三年审核一次,保证持证人的实力与权益。
CDA数据分析师简介CDA(CertifiedDataAnalyst),亦称“CDA数据分析师”,指在互联网、零售、金融、电信、医学、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、提...
秦淮校区: 南京秦淮区