-
第一章 大数据基本概念与应用案例
大数据基本概念与应用案例
-
●1.1基本概念、应用案例
大数据基本概念以及大数据在国内外的应用案例。
-
第二章数据获取
数据获取
-
●2.1格式转换与数据清洗
通过工具对数据进行格式转换与数据清洗。
-
●2.2网页获取
通过八爪鱼采集器软件来获取网页信息。
-
第三章数据分析入门
数据分析入门
-
●3.1Weka简介与数据预处理
介绍Weka与演练添加删除属性与离散化操作。
-
●3.2 数据分类
演练数据分类操作。
-
●3.3数据聚类
演练数据聚类操作。
-
●3.4数据关联
通过简单实例分析Apriori算法的执行过程。
-
●3.5选择属性
对于不同的属性,它们在样本空间的权重是不一样的,即它们与类别的关联度是不同的,因此有必要筛选一些属性或者对各个属性赋一定的权重,我们搜索数据集中全部属性的所有可能组合,找出预测效果最好的那一组属性。
-
●3.6数据可视化
数据可视化是以图形或表格的形式展示信息。
-
第四章数据分析进阶
数据分析进阶
-
●4.1贝叶斯网络
贝叶斯网络是表示不确定性知识和推理问题的流行方法之一。
-
●4.2神经网络
神经网络是一种模仿生物神经网络结构和功能的数学模型或计算模型。
-
●4.3时间序列分析及预测
时间序列分析是使用统计技术来建立模型并解释一个随时间变化的一系列数据点的过程,而时间序列预测是在已知过去事件的基础上,使用模型对未来事件进行预测的过程。
-
第五章TABLEAU数据可视化
TABLEAU数据可视化
-
●5.1TABLEAU概述与入门
TABLEAU概述与入门
-
●5.2初级可视化分析(一)
初级可视化分析(一)
-
●5.3初级可视化分析(二)
初级可视化分析(二)
-
●5.4地图分析
地图分析
-
●5.5高级数据操作(一)
高级数据操作(一)
-
●5.6高级数据操作(二)
高级数据操作(二)
-
●5.7分析图表整合
分析图表整合
-
●5.8案例(一)
案例(一)
-
●5.9案例(二)
案例(二)
-
●5.10案例(三)
案例(三)
-
●5.11案例(四)
案例(四)
-
●5.12案例(五)
案例(五)
-
●5.13案例(六)
案例(六)
-
第六章数据分析拓展
数据分析拓展
-
●6.1引言
引言
-
●6.2k-最近邻算法(K-NN)一
k-最近邻算法(K-NN)一
-
●6.3k-最近邻算法(K-NN)二
k-最近邻算法(K-NN)二
-
●6.4支持向量机(SVM)一
支持向量机(SVM)一
-
●6.5支持向量机(SVM)二
支持向量机(SVM)二
-
●6.6Logistic回归(LR)
Logistic回归(LR)
-
●6.7随机森林算法(RF)
随机森林算法(RF)
-
●6.8模型性能评估(一)
模型性能评估(一)
-
●6.9模型性能评估(二)
模型性能评估(二)
-
第七章数据思维
数据思维
-
●7.1数据分析基础
数据分析基础
-
●7.2数据分析思维、过程和方法
数据分析思维、过程和方法