本课程是以大数据时代为背景,研究如何针对大数据进行获取、预处理、分析、可视化和挖掘建模的方法,是数字经济和社会活动中运用广泛的学科之一。
课程着重介绍重点介绍基于Python语言大数据分析与挖掘方面的应用技巧,内容主要包括大数据分析基础知识、Python科学计算、数据处理、挖掘建模等基本理论知识。通过该课程的学习,要求学生掌握大数据分析与挖掘相关的基本理论和方法,学会针对大数据进行采集、清洗、预处理、可视化、建模和预测等技巧,培养学生良好的数据敏感性与分析处理能力。
1.了解Python的安装及界面基本使用技能、Numpy、Pandas库及Matplotlib中的pyplot、Scikit-learn包及相关模块等的导入使用;
2.理解Python基本数据结构和方法的使用及循环、条件语句的应用;
3.理解数组的创建、切片、连接、存取、排序及数组连接、排序、搜索等相关知识技能;
4.理解利用Matplotlib中的pyplot模块绘图的基本流程及原理;
5.理解关联规则的基本概念布尔数据集转换及布尔关联规则挖掘的基本概念与程序实现方法;
6.掌握数据框和序列相关方法的灵活应用,数据框、序列、数组、列表之间的相关转换及运用;
7.掌握利用Matplotlib中的pyplot模块绘制散点图、线性图、柱状图、直方图、饼图、箱线图和子图的方法,以及中文字符的显示、横轴字符刻度和子图的布局排列;
8.掌握均值、中位数、最频繁值的缺失值填充策略,均值-方差、极差数据规范化或标准化,主成分分析降维及综合评价,线性回归、神经网络非线性回归预测,逻辑回归、神经网络、支持向量机分类,K-mean聚类的程序实现及案例应用。
1.本课程主要适用于全国高等院校数据科学与大数据技术、计算机科学与技术、人工智能、经济统计学、金融、物流、管理等理工科和商科专业管理的本专科生进行学习;
2.本课程也可用于对大数据分析知识、数据分析工程师等感兴趣的社会人士进行学习。

