Python数据分析实践
Python数据分析实践
1000+ 人选课
更新日期:2025/05/20
开课平台学堂在线
开课高校北京联合大学
开课教师沈桂兰李玉霞薛云陈默
学科专业管理学工商管理类
开课时间2025/01/15 - 2025/07/22
课程周期27 周
开课状态开课中
每周学时-
课程简介

本课程主要讲解利用Python解决数据获取、数据处理和分析、数据可视化以及文本分析的相关内容。其中:

(1)数据获取部分在讲解http协议和网页构成元素的基础上,重点讲解如何使用requests库和beatifulsoup库编写爬虫抓取并解析数据,并介绍了如何使用正则表达式re库提高解析效率;

(2)数据处理和分析部分以numpy库和pandas库的用法为主线,介绍了在数据清洗、转化、整合等预处理工作的实现和描述性统计分析以及分组统计分析的实现;

(3)数据可视化部分介绍了如何使用matplotlib实现python-2D的可视化图表展示;

(4)文本分析部分,通过jieba的使用,对中文文本进行分词,去停用词等相关操作,提取关键词,利用wordcloud构建词云图

课程大纲
第1周 导论
1.0本章导学
1.1 什么是数据分析
1.2 数据分析的基本流程
1.3 数据分析的常用工具
1.4 数据分析常用类库
1.5 数据分析的开发环境
第2周 Python爬虫基础
2.0 本章导学
2.1 认识爬虫
2.2 爬虫组成及反爬虫措施
2.3 模拟请求抓取数据
2.4 解析数据
第3周 Python数据爬取实践
3.0 本章导学
3.1 中国A股相关数据获取实例
3.2 解析数据的存储
3.3 豆瓣读书TOP250的数据获取实例
3.4 正则表达式
3.5 人民网科技类新闻获取实例
第4周 Python数据分析基础
4.0 本章导学
4.1 Pandas及其数据结构
4.2 利用Pandas导入导出数据
4.3 Numpy及其数据结构
第5周 Python数据表分析
5.0 本章导学
5.1数据概览及预处理
5.2数据的描述性统计分析
5.3分组统计
5.4 数据表分析实践案例
第6周 可视化分析
6.0 本章导学
6.1 可视化分析概述
6.2 图表的常用设置
6.3图表绘制
6.4 可视化分析实践案例
第7周 数据分析案例
7.0 本章导学
7.1 对比分析及实践案例
7.2 趋势分析及实践案例
7.3差异化分析及实践案例
7.4相关性分析及实践案例
第8周 文本数据分析
8.0 本章导学
8.1 文本数据预处理
8.2 文本数据分析
8.3 生成词云图
8.4 文本数据分析实践案例
期末考试