应用统计与R语言
应用统计与R语言
3万+ 人选课
更新日期:2025/05/14
开课时间2025/02/24 - 2025/06/16
课程周期16 周
开课状态开课中
每周学时-
课程简介

 在生活中,你每天都会接触大量的数据,他们会以图、表和数字等各种不同方式展示,当然你也希望透过这些数据获得一些背后的规律。比如,当你在某一个数据库中看到男女学者发表论文的数据时,你是否想去研究“学术圈真的有男女差异”吗?当你看到不同颜色出租车的车祸数据时,你是否想去探究出租车的颜色是否与行驶安全相关?或者通过一些数字的统计,你能否证明红楼梦是独著还是多人合著? 

 这些问题都是与统计相关的问题,通过本门课程的学习你将获得解决这些问题的方法。

  统计是一门收集、展示、分析和解释数据的学科。我们的课程不同于传统的数理统计课,只聚集于经典的统计推断和分析,而是以培养你利用统计解决实际问题的能力为核心,课程会系统讲授统计全过程中各个环节所涉及的内容,具体的包括:

  (1)数据的产生与收集:你将知道什么样的数据是好数据,好数据是统计分析的基础;

  (2)数据的展示:如何聪明的展示数据,简洁的说明规律或现象,对各种图表展现又将如何进行合理的解读;

  (3)统计推断:对于正态和非正态样本总体,你如何用手中的少量数据,获得总体的信息,证明或者解释某一个现象;

  (4)预测:利用变量间的关系,进行有效的回归或者分类;

  (5)R语言:R语言的基本操作、ggplot2进行图形展示、R统计推断,你将能利用R辅助解决实际问题。

  总体地,我们不仅关心数据的展示与统计分析,也关心数据的来源、以及统计在软件中的实现,这些在你解决实际问题时都会用到。

课程的内容新颖,具有强烈的时代特色,在统计推断与预测部分加入了非参数统计与统计学习的有关内容,该部分内容将帮助你以数据为出发点解决大数据分析和决策的相关问题;授课方式生动,在每个章节中都含有大量的案例,有许多案例都与你的生活相关,通过案例引入课程内容自然而又有趣,你也会更清楚如何利用统计去解决问题。

课程大纲
生活中的统计
1.1t课程简介
1.2t什么是统计?
1.3t统计是如何解决问题的?
1.4t为什么要学统计?
数据的产生与收集
2.1数据的产生与收集概述
2.2数据收集的方式
2.3如何获得好的抽样数据(理想环境)?
2.4如何获得好的抽样数据(实际情形)?
描述性统计和数据可视化
3.1描述性统计和数据可视化概述
3.2数字描述——数值变量的分布
3.3图表描述——单个变量的分布
3.4图形描述——数值变量的关系
3.5数据可视化与ggplot2
R语言入门
4.1R语言基本语法
4.2Dataframe简介
4.3R语言的读和写
4.4ggplot2绘图
统计推断基础
5.1统计推断概述
5.2概率复习
5.3两个重要的统计量
5.4几个重要的分布
5.5抽样分布定理
5.6非正态大样本数据的渐近性质
参数估计
6.1参数估计概述
6.2点估计
6.3点估计的评价标准
6.4区间估计
假设检验(一)
7.1假设检验的基本概念
7.2假设检验的基本原理
7.3单个正态总体均值的假设检验(1)
7.4单个正态总体均值的假设检验(2)
7.5多个正态总体均值的假设检验
假设检验(二)
8.1正态总体方差的假设检验
8.2大样本非正态总体的参数检验
8.3正态性评估(一)
8.4正态性评估(二)
8.5统计推断的R实现
相关性与预测
9.1相关性与预测概述
9.2类别变量的相关性
9.3预测的基本模型
9.4一元线性回归
9.5多元线性回归
9.6逻辑回归
9.7预测的R实现
非参数估计
10.1非参数估计概述
10.2分布函数的估计
10.3非参数估计与bootstrap
10.4非参数区间估计