-
第一章数据与统计
在工作、生活、学习中,“统计”这一术语并不陌生,尤其,大数据时代的到来,似乎随时都会接触到各类统计数据、统计图表,也需要搜集、处理、分析和使用各类统计数据,统计已经渗入到社会经济生活的每个角落。统计到底有多么大的魅力能够无处不在?你能说清楚什么是“统计”吗? 请进入第一章数据与统计,感知统计现象,掌握统计专业基本术语和统计数据界定,从而感受统计魅力,了解统计数据,更加客观、科学地判断统计现象。
-
●1.1 统计的初步认知
在日常生活中,我们每天都会从报纸、新闻、网络、书籍中碰到各式各样的数据。在这些消息、报道、报告中,涉及大量的统计数据。而只有正确理解这些统计数据,才能真正读懂这些新闻、消息和报道。可见,统计数据与我们的日常生活息息相关,不管你愿不愿意,你总要和各种统计数据打交道,这是信息时代的一个重要特征。
-
●1.2统计分析的逻辑理念
理论结合适当的方法得到相应的统计结论
-
●1.3课程内容设置
了解48课时统计学学习内容
-
●1.4统计的概念界定
掌握统计的三种定义两重关系
-
●1.5统计的分类
统计分为描述统计和推断统计
-
●1.6统计学的基本术语
描述统计:总体、单位、标志、指标
推断统计:总体、样本、参数、统计量 -
●1.7统计的应用
了解统计在经济管理领域的应用范畴
-
●1.8常用的统计软件
了解经济管理领域常见的统计应用软件,尤其需要掌握Excel、Spss的应用
-
第二章统计数据的搜集、整理与展示
在了解统计数据类型的基础上,进行统计整理,选择合适的图表展示数据整理结果,以揭示数据呈现的信息
-
●2.1统计数据的类型
从不同的口径了解统计数据的分类
-
●2.2调查与抽样
调查与抽样是统计数据搜集的常见方法,尤其在推断统计领域,抽样更是获取数据的重要方法。
-
●2.3调查问卷的设计
调查问卷是统计调查方案的核心内容。问卷是一种特殊形式的调查表,其特点是在表中用一系列按照严密的逻辑结构组成的问题,向被调查者调查具体事实和个人对某一问题的反应、看法。
-
●2.4统计数据的整理
统计搜集到得大量资料是分散的、不系统的,只能说明各个单位的特征和属性,必须按照科学的原则加以整理,使之条理化和系统化,成为便于储存和传递的、反映总体特征的数据。
-
●2.5统计图表的应用
图表是呈现统计数据整理结果的重要手段,统计图表的合理应用对于统计数据的分析能够起到事半功倍的效果。
-
●2.6统计图表的Excel应用
在实际工作领域,借助Excel完成数据的整理与展示工作的必须技能之一。
-
●2.7统计图表的SPSS应用
利用专业的统计软件,可以精准地绘制统计口径下的规范图表
-
第三章数据特征的统计描述
统计中,通过设置指标来反映和描述研究对象的属性特征。通常用平均数指标反映数据集中趋势,通过变异指标反映数据离散程度,通过峰度、偏度测度数据分布特征。
-
●3.1集中趋势的测度
对于统计数据集中趋势的测度,统计学中常用算术平均数、几何平均数、中位数、四分位数、众数来测度。
-
●3.2离散程度的测度
统计学中,对于数据离散程度的测度常用极差、四分位差、方差、标准差、离散系数等。
-
●3.3分布形态的测度
对于数据分布形态,还可以用峰度、偏度等指标来测度,可以绘制箱线图加以呈现。
-
●3.4分布特征与描述统计量
数据分布特征与描述统计量之间的对应关系。
-
●3.5软件应用
借助Excel、Spss可以完成描述统计量的计算,极大地提高了对统计数据的描述分析效率。
-
第四章 概率基础与抽样分布
在掌握随机变量特征与分布的基础上,将统计与概率进行良好的对接,借助数理推导,掌握对样本统计量分布特征的规律。
-
●4.1随机变量的数字特征
回顾概率论与数理统计的内容,了解随机变量的数字特征
-
●4.2随机变量及其分布
介绍概率分布的基本原理
-
●4.3中心极限定理
介绍统计中最基础的数理定理:中心极限定理,这是统计推断的理论基础。
-
●4.4常见的概率分布
常见连续型概率分布主要有正态分布、t分布、卡方分布和F分布。
-
●4.5样本均值的分布
样本均值的抽样分布即所有样本均值的可能取值形成的概率分布。样本均值抽样分布的形式与原有总体的分布和样本容量n的大小有关。如果原有总体是正态分布,那么无论样本容量的大小,样本均值的抽样分布都服从正态分布。
如果原有总体的分布是非正态分布,就要看样本容量的大小。随着样本容量n的增大(通常要求n≥30),不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,即前面所分析的中心极限定理。 -
●4.6样本成数的分布
样本成数也称为样本比例,其抽样分布就是所有样本比例的可能取值形成的概率分布。样本比例的分布属于二项分布问题,当样本容量n足够大时,即当nP与n(1-P)都不小于5时,样本比例的抽样分布近似为正态分布。
-
●4.7样本方差的分布
对于来自正态总体的简单随机样本,统计量
((n-1)S²)/σ² ~χ² (n-1)
的抽样分布为自由度为n-1的卡方分布。 -
●4.8两个总体的抽样分布
如果要对两个总体有关参数的差异进行估计,就要研究来自这两个总体的所有可能样本相应统计量差异的抽样分布。包括两样本均值差、成数差和方差比。
-
第五章参数估计
在统计量抽样分布的基础上,根据样本统计量,在一定置信度的前提下,对总体参数进行统计推断。包括点估计和区间估计。
-
●5.1统计推断的概念与原理
在统计量抽样分布的一般规律下,了解到了统计量与参数两者之间的差异规律。在抽样分布的基础上,可以在一定置信程度上,通过样本统计量对总体参数进行推断,称为参数估计。对参数的估计是否可信呢,可以进一步通过随机抽样,进行验证,这是统计推断中的假设检验。三个步骤的依次递进,更大程度地保障了推断的可信度。
-
●5.2推断中的样本
统计推断通常是从所要研究的对象全体中抽取一部分进行观测或试验以获取信息,对总体作出推断。
-
●5.3参数估计的主要内容
由样本统计量对总体的未知参数作出推断,这就是参数估计。
参数估计的方法有两种:点估计和区间估计。 -
●5.4一个总体参数的区间估计
研究一个总体时,所关心的参数主要有总体均值、总体比例和总体方差等。学习掌握如何用样本统计量来构造一个总体参数的置信区间。
-
●5.5两个总体参数的区间估计
对于两个总体之间的参数估计,我们主要关心的参数有两个总体的均值之差、两个总体的比例之差和两个总体的方差之比。学习和掌握两个总体参数的区间估计。
-
●5.6区间估计的理解
根据区间估计的基本原理,我们知道区间估计中关键的节点在于置信区间、抽样误差,对他们的含义应从统计口径加以理解。
-
●5.7必要样本容量的确定
在进行参数估计之前,首先应该确定一个适当的样本容量。在进行抽样调查时,如果样本容量很小,抽样误差就会较大,抽样推断就会失去意义;如果样本容量很大,虽然抽样误差会减小,但与此同时,会增加调查的费用和工作量,而且还会影响资料提供的及时性。因此,在估计前需要确定出必要的样本容量
-
●5.8Excel在抽样与区间估计的应用
对于随机抽样和一个总体均值的区间估计可以借助Excel完成。
-
第六章假设检验
假设检验也就是利用样本提供的信息来判断假设是否成立的过程,先对总体参数提出某种假设,然后利用样本信息进行检验判断。通过对样本统计量的研究进而提出对总体参数假设的决策结论。其关键问题在于假设的设置。
-
●6.1基本原理
小概率事件的原理,如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次抽样试验中几乎不可能发生的;要是在一次抽样样本中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设;如果在一次一次抽样样本中事件A没有发生,即没有出现不合理现象,这时就不能拒绝原来的假设
-
●6.2假设的设置
进行假设检验首先要同时设置一对假设,即原假设和备择假设。原假设通常是研究者想收集证据予以反对的假设,用H0表示。备择假设通常是研究者收集证据予以支持的假设,用H1来表示。在这里,原假设和备择假设组成一个完备事件,而且相互对立。
-
●6.3假设检验的规则
在进行假设检验中,还需要理解两类错误、显著性水平、检验统计量、P值这些概念。
-
●6.4总体参数的假设检验
与参数估计问题类似,假设检验也从均值、比例、方差三个参数进行假设检验
-
●6.5软件的应用
在工作实践应用中,可以借助exce、SPSS等统计软件的应用,l直接得到总体均值假设检验结果。
-
第七章方差分析
在许多实际问题中,还存在着许多类似这样的问题,某一指标的取值往往取决于其他一些因素。例如,一个化工产品的质量或性能指标取决于原材料的质地、成分、剂量、催化剂、温度、压力、溶剂浓度、反应、设备、人员水平、操作程序等;商场中一个产品的销售情况取决于产品的品牌、款式、材料、价格、商品陈列情况、顾客收入水平、顾客消费心理等多个因素;某个网站的访问量取决于网站主题类型、网页界面、网页内容丰富程度、响应速度、网民类型等众多因素。由于现象之间的联系是普遍的,因此这种影响因素的关系是十分常见的。这就需要从统计角度上来回答,这些因素对指标的取值影响是否都是显著的。这种影响是简单的叠加还是有交互影响的效果在内?回答这些问题的统计技术就是方差分析。
-
●7.1 基本原理
要进行方差分析,前提条件是每个总体都应服从正态分布并且方差相等,各观测值是独立的。方差分析通过比较方差来检验各因素水平的均值是否相等,但样本的观测值通常存在两种差异。一种是因素的各因素水平的差异;一种是各因素水平内部随机抽取样本的差异。这两种差异在方差分析中通常用两个方差来衡量,一个是基于样本均值之间差异的因素水平间方差;另一个是基于样本内部差异的因素水平内方差。如果这两个方差的比值较小,方差分析的结果可以认为总体均值相同。如果这两个方差的比值非常大,方差分析的结果可以认为总体均值不相同。两方差之比服从F分布。则,可以构建方差分析的F检验统计量。
-
●7.2单因素方差分析
2.相关关系的界定与测定
在自然界和人类社会中,许多现象之间是相互联系、相互制约的,究其实质,这种现象之间的关系可以概括为两种不同类型,即函数关系与相关关系。函数关系是确定性的依存关系,相关关系是不确定的随机依存关系。
根据相关关系 -
●7.3双因素方差分析
在对实际问题的研究中,有时需要考虑几个因素对试验结果的影响。例如,分析影响冰箱销售量的因素时,需要考虑品牌、销售地区、价格、质量等多个因素的影响。当方差分析中涉及两个分类型自变量时,称为双因素方差分析
-
第八章相关与回归分析
你是否曾经为某两个事务之间的关系困惑不已?前面讲过的统计量只描述、推断一个变量。但是,另外还有一些统计量可以说明变量之间的关系。了解事物的相互关系可以丰富你的信息,让你了解真相,使你立于不败之地。通过本章变量间的相关与回归来探寻发现事物关系的秘诀。
-
●8.1相关分析
根据相关关系中所涉及变量的多少,可以分为一元相关和多元相关。从变量之间相互关系的表现形式来看,可以分为线性相关和非线性相关。从变量之间相互关系的方向来看,可以分为正相关和负相关。线性相关关系的密切程度是通过线性相关系数来度量的。相关系数的符号表示了相关的方向,绝对值|r|的大小则反映了相关变量x与y的直线相关程度。|r|的值接近1表明相关性较强;|r|越接近于0,相关性就越弱。一般来说,r单因素方差分析包括提出假设、选择显著性水平、确定临界点、计算并决策四个步骤。在实践中,利用办公软件EXCEL就可以轻松进行方差分析。通过统计量超过给定显著性水平之下的临界值或P值小于显著性水平,则认为因素对观察指标的影响是显著的。
=0为不相关,0一般情况下,总体相关系数ρ是未知的,通常是根据样本相关系数r作为ρ的近似估计值。这就需要考虑样本相关系数的可靠性,也就是对它进行显著性检验,检验样本相关系数r对总体相关系数ρ的代表性。对ρ=0的t假设检验就是对总体是否相关做出判断。 -
●8.2一元线性回归分析
回归是关于一个变量对另一个或另外多个变量依存关系的研究,其目的是要根据已知或固定的自变量的数值,去估计因变量的总体平均值。线性回归模型在各项基本假设满足的条件下,用最小二乘法去估计的参数时总体回归系数的最佳线性无偏估计。样本回归系数的估计量是随着抽样而变动的随机变量。需要通过计算判定系数估计出的样本回归线对样本观测数据拟合的优劣程度,还需要对估计的样本回归系数需要进行t检验,对整个回归方程的显著性检验,需要在方差分析的基础上作F检验。
在实践中,利用办公软件EXCEL就可以轻松进行相关与回归分析。利用P值法完成检验。
-
第九章时间序列分析和预测
经济现象总是随着时间的推移而变化,因此,统计分析不仅要从静态的角度分析社会现象的数量特征,而且要对社会现象的数量方面在不同时间上表现出来的各个具体值做比较分析,以探索社会经济现象发展变化的过程及其规律性,并预测未来。时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而形成的数列,也叫时间数列、动态数列。本章针对不同的时间序列类型介绍了相应的预测方法。
-
●9.1时间序列及其分解
时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而形成的数列,也叫时间数列、动态数列。时间数列最重要的一个内容是预测。时间序列预测的一个最基本的假设就是影响着过去和现在时间序列形态的因素将继续以同样的方式作用于未来。所以,时间序列预测的一个重要目标就是识别这些影响因素,并且从时间序列中分离出来。这些因素可以分为长期趋势、季节变动、循环变动和不规则变动四大类影响因素。
-
●9.2平稳序列的预测
对于平稳时间序列的预测常用简单平均法、移动平均法和指数平滑法。
-
●9.3非线性趋势预测
对于非线性的时间序列需要构建模型进行预测。
-
●9.4复合型序列的分解预测
对于复合型的时间序列进行预测,首先应明确是否存在季节变动因素,再根据时间序列的发展过程选择适当的方法进行预测。
-
第十章指数分析
指数法是最常用、最重要的经济统计研究方法之一,它概括反映了现实世界中各种复杂现象客观存在的一类数量对比关系,在涉及物量、价格或经济效率等方面的综合比较的几乎所有领域内,指数法都是一种不可或缺的分析工具。
-
●10.1统计指数的界定与分类
统计指数是指反映复杂现象总体某一方面数量的综合变化方向和程度的相对数。从不同的角度出发,指数可以划分不同的类型。
-
●10.2统计指数的编制
统计指数的编制需要借助同度量因素,综合指数先综合后对比,平均数指数先对比后综合。
-
●10.3指数体系与因素分析
指数体系就是由三个或三个以上具有内在本质联系的统计指数所组成的有机整体。指数体系是因素分析的基本依据。因素分析,就是利用指数体系中各个指数之间的数量关系,对现象总体总变动的各个影响因素进行分解,分析各因素变动对现象总体总变动的影响程度和绝对效果。最基本的因素分析是两因素分析。