本
文
摘
要
1.1什么是统计学?
1.2解释描述统计和推断统计。
1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?
1.4解释分类数据、顺序数据和数值型数据的含义。
1.5举例说明总体、样本、参数、统计量、变量这几个概念。
1.6变量可分为哪几类?
1.7举例说明离散型变量和连续型变量。
1.8请举出统计应用的几个例子。
1.9请举出应用统计的几个领域。
2.1什么是二手资料?使用二手资料需要注意些什么?
2.2比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
2.3调查中搜集数据的方法主要有自填式、面访式、电话式。除此之外,还有哪些搜集数据的方法?
2.4自填式、面访式、电话式调查各有什么利弊?
2.5请举出(或设计)几个实验数据的例子。
2.6你认为应当如何控制调查中的回答误差?
2.7怎样减少无回答?请通过一个例子说明你所考虑到的减少无回答的具体措施。
3.1数据的预处理包括哪些内容?
数据审核,数据筛选,数据排序,数据透视表
3.2分类数据和顺序数据的整理和图示方法各有哪些?
分类数据:整理:在整理时首先列出所分的类别,然后计算出每一类别的频数、频率或比例、比率等,即可形成一张频数分布表。
图示:条形图,帕累托图,饼图,环形图
顺序数据:上面介绍的分类数据的频数分布表和图示方法,如频数、比例、百分比、比率、条形图和饼图等,也都适用于对顺序数据的整理与显示。但一些适用于顺序数据的整理和显示方法,并不适用于分类数据。对于顺序数据,除了可使用上面的整理和显示技术,还可以计算累积频数和累积频率(百分比)。
3.3数值型数据的分组方法有哪些?简述组距分组的步骤。
分组的方法有单变量值分组和组距分组两种。
组距分组步骤:第1步:确定组数。第2步:确定各组的组距。第3步:根据分组整理成频数分布表。
单变量值分组是把每一个变量值作为一组,这种分组通常只适合离散变量,且在变量值较少的情况下使用。
在连续变量或变量值较多的情况下,通常采用组距分组。它是将全部变量值依次划分为若干个区间,并将一个区间的变量值作为一组。在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。
3.4直方图与条形图有何区别?
直方图与条形图不同。
首先,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
3.5绘制线图应注意哪些问题?
线图(line plot)主要用于反映现象随时间变化的特征(针对时间序列数据)。
绘制线图时,时间一般绘在横轴,观测值绘在纵轴。一般应绘成横轴略大于纵轴的长方形,其长宽比例大致为10:7。图形过扁或过于瘦高,不仅不美观,而且会给人造成视觉上的错觉,不便于对数据变化的理解。一般情况下,纵轴数据下端应从“0”开始,以便于比较。如果数据与“0”之间的间距过大,可以采取折断的符号将纵轴折断。
3.6饼图和环形图有什么不同?
3.7茎叶图与直方图相比有什么优点?它们的应用场合是什么?
3.8鉴别图表优劣的准则有哪些?
3.9制作统计表应注意哪几个问题?
4.1一组数据的分布特征可以从哪几个方面进行测度?
4.2怎样理解平均数在统计学中的地位?
4.3简述四分位数的计算方法。
4.4对于比率数据的平均为什么采用几何平均?
4.5简述众数、中位数和平均数的特点和应用场合。
4.6简述异众比率、四分位差、方差或标准差的应用场合。
4.7标准分数有哪些用途?
4.8为什么要计算离散系数?
4.9测度数据分布形状的统计量有哪些?
5.1频率与概率有什么关系?
5.2独立性与互斥性有什么关系?
5.3根据自己的经验体会举几个服从泊松分布的随机变量的实例。
5.4根据自己的经验体会举几个服从正态分布的随机变量的实例。
6.1什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数?
6.3什么是次序统计量?
6.4什么是充分统计量?
6.5什么是自由度?
6.6简述x²分布、1分布、F分布及正态分布之间的关系。
6.7什么是抽样分布?
6.8简述中心极限定理的意义。
7.1解释估计量和估计值。
7.2简述评价估计量好坏的标准。
7.3怎样理解置信区间?
7.4解释95%的置信区间。
7.6解释独立样本和匹配样本的含义。
7.7在对两个总体均值之差的小样本估计中,对两个总体和样本都有哪些假定?
7.8简述样本量与置信水平、总体方差、估计误差的关系。
8.1假设检验和参数估计有什么相同点和不同点?
8.2什么是假设检验中的显著性水平?统计显著是什么意思?
8.3什么是假设检验中的两类错误?
8.4两类错误之间存在什么样的数量关系?
8.5解释假设检验中的P值。
8.6显著性水平与P值有何区别?
8.7假设检验依据的基本原理是什么?
8.8在单侧检验中原假设和备择假设的方向应该如何确定?
10.4方差分析中有哪些基本假定?
10.5简述方差分析的基本思想。
10.6解释因子和处理的含义。
10.7解释组内误差和组间误差的含义。
10.8解释组内方差和组间方差的含义。
10.9简述方差分析的基本步骤。
10.10方差分析中多重比较的作用是什么?
10.11什么是交互作用?
10.12解释无交互作用和有交互作用的双因素方差分析。
10.13解释R2的含义和作用。
11.1解释相关关系的含义,说明相关关系的特点。
11.2相关分析主要解决哪些问题?
11.3相关分析中有哪些基本假定?
11.4简述相关系数的性质。
11.5为什么要对相关系数进行显著性检验?
11.6简述相关系数显著性检验的步骤。
11.7解释回归模型、回归方程、估计的回归方程的含义。
11.8一元线性回归模型中有哪些基本假定?
11.9简述参数最小二乘估计的基本原理。
11.10解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。
11.11简述判定系数的含义和作用。
11.12在回归分析中,F检验和t检验各有什么作用?
11.13简述线性关系检验和回归系数检验的具体步骤。
11.14怎样评价回归分析的结果?
11.15什么是置信区间估计和预测区间估计?二者有何区别?
11.16简要说明残差分析在回归分析中的作用。
13.1简述时间序列的构成要素。
13.2利用增长率分析时间序列时应注意哪些问题?
13.3简述平稳序列和非平稳序列的含义。
13.4简述时间序列的预测程序。
13.5简述指数平滑法的基本含义。
13.6简述复合型时间序列的预测步骤。
13.7简述季节指数的计算步骤。
14.1什么是指数?它有哪些性质?
14.2什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?
14.3拉氏指数与帕氏指数各有什么特点?
14.4加权平均指数与加权综合指数有何区别与联系?
14.5什么是指数体系?它有什么作用?
14.6试述平均数指数体系。
14.7构建综合评价指数时需要考虑哪些方面的问题?