Professional Documents
Culture Documents
第四章 统计量及其分布
§4.1 总体与样本
4.1.1 总体与个体
1. 总体:研究对象的全体。
通常指研究对象的某项数量指标。
组成总体的元素称为个体。
从本质上讲,总体就是所研究的
随机变量或随机变量的分布。
总体 (母体): i) 研究对象的全体。
ii) 总体分无限总体和有限总体。
iii) 总体是一个随机变量。
个体: 每一个研究对象。
样本具有二重性:
• 一方面,由于样本是从总体中随机抽取的,抽
取前无法预知它们的数值,因此,样本是随机
变量,用大写字母 X1,X2,…Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定
的观测值,因此,样本又是一组数值。此时
用小写字母 x1, x2, …, xn 表示是恰当的。
二重性: 在抽样前,称为样本;
在抽样后,称为数据。
样本容量 n : 样本中所含个体的个数。
样本的两个特点: 代表性, 独立性 。
简单随机样本 。
24 April 2009 华东师范大学
第四章 统计量及其分布 第 7页
样本的联合分布
n
F ( x1 , x2 , ......, xn ) = ∏ F ( xi )
i =1
4.1.3 从样本去认识总体
样本主要有二种形式:
完全样本:观测值完全已知
分组样本:只知道观测值所在的区间
样本来自于总体,必然包含了总体的信息。
•问题:如何获取样本中关于总体(总体的分布)
有用的信息:总体分布的类型或有关特征量,如
均值和方差等?
•答案:对样本进行整理加工。
对样本整理加工的方法
1、图表法:这是统计推断的开始
对于离散总体: 频率和频数分布表
频率和频数线条图
对于连续总体:(分组)频率和频数分布表
直方图、茎叶图、框须图
经验分布函数
正态概率纸
2、统计量:这是统计推断的关键
经验分布函数
设 x1,x2,…,xn 是取自总体分布函数为F(x)的样
本,若将样本观测值由小到大进行排列,为x(1),
x(2), …, x(n),则称 x(1), x(2), …, x(n) 为有序样本,
用有序样本定义如下函数
0 当 x < x(1)
Fn(x) = k / n 当 x(k)≤ x < x(1) , k=1,2,…,n-1
1 当 x ≥ x(n)
则Fn(x)是一非减右连续函数,且满足
Fn(−∞) = 0 和 Fn(+∞) = 1
由此可见,Fn(x)是一个分布函数,并称
Fn(x)为经验分布函数。
总体、样本、样本观察值的关系
总体 理 论 分 布
样 本 样本观察值
统计是从手中已有的资料——样本观察值,去推断
总体的情况——总体分布。总体分布决定了样本取
值的概率规律,也就是取到样本观察值的规律,因
而可以用样本观察值去推断总体
24 April 2009 华东师范大学
第四章 统计量及其分布 第13页
统计推断的一般步骤
数据处理 样本有关结论
统计量 推断总体性质
习题4.1 (P247) :3