数理统计 —— 总体、样本、统计量及其分布

数理统计 —— 总体、样本、统计量及其分布

文章目录

1. 总体与样本1.1 总体1.2 样本1.2.1 定义1.2.2 分布

2. 统计量及其分布2.1 统计量2.1.1 定义2.1.2 常用统计量2.1.2.1 两类常用统计量2.1.2.2 常用统计量的性质

2.2 三大分布2.2.1

X

2

\mathcal{X}^2

X2分布2.2.2

t

t

t 分布2.2.3

F

F

F 分布

2.3 正态总体下常用结论

1. 总体与样本

1.1 总体

研究对象的全体称为总体,组成总体的每一个元素称为个体。在对总体进行统计研究时,我们所关心的是表征总体状况的某个(或某几个)数量指标

X

X

X(可以是向量)和该指标在总体中的分布情况。

例如:总体是一批灯泡,

X

X

X 是寿命;总体是某市市民,

X

X

X 是收入 我们把总体与随机变量

X

X

X 等同起来,说 "总体

X

X

X"。所谓总体的分布就是指随机变量

X

X

X 的分布

1.2 样本

1.2.1 定义

n个相互独立且与总体

X

X

X 具有相同概率分布的随机变量

X

1

,

X

2

,

,

X

n

X_1,X_2,…,X_n

X1​,X2​,…,Xn​ 所组成的整体

(

X

1

,

X

2

,

,

X

n

)

(X_1,X_2,…,X_n)

(X1​,X2​,…,Xn​) 称为来自总体

X

X

X,容量为

n

n

n 的一个简单随机样本,简称 样本 。样本中的每个随机变量都独立同分布于总体

X

X

X,即

X

i

i

.

i

.

d

X

X_i\stackrel{i.i.d}{\sim}X

Xi​∼i.i.dX一次抽样结果的n个具体数值

(

x

1

,

x

2

,

.

.

.

,

x

n

)

(x_1,x_2,...,x_n)

(x1​,x2​,...,xn​) 称为样本

X

1

,

X

2

,

,

X

n

X_1,X_2,…,X_n

X1​,X2​,…,Xn​ 的一个 观测值 或 样本值

1.2.2 分布

对于容量为n的样本

X

1

,

X

2

,

,

X

n

X_1,X_2,…,X_n

X1​,X2​,…,Xn​,假设总体

X

X

X 的分布函数为

F

(

x

)

F(x)

F(x),则

(

X

1

,

X

2

,

,

X

n

)

(X_1,X_2,…,X_n)

(X1​,X2​,…,Xn​) 的分布函数为 ​

F

(

x

1

,

x

2

,

.

.

.

,

x

n

)

=

i

=

1

n

F

(

x

i

)

F(x_1,x_2,...,x_n) = \prod\limits_{i=1}^n F(x_i)

F(x1​,x2​,...,xn​)=i=1∏n​F(xi​)

X

X

X为离散型随机变量,概率分布为

p

i

=

P

(

X

=

x

i

)

p_i = P(X=x_i)

pi​=P(X=xi​),联合分布为 ​

P

{

X

1

=

x

1

,

X

2

=

x

2

,

.

.

.

,

X

n

=

x

n

}

=

i

=

1

n

P

{

X

i

=

x

i

}

P\{X_1 = x_1,X_2=x_2,...,X_n=x_n\} = \prod\limits_{i=1}^n P\{X_i=x_i\}

P{X1​=x1​,X2​=x2​,...,Xn​=xn​}=i=1∏n​P{Xi​=xi​}若

X

X

X为连续型随机变量,概率密度为

f

(

x

)

f(x)

f(x),联合概率密度为 ​

f

(

x

1

,

x

2

,

.

.

.

,

x

n

)

=

i

=

1

n

f

(

x

i

)

f(x_1,x_2,...,x_n) = \prod\limits_{i=1}^n f(x_i)

f(x1​,x2​,...,xn​)=i=1∏n​f(xi​)

2. 统计量及其分布

2.1 统计量

2.1.1 定义

X

1

,

X

2

,

,

X

n

X_1,X_2,…,X_n

X1​,X2​,…,Xn​ 为来自总体

X

X

X 的一个样本,

g

(

x

1

,

x

2

,

.

.

.

,

x

n

)

g(x_1,x_2,...,x_n)

g(x1​,x2​,...,xn​) 为n元函数,如果g中不含任何未知参数,则 称

g

(

X

1

,

X

2

,

.

.

.

,

X

n

)

g(X_1,X_2,...,X_n)

g(X1​,X2​,...,Xn​) 为样本

X

1

,

X

2

,

,

X

n

X_1,X_2,…,X_n

X1​,X2​,…,Xn​ 的一个统计量。若

(

x

1

,

x

2

,

.

.

.

,

x

n

)

(x_1,x_2,...,x_n)

(x1​,x2​,...,xn​) 为样本值,则称

g

(

x

1

,

x

2

,

.

.

.

,

x

n

)

g(x_1,x_2,...,x_n)

g(x1​,x2​,...,xn​) 为

g

(

X

1

,

X

2

,

.

.

.

,

X

n

)

g(X_1,X_2,...,X_n)

g(X1​,X2​,...,Xn​) 的 观测值说明:

直观上,统计量是由统计数据计算得来的量。数学上,统计量是样本

X

1

,

X

2

,

,

X

n

X_1,X_2,…,X_n

X1​,X2​,…,Xn​ 的函数,不依赖于任何未知参数作为随机变量的函数,统计量也是随机变量

2.1.2 常用统计量

2.1.2.1 两类常用统计量

数字样本特征:

样本均值:

X

ˉ

=

1

n

i

=

1

n

X

i

\bar{X} = \frac{1}{n} \sum \limits_{i=1}^n X_i

Xˉ=n1​i=1∑n​Xi​样本方差:

S

2

=

1

n

1

i

=

1

n

(

X

i

X

ˉ

)

2

S^2 = \frac{1}{n-1} \sum\limits_{i=1}^n (X_i-\bar{X})^2

S2=n−11​i=1∑n​(Xi​−Xˉ)2 样本标准差:

S

=

1

n

1

i

=

1

n

(

X

i

X

ˉ

)

2

S = \sqrt{\frac{1}{n-1}\sum \limits_{i=1}^n (X_i-\bar{X})^2}

S=n−11​i=1∑n​(Xi​−Xˉ)2

​样本k阶(原点)矩:

A

k

=

1

n

i

=

1

n

X

i

k

(

k

=

1

,

2

,

.

.

.

)

A_k = \frac{1}{n}\sum\limits_{i=1}^nX_i^k (k=1,2,...)

Ak​=n1​i=1∑n​Xik​(k=1,2,...)样本k阶中心矩:

B

k

=

1

n

i

=

1

n

(

X

i

X

ˉ

)

k

(

k

=

2

,

3

,

.

.

.

)

B_k = \frac{1}{n}\sum\limits_{i=1}^n(X_i-\bar{X})^k (k=2,3,...)

Bk​=n1​i=1∑n​(Xi​−Xˉ)k(k=2,3,...) 顺序统计量:

将样本

X

1

,

X

2

,

,

X

n

X_1,X_2,…,X_n

X1​,X2​,…,Xn​ 的n个观测量按其取值从小到大的顺序排列,得 ​

X

(

1

)

X

(

2

)

.

.

.

X

(

n

)

X_{(1)} \leq X_{(2)} \leq...\leq X_{(n)}

X(1)​≤X(2)​≤...≤X(n)​ 随机变量

X

(

k

)

(

k

=

1

,

2

,

.

.

.

,

n

)

X_{(k)}(k=1,2,...,n)

X(k)​(k=1,2,...,n) 称作第

k

k

k 顺序统计量,其中

X

(

1

)

X_{(1)}

X(1)​ 是最小的顺序统计量,而

X

(

n

)

X_{(n)}

X(n)​ 是最大顺序统计量,即 ​

X

(

1

)

=

m

i

n

{

X

1

,

X

2

,

,

X

n

}

X

(

n

)

=

m

a

x

{

X

1

,

X

2

,

,

X

n

}

X_{(1)} = min\{X_1,X_2,…,X_n\}\\X_{(n)}=max\{X_1,X_2,…,X_n\}

X(1)​=min{X1​,X2​,…,Xn​}X(n)​=max{X1​,X2​,…,Xn​}注:

推导1

F

X

(

n

)

(

x

)

=

P

{

X

(

n

)

x

}

=

P

{

m

a

x

{

X

1

,

X

2

,

,

X

n

}

x

}

=

P

{

X

1

x

,

.

.

.

,

X

n

x

}

=

P

{

X

1

x

}

.

.

.

P

{

X

n

x

}

=

F

X

1

(

x

)

.

.

.

F

X

n

(

x

)

=

[

F

(

x

)

]

n

f

X

(

n

)

(

x

)

=

F

X

(

n

)

(

x

)

=

n

[

F

(

x

)

]

n

1

f

(

x

)

\begin{aligned} F_{X(n)}(x) &= P\{X_{(n)} \leq x\} \\ &= P\{max\{X_1,X_2,…,X_n\} \leq x\} \\ &= P\{X_1 \leq x,...,X_n \leq x\} \\ &= P\{X_1 \leq x\}...P\{X_n \leq x\} \\ &= F_{X_1}(x)...F_{X_n}(x) \\ &= [F(x)]^n\\ f_{X(n)}(x) &= F_{X(n)}^{'}(x) \\ &= n[F(x)]^{n-1} f(x) \\ \end{aligned}

FX(n)​(x)fX(n)​(x)​=P{X(n)​≤x}=P{max{X1​,X2​,…,Xn​}≤x}=P{X1​≤x,...,Xn​≤x}=P{X1​≤x}...P{Xn​≤x}=FX1​​(x)...FXn​​(x)=[F(x)]n=FX(n)′​(x)=n[F(x)]n−1f(x)​推导2

F

X

(

1

)

(

x

)

=

P

{

X

(

1

)

x

}

=

P

{

m

i

n

{

X

1

,

X

2

,

,

X

n

}

x

}

=

1

P

{

m

i

n

{

X

1

,

X

2

,

,

X

n

}

>

x

}

=

1

P

{

X

1

>

x

,

.

.

.

,

X

n

>

x

}

=

1

P

{

X

1

>

x

}

.

.

.

P

{

X

n

>

x

}

=

1

[

1

P

{

X

1

x

}

]

.

.

.

[

1

P

{

X

n

x

}

]

=

1

[

1

F

X

1

(

x

)

]

.

.

.

[

1

F

X

n

(

x

)

]

=

1

[

1

F

(

x

)

]

n

f

X

(

1

)

(

x

)

=

F

X

(

1

)

(

x

)

=

n

[

1

F

(

x

)

]

n

1

f

(

x

)

\begin{aligned} F_{X(1)}(x) &= P\{X_{(1)} \leq x\} \\ &= P\{min\{X_1,X_2,…,X_n\} \leq x\} \\ &= 1 - P\{min\{X_1,X_2,…,X_n\} > x\} \\ &= 1 - P\{X_1 > x,...,X_n > x\} \\ &= 1 - P\{X_1 > x\}...P\{X_n > x\} \\ &= 1 - [1-P\{X_1 \leq x\}]...[1-P\{X_n \leq x\}] \\ &= 1 - [1-F_{X_1}(x)]...[1-F_{X_n}(x)]\\ &= 1 - [1-F(x)]^n\\ f_{X(1)}(x) &= F_{X(1)}^{'}(x) \\ &= n[1-F(x)]^{n-1} f(x) \\ \end{aligned}

FX(1)​(x)fX(1)​(x)​=P{X(1)​≤x}=P{min{X1​,X2​,…,Xn​}≤x}=1−P{min{X1​,X2​,…,Xn​}>x}=1−P{X1​>x,...,Xn​>x}=1−P{X1​>x}...P{Xn​>x}=1−[1−P{X1​≤x}]...[1−P{Xn​≤x}]=1−[1−FX1​​(x)]...[1−FXn​​(x)]=1−[1−F(x)]n=FX(1)′​(x)=n[1−F(x)]n−1f(x)​ 说明:

样本均值就是样本的一阶原点矩样本方差不是二阶中心距。和期望不同,虽然算方差时也有n个元素求和,但系数不是

1

n

\frac{1}{n}

n1​ 而是

1

n

1

\frac{1}{n-1}

n−11​,这样调整是为了估计的无偏性

2.1.2.2 常用统计量的性质

设总体

X

X

X 的期望

E

X

=

μ

EX=\mu

EX=μ,方差

D

X

=

σ

2

DX = \sigma^2

DX=σ2 ,

X

1

,

X

2

,

,

X

n

X_1,X_2,…,X_n

X1​,X2​,…,Xn​ 是取自总体

X

X

X ,容量为

n

n

n 的一个样本,

X

ˉ

,

S

2

\bar{X},S^2

Xˉ,S2 分别为样本均值和方差,则

E

X

i

=

μ

EX_i =\mu

EXi​=μ

D

X

i

=

σ

2

(

i

=

1

,

2

,

.

.

.

,

n

)

DX_i = \sigma^2(i=1,2,...,n)

DXi​=σ2(i=1,2,...,n)

E

X

ˉ

=

E

(

1

n

i

=

1

n

X

i

)

=

1

n

n

μ

=

μ

E\bar{X} = E(\frac{1}{n} \sum\limits_{i=1}^nX_i)=\frac{1}{n}n\mu = \mu

EXˉ=E(n1​i=1∑n​Xi​)=n1​nμ=μ

D

X

ˉ

=

D

(

1

n

i

=

1

n

X

i

)

=

1

n

2

n

σ

2

=

σ

2

n

D\bar{X} = D(\frac{1}{n} \sum\limits_{i=1}^nX_i)=\frac{1}{n^2}n\sigma^2=\frac{\sigma^2}{n}

DXˉ=D(n1​i=1∑n​Xi​)=n21​nσ2=nσ2​

E

(

S

2

)

=

D

X

=

σ

2

E(S^2)=DX=\sigma^2

E(S2)=DX=σ2 说明

由于

X

i

X_i

Xi​ 独立同分布,每个样本的期望和方差都与总体相同,其波动中心一致,因此均值的期望不变;波动程度相当于做了均值滤波减小了,因此方差为原先的

1

n

\frac{1}{n}

n1​样本方差

S

2

S^2

S2 系数是

1

n

1

\frac{1}{n-1}

n−11​ 的原因就是为了使

E

(

S

2

)

E(S^2)

E(S2) 为无偏估计

σ

2

\sigma^2

σ2,分析如下

S

2

=

1

n

1

i

=

1

n

(

X

i

X

ˉ

)

2

=

1

n

1

i

=

1

n

(

X

i

2

2

X

i

X

ˉ

+

X

ˉ

2

)

=

1

n

1

(

i

=

1

n

X

i

2

2

X

ˉ

i

=

1

n

X

i

+

n

X

ˉ

2

)

=

1

n

1

(

i

=

1

n

X

i

2

n

X

ˉ

2

)

E

S

2

=

1

n

1

E

(

i

=

1

n

X

i

2

n

X

ˉ

)

=

1

n

1

(

i

=

1

n

E

X

i

2

n

E

X

ˉ

2

)

=

1

n

1

[

n

(

(

E

X

i

)

2

+

D

X

i

(

E

X

ˉ

)

2

D

X

ˉ

)

]

=

1

n

1

[

n

(

μ

2

+

σ

2

μ

2

σ

2

n

)

]

=

σ

2

\begin{aligned} S^2 &= \frac{1}{n-1} \sum\limits_{i=1}^n (X_i-\bar{X})^2 \\ &= \frac{1}{n-1} \sum\limits_{i=1}^n(X_i^2-2X_i\bar{X}+ \bar{X}^2) \\ &= \frac{1}{n-1} (\sum_{i=1}^nX_i^2-2\bar{X}\sum_{i=1}^nX_i+n\bar{X}^2)\\ &= \frac{1}{n-1} (\sum_{i=1}^nX_i^2-n\bar{X}^2)\\ ES^2 &= \frac{1}{n-1} E(\sum\limits_{i=1}^nX_i^2-n\bar{X}) \\ &= \frac{1}{n-1} (\sum_{i=1}^nEX_i^2 - nE\bar{X}^2) \\ &= \frac{1}{n-1} [n((EX_i)^2+DX_i - (E\bar{X})^2-D\bar{X})]\\ &= \frac{1}{n-1} [n(\mu^2+\sigma^2-\mu^2-\frac{\sigma^2}{n})]\\ &= \sigma^2 \end{aligned}

S2ES2​=n−11​i=1∑n​(Xi​−Xˉ)2=n−11​i=1∑n​(Xi2​−2Xi​Xˉ+Xˉ2)=n−11​(i=1∑n​Xi2​−2Xˉi=1∑n​Xi​+nXˉ2)=n−11​(i=1∑n​Xi2​−nXˉ2)=n−11​E(i=1∑n​Xi2​−nXˉ)=n−11​(i=1∑n​EXi2​−nEXˉ2)=n−11​[n((EXi​)2+DXi​−(EXˉ)2−DXˉ)]=n−11​[n(μ2+σ2−μ2−nσ2​)]=σ2​

2.2 三大分布

X

2

\mathcal{X}^2

X2 分布、

t

t

t 分布、

F

F

F 分布是统计推断中最常用的抽样分布。不必记忆三种分布的概率密度,只需了解相应变量的典型模式,以及它们的分布曲线的示意图和分位数,会查相应分位数的数值表即可分布名下标表示 “上分位点”

2.2.1

X

2

\mathcal{X}^2

X2分布

典型模式

若随机变量

X

1

,

X

2

,

.

.

.

,

X

n

X_1,X_2,...,X_n

X1​,X2​,...,Xn​ 相互独立,且都服从标准正态分布(即

X

i

i

.

i

.

d

N

(

0

,

1

)

X_i\stackrel{i.i.d}{\sim} N(0,1)

Xi​∼i.i.dN(0,1) ),则随机变量

X

=

i

=

1

n

X

i

2

X = \sum\limits_{i=1}^nX_i^2

X=i=1∑n​Xi2​ 服从 自由度 为

n

n

n 的

X

2

\mathcal{X}^2

X2分布,记为

X

X

2

(

n

)

X \sim \mathcal{X}^2(n)

X∼X2(n)。特别地,

X

i

2

X

2

(

1

)

X_i^2 \sim \mathcal{X}^2(1)

Xi2​∼X2(1)

X

X

X 的概率密度

f

(

x

)

f(x)

f(x) 如下所示 对给定的

α

(

0

<

α

<

1

)

\alpha(0<\alpha<1)

α(0<α<1),称满足

P

(

X

2

>

X

α

2

(

n

)

)

=

X

α

2

(

n

)

+

f

(

x

)

d

x

=

α

P(\mathcal{X^2}>\mathcal{X_{\alpha}^2(n)}) = \int_{X_{\alpha}^2(n)}^{+\infin} f(x)dx = \alpha

P(X2>Xα2​(n))=∫Xα2​(n)+∞​f(x)dx=α 的

X

α

2

(

n

)

X_{\alpha}^2(n)

Xα2​(n) 为

X

2

(

n

)

X^2(n)

X2(n) 分布的上

α

\alpha

α 分位点,如下所示 对于不同的

α

\alpha

α 和 n,

X

2

(

n

)

X^2(n)

X2(n) 分布的上

α

\alpha

α 分位点可以通过查表求得说明:

自由度是指和式中独立变量个数上

α

\alpha

α 分位点为

μ

α

\mu_{\alpha}

μα​ 意指:点

μ

α

\mu_{\alpha}

μα​ 右侧,概率密度曲线

f

(

x

)

f(x)

f(x) 下方与x轴围成的面积为

α

\alpha

α 性质

分布可加性:若

X

1

X

2

(

n

1

)

X_1 \sim \mathcal{X}^2(n_1)

X1​∼X2(n1​),

X

2

X

2

(

n

2

)

X_2 \sim \mathcal{X}^2(n_2)

X2​∼X2(n2​),

X

1

X_1

X1​ 与

X

2

X_2

X2​ 相互独立,则

X

1

+

X

2

X

2

(

n

1

+

n

2

)

X_1+X_2 \sim \mathcal{X}^2(n_1+n_2)

X1​+X2​∼X2(n1​+n2​)。一般地,若

X

i

X

2

(

n

i

)

(

i

=

1

,

2

,

.

.

.

,

m

)

X_i \sim \mathcal{X}^2(n_i)(i=1,2,...,m)

Xi​∼X2(ni​)(i=1,2,...,m) ,

X

1

,

X

2

,

.

.

.

,

X

m

X_1,X_2,...,X_m

X1​,X2​,...,Xm​ 相互独立,则

i

=

1

m

X

i

X

2

(

i

=

1

m

n

i

)

\sum\limits_{i=1}^mX_i \sim \mathcal{X}^2(\sum\limits_{i=1}^mn_i)

i=1∑m​Xi​∼X2(i=1∑m​ni​)

X

X

2

(

n

)

X \sim \mathcal{X}^2(n)

X∼X2(n),则

E

X

=

n

,

D

X

=

2

n

EX = n,DX=2n

EX=n,DX=2n

2.2.2

t

t

t 分布

典型模式

设随机变量

X

N

(

0

,

1

)

,

Y

X

2

(

n

)

X \sim N(0,1), Y\sim \mathcal{X}^2(n)

X∼N(0,1),Y∼X2(n),

X

X

X 与

Y

Y

Y 相互独立,则随机变量

t

=

X

Y

n

t=\frac{X}{\sqrt{\frac{Y}{n}}}

t=nY​

​X​ 服从自由度为

n

n

n 的

t

t

t 分布,记为

t

t

(

n

)

t\sim t(n)

t∼t(n)

t

t

t 分布的概率密度

f

(

x

)

f(x)

f(x) 的图形关于

x

=

0

x=0

x=0 对称,因此

E

t

=

0

(

n

2

)

E_t=0(n\geq2)

Et​=0(n≥2) 性质

t

t

t 分布概率密度

f

(

x

)

f(x)

f(x) 图像对称性,有

P

{

t

>

t

α

(

n

)

}

=

P

{

t

>

t

1

α

(

n

)

}

P\{t>-t_{\alpha}(n)\} = P\{t>t_{1-\alpha}(n)\}

P{t>−tα​(n)}=P{t>t1−α​(n)},故

t

1

α

(

n

)

=

t

α

(

n

)

t_{1-\alpha}(n) = -t_{\alpha}(n)

t1−α​(n)=−tα​(n)

t

t

(

n

)

t \sim t(n)

t∼t(n),则

E

t

=

0

Et = 0

Et=0

2.2.3

F

F

F 分布

典型模式

设随机变量

X

X

2

(

n

1

)

,

Y

X

2

(

n

2

)

X \sim \mathcal{X}^2(n_1),Y\sim \mathcal{X}^2(n_2)

X∼X2(n1​),Y∼X2(n2​),且

X

X

X 与

Y

Y

Y 相互独立,则

F

=

X

/

n

1

Y

/

n

2

F = \frac{X/n_1}{Y/n_2}

F=Y/n2​X/n1​​ 服从自由度为

(

n

1

,

n

2

)

(n_1,n_2)

(n1​,n2​) 的

F

F

F 分布,记为

F

F

(

n

1

,

n

2

)

F \sim F(n_1,n_2)

F∼F(n1​,n2​),其中

n

1

n_1

n1​ 称为第一自由度,

n

2

n_2

n2​ 称为第二自由度

F

F

F 分布的概率密度函数

f

(

x

)

f(x)

f(x) 如图所示 性质

F

F

(

n

1

,

n

2

)

F\sim F(n_1,n_2)

F∼F(n1​,n2​),则

1

F

F

(

n

2

,

n

1

)

\frac{1}{F} \sim F(n_2,n_1)

F1​∼F(n2​,n1​)

F

1

α

(

n

1

,

n

2

)

=

1

F

α

(

n

2

,

n

1

)

F_{1-\alpha}(n_1,n_2) = \frac{1}{F_{\alpha}(n_2,n_1)}

F1−α​(n1​,n2​)=Fα​(n2​,n1​)1​,证明如下

F

F

(

n

2

,

n

1

)

P

{

F

>

F

α

(

n

2

,

n

1

)

}

=

α

,

P

{

F

F

α

(

n

2

,

n

1

)

}

=

1

α

,

P

{

1

F

1

F

α

(

n

2

,

n

1

)

}

=

1

α

T

=

1

F

,

T

F

(

n

1

,

n

2

)

P

{

T

F

1

α

(

n

1

,

n

2

)

}

=

1

α

F

1

α

(

n

1

,

n

2

)

=

1

F

α

(

n

2

,

n

1

)

\begin{aligned} &记 F\sim F(n_2,n_1) \\ &P\{F>F_\alpha(n_2,n_1)\} = \alpha,\\ &P\{F\leq F_\alpha(n_2,n_1)\} = 1-\alpha,\\ &P\{\frac{1}{F} \geq \frac{1}{F_\alpha(n_2,n_1)}\}=1-\alpha\\ &令 T= \frac{1}{F},则T\sim F(n_1,n_2)\\ &有P\{T\geq F_{1-\alpha}(n_1,n_2)\}=1-\alpha\\ &故F_{1-\alpha}(n_1,n_2) = \frac{1}{F_\alpha(n_2,n_1)} \end{aligned}

​记F∼F(n2​,n1​)P{F>Fα​(n2​,n1​)}=α,P{F≤Fα​(n2​,n1​)}=1−α,P{F1​≥Fα​(n2​,n1​)1​}=1−α令T=F1​,则T∼F(n1​,n2​)有P{T≥F1−α​(n1​,n2​)}=1−α故F1−α​(n1​,n2​)=Fα​(n2​,n1​)1​​

2.3 正态总体下常用结论

X

1

,

X

2

,

.

.

.

,

X

n

X_1,X_2,...,X_n

X1​,X2​,...,Xn​ 是来自正态总体

N

(

μ

,

σ

2

)

N(\mu,\sigma^2)

N(μ,σ2) 的一个样本,

X

ˉ

S

2

\bar{X}、S^2

Xˉ、S2 分布是样本均值和方差,则

X

ˉ

N

(

μ

,

σ

2

n

)

\bar{X} \sim N(\mu,\frac{\sigma^2}{n})

Xˉ∼N(μ,nσ2​),即

X

ˉ

μ

σ

n

=

n

(

X

ˉ

μ

)

σ

N

(

0

,

1

)

\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} = \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)

n

​σ​Xˉ−μ​=σn

​(Xˉ−μ)​∼N(0,1)

(

X

,

Y

)

N

(

μ

1

,

μ

2

;

σ

1

2

,

σ

2

2

,

;

ρ

)

,

X

Y

线

a

X

+

b

Y

(

a

0

b

0

)

X

ˉ

X

1

,

X

2

,

.

.

.

,

X

n

线

\begin{aligned} &联合正态分布性质:若(X,Y) \sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2,;\rho), \\ & 则X和Y的线性组合aX+bY(a \neq 0 或 b\neq0)服从正态分布\\ &这里\bar{X} 即为X_1,X_2,...,X_n的线性组合,因此服从正态分布 \end{aligned}

​联合正态分布性质:若(X,Y)∼N(μ1​,μ2​;σ12​,σ22​,;ρ),则X和Y的线性组合aX+bY(a​=0或b​=0)服从正态分布这里Xˉ即为X1​,X2​,...,Xn​的线性组合,因此服从正态分布​

1

σ

2

i

+

1

n

(

X

i

μ

)

2

X

2

(

n

)

\frac{1}{\sigma^2}\sum\limits_{i+1}^n(X_i-\mu)^2\sim\mathcal{X}^2(n)

σ21​i+1∑n​(Xi​−μ)2∼X2(n)

X

i

i

.

i

.

d

N

(

μ

,

σ

2

)

X

i

μ

σ

N

(

0

,

1

)

X

2

,

i

=

1

n

(

X

i

μ

σ

)

2

X

2

(

n

)

\begin{aligned} &因为 X_i\stackrel{i.i.d}{\sim} N(\mu,\sigma^2)\\ &标准化有\frac{X_i-\mu}{\sigma} \sim N(0,1) \\ &根据\mathcal{X}^2分布定义,\sum\limits_{i=1}^n(\frac{X_i-\mu}{\sigma})^2\sim\mathcal{X}^2(n) \end{aligned}

​因为Xi​∼i.i.dN(μ,σ2)标准化有σXi​−μ​∼N(0,1)根据X2分布定义,i=1∑n​(σXi​−μ​)2∼X2(n)​

(

n

1

)

S

2

σ

2

=

i

=

1

n

(

X

i

X

ˉ

σ

)

2

X

2

(

n

1

)

\frac{(n-1)S^2}{\sigma^2}=\sum\limits_{i=1}^n(\frac{X_i-\bar{X}}{\sigma})^2\sim\mathcal{X}^2(n-1)

σ2(n−1)S2​=i=1∑n​(σXi​−Xˉ​)2∼X2(n−1),(

μ

\mu

μ未知时,在(2)中用

X

ˉ

\bar{X}

Xˉ代替

μ

\mu

μ)

欲使用公式 (2) 而期望

μ

\mu

μ 未知时,使用均值

X

ˉ

\bar{X}

Xˉ 代替期望

μ

\mu

μ这个证明困难,只要知道结论即可。直观上理解,由于

X

ˉ

\bar{X}

Xˉ 中各随机变量

X

i

X_i

Xi​ 相互纠缠,分布自由度相比 (2) 中减少1

X

ˉ

\bar{X}

Xˉ 与

S

2

S^2

S2 相互独立,

n

(

X

ˉ

μ

)

S

t

(

n

1

)

\frac{\sqrt{n}(\bar{X}-\mu)}{S} \sim t(n-1)

Sn

​(Xˉ−μ)​∼t(n−1) ,进一步有

n

(

X

ˉ

μ

)

2

S

2

F

(

1

,

n

1

)

\frac{n(\bar{X}-\mu)^2}{S^2}\sim F(1,n-1)

S2n(Xˉ−μ)2​∼F(1,n−1)

欲使用公式 (1) 而标准差

σ

\sigma

σ 未知时,用样本标准差

S

S

S 替代标准差

σ

\sigma

σ证明如下

X

ˉ

μ

σ

/

n

N

(

0

,

1

)

(

n

1

)

S

2

σ

2

X

2

(

n

1

)

t

X

ˉ

μ

σ

/

n

(

n

1

)

S

2

σ

2

/

(

n

1

)

t

(

n

1

)

n

(

X

ˉ

μ

)

S

t

(

n

1

)

\begin{aligned} &已知\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) \\ & 已知\frac{(n-1)S^2}{\sigma^2}\sim\mathcal{X}^2(n-1) \\ & 根据t分布定义,有 \frac{\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}}{\sqrt{\frac{(n-1)S^2}{\sigma^2}/(n-1)}} \sim t(n-1) \\ & 整理得\frac{\sqrt{n}(\bar{X}-\mu)}{S} \sim t(n-1) \end{aligned}

​已知σ/n

​Xˉ−μ​∼N(0,1)已知σ2(n−1)S2​∼X2(n−1)根据t分布定义,有σ2(n−1)S2​/(n−1)

​σ/n

​Xˉ−μ​​∼t(n−1)整理得Sn

​(Xˉ−μ)​∼t(n−1)​ 这些结论在进行 参数区间估计 和 假设检验 时非常有用,结论1/4常用于估计

μ

\mu

μ,结论2/3常用于估计

σ

\sigma

σ,具体见下一篇文章

相关推荐

双核双线程 铭瑄首款D2500整合板评测
365登录平台

双核双线程 铭瑄首款D2500整合板评测

⌛ 07-18 👁️ 9511
苏宁金融任性贷靠谱吗 贷款利率是多少
365登录平台

苏宁金融任性贷靠谱吗 贷款利率是多少

⌛ 07-21 👁️ 1477