常態分布的機率密度分布圖,越靠近分布函數的中部出現的機率越高
假設某一觀測量的真實值為
X
~
{\displaystyle {\tilde {X}}}
,對其進行
n
{\displaystyle n}
次觀測,可以得到由
n
{\displaystyle n}
個觀測值組成的觀測向量
X
=
[
X
1
X
2
⋯
X
n
]
T
{\displaystyle X={\begin{bmatrix}X_{1}&X_{2}&\cdots &X_{n}\end{bmatrix}}^{T}}
這些觀測量的測量誤差
Δ
{\displaystyle \Delta }
是其真實值與觀測值之差:
Δ
=
X
~
−
X
{\displaystyle \Delta ={\tilde {X}}-X}
以機率論中的中央極限定理為依據,測量誤差通常被視作是數學期望值為
E
[
Δ
]
{\displaystyle \operatorname {E} [\Delta ]}
,標準差為
σ
{\displaystyle \sigma }
的隨機變數,並且服從於相應的常態分布:
f
(
Δ
)
=
1
σ
2
π
e
−
(
Δ
−
E
[
Δ
]
)
2
2
σ
2
{\displaystyle f(\Delta )={\frac {1}{\sigma {\sqrt {2\pi }}}}e^{-{\frac {(\Delta -\operatorname {E} [\Delta ])^{2}}{2\sigma ^{2}}}}}
基於這一假設,可以採用統計學的方法構造各類指標對測量誤差的分布情況進行分析,以評價測量結果的準確度、精密度和正確度。又由於偶然誤差和系統誤差具有不同的統計特性,即偶然誤差的數學期望值為零,但系統誤差不然。因此在進行測量結果的分析時,也常會將偶然誤差與系統誤差分別分析,即選用不同的精度指標來評價精密度和正確度。
偶然誤差
編輯
偶然誤差是指在大小和符號上表現出偶然性,但母體上符合一定統計規律的誤差,其數學期望值為零。精密度即是對偶然誤差統計的描述。
變異數與中誤差
編輯
根據
E
[
Δ
]
=
0
{\displaystyle \operatorname {E} [\Delta ]=0}
的特性,可以得出偶然誤差的中誤差[註 1]為:
σ
=
E
[
Δ
2
]
−
E
[
Δ
]
2
=
E
[
Δ
2
]
{\displaystyle \sigma ={\sqrt {\operatorname {E} [\Delta ^{2}]-\operatorname {E} [\Delta ]^{2}}}={\sqrt {\operatorname {E} [\Delta ^{2}]}}}
其估計值由下列公式計算
σ
^
=
∑
i
=
1
n
Δ
2
n
{\displaystyle {\hat {\sigma }}={\sqrt {\frac {\sum _{i=1}^{n}\Delta ^{2}}{n}}}}
通過變異數是中誤差的平方的關係,亦可得到偶然誤差的變異數及其估計值。
極限誤差
編輯
對於常態分布,誤差分布於與平均值距離一倍及二倍、三倍中誤差之間的機率分別為
{
Pr
(
−
σ
<
Δ
<
+
σ
)
=
68.3
%
Pr
(
−
2
σ
<
Δ
<
+
2
σ
)
=
95.5
%
Pr
(
−
3
σ
<
Δ
<
+
3
σ
)
=
99.7
%
{\displaystyle {\begin{cases}\operatorname {Pr} (-\sigma <\Delta <+\sigma )=68.3\%\\\operatorname {Pr} (-2\sigma <\Delta <+2\sigma )=95.5\%\\\operatorname {Pr} (-3\sigma <\Delta <+3\sigma )=99.7\%\end{cases}}}
在遠離平均值時,誤差出現的機率相當接近於零,可以在假說檢定中將其排除,而選定的排除「該誤差是偶然誤差」這一假設的極限值即為極限誤差。在測量學中,常以二倍或三倍中誤差作為極限誤差。
平均誤差
編輯
平均誤差即平均絕對誤差,對於一定觀測條件下的某組獨立的偶然誤差來說,是其絕對值的數學期望值:[4][13][14]
θ
=
E
[
|
Δ
|
]
{\displaystyle \theta =\operatorname {E} [\left\vert \Delta \right\vert ]}
相應的估計值為
θ
^
=
1
n
∑
i
=
1
n
|
Δ
|
{\displaystyle {\hat {\theta }}={\frac {1}{n}}\sum _{i=1}^{n}\left\vert \Delta \right\vert }
根據常態分布的機率分布函數,可以得出平均誤差
θ
{\displaystyle \theta }
與中誤差
σ
{\displaystyle \sigma }
之間的數學關係:
θ
=
∫
−
∞
+
∞
|
Δ
|
f
(
Δ
)
d
Δ
=
∫
0
+
∞
2
Δ
f
(
Δ
)
d
Δ
=
2
π
σ
{\displaystyle \theta =\int _{-\infty }^{+\infty }\left\vert \Delta \right\vert f(\Delta )\operatorname {d} \!\Delta =\int _{0}^{+\infty }2\Delta f(\Delta )\operatorname {d} \!\Delta ={\sqrt {\frac {2}{\pi }}}\sigma }
即有
θ
≈
0.7979
σ
{\displaystyle \theta \approx 0.7979\sigma }
或然誤差
編輯
或然誤差(英語:Probable error)
ρ
{\displaystyle \rho }
是使區間
(
−
ρ
,
+
ρ
)
{\displaystyle (-\rho ,+\rho )}
內的累積機率分布為
1
/
2
{\displaystyle 1/2}
的值,即:[4][15]
∫
−
ρ
+
ρ
f
(
Δ
)
d
Δ
=
1
2
{\displaystyle \int _{-\rho }^{+\rho }f(\Delta )\operatorname {d} \!\Delta ={\frac {1}{2}}}
且可解得
ρ
≈
0.6745
σ
{\displaystyle \rho \approx 0.6745\sigma }
系統誤差
編輯
觀測量
X
{\displaystyle X}
中存在的系統誤差是指觀測量的真實值
X
~
{\displaystyle {\tilde {X}}}
與其數學期望值
E
[
X
]
{\displaystyle \operatorname {E} [X]}
之間的差值:
ε
=
X
~
−
E
[
X
]
{\displaystyle \varepsilon ={\tilde {X}}-\operatorname {E} [X]}
均方誤差
編輯
觀測量
X
{\displaystyle X}
的均方誤差
MSE
[
X
]
{\displaystyle \operatorname {MSE} [X]}
通過下列公式計算:[4][14]
MSE
[
X
]
=
E
[
(
X
−
X
~
)
2
]
{\displaystyle \operatorname {MSE} [X]=\operatorname {E} [(X-{\tilde {X}})^{2}]}
將其進行分解,可以得出以變異數和系統誤差的平方和表示的均方誤差:
MSE
[
X
]
=
E
[
(
X
−
X
~
)
2
]
=
E
[
[
(
X
−
E
[
X
]
)
+
(
E
[
X
]
−
X
~
)
]
2
]
=
E
[
(
X
−
E
[
X
]
)
2
+
2
(
X
−
E
[
X
]
)
(
E
[
X
]
−
X
~
)
+
(
E
[
X
]
−
X
~
)
2
]
=
E
[
(
X
−
E
[
X
]
)
2
]
+
2
E
[
(
X
−
E
[
X
]
)
(
E
[
X
]
−
X
~
)
]
+
E
[
(
E
[
X
]
−
X
~
)
2
]
=
σ
X
2
+
2
(
E
[
X
]
−
E
[
X
]
)
(
E
[
X
]
−
X
~
)
+
ε
2
=
σ
X
2
+
ε
2
{\displaystyle {\begin{aligned}\operatorname {MSE} [X]&=\operatorname {E} [(X-{\tilde {X}})^{2}]\\[4pt]&=\operatorname {E} [[(X-\operatorname {E} [X])+(\operatorname {E} [X]-{\tilde {X}})]^{2}]\\[4pt]&=\operatorname {E} [(X-\operatorname {E} [X])^{2}+2(X-\operatorname {E} [X])(\operatorname {E} [X]-{\tilde {X}})+(\operatorname {E} [X]-{\tilde {X}})^{2}]\\[4pt]&=\operatorname {E} [(X-\operatorname {E} [X])^{2}]+2\operatorname {E} [(X-\operatorname {E} [X])(\operatorname {E} [X]-{\tilde {X}})]+\operatorname {E} [(\operatorname {E} [X]-{\tilde {X}})^{2}]\\[4pt]&=\sigma _{X}^{2}+2(\operatorname {E} [X]-\operatorname {E} [X])(\operatorname {E} [X]-{\tilde {X}})+\varepsilon ^{2}\\[4pt]&=\sigma _{X}^{2}+\varepsilon ^{2}\\[4pt]\end{aligned}}}
因此,均方誤差被認為同時包含了對偶然誤差和系統誤差的定量描述,可以衡量測量學中的「精確度」。