[拼音]:shuju de tongji chuli fangfa

[英文]:statistical methods in data analysis

由于测量的偶然误差以及被研究的物理现象本身的随机性质,实验观测资料是由带有偶然性的一些随机资料组成的。实验资料处理的任务是,由测得的有限个随机资料(观测值随机变数的一个样本),推断被测定物理量的数值,或物理量之间的函式关系或被研究的物理现象的其他规律性。资料处理必须应用以随机量为研究物件的统计数学方法,主要是概率论、数理统计学和随机过程理论的数学方法。在粒子物理实验中,由于物理现象本身固有的随机性质很突出,物理现象的规律性往往被所测资料表面上的偶然性所掩盖,所以选择适当的统计方法进行资料处理就更为重要。资料处理中最常用的统计方法有参量估计、假设检验、拟合以及蒙特-卡罗模拟等。

参量估计

被测定的物理量常常是观测值所服从的统计分布中的参量。例如,稳定粒子的寿命是其生存时间观测值所服从的指数分布中的参量,共振态的质量和寿命是其衰变产物系统不变质量所服从的布赖特-维格纳(Breit-Wigner)分布中的参量。由观测资料推断物理量的数值,需要应用数理统计学中的参量估计方法。

最大似然法是估计分布参量值的一个最常用的方法。若观测值x服从概率密度函式为p(x;θ)的一个统计分布,分布参量θ为待测定的物理量,进行N次独立测量得到一组观测值x1、x2、…、xN,似然函式

是在参量取某特定值 θ的条件下出现该组观测资料的概率,最大似然法选择使似然函式取最大值的参量值

作为特定参量θ的估计值:

估计值的误差用一定置信水平下的置信区间表示(见实验资料的误差处理)。置信区间可根据估计值的分布性质用区间估计的方法定出,利用参量估计的置信分布方法,可以得到被估物理量的一个完整的概率推断,即该物理量的置信分布。通常的测量误差处理是参量估计的一个特殊情况:观测值服从正态分布,被测物理量的真值是观测值正态分布的期待值,其最大似然估计值是观测值的算术平均值,平均值左右一倍标准误差区间的置信水平为68.3%。

在被测物理量θ是一个随机变数,并且已知它的概率分布p(θ)(验前分布)的情况下,利用贝叶斯公式可以从观测值x1、x2、…、xN得出关于被测物理量数值的一个更精密的推断,即该物理量的验后分布,参量θ的验后分布的概率密度为

任意区间[θ1,θ2]的置信水平为

拟合

、…、

最常用的拟合方法是最小二乘法,在各观测值彼此独立且x 的测量误差可以忽略的情况下,最小二乘法选择使各观测点残差(y 的观测值与理论值之差)的“加权平方和最小”的参量值╦ 作为引数的估计值,即

其中σ崿为观测值y垄的方差。

最小二乘法可用于解决物理实验中各种经验公式的实验曲线的建立问题(如粒子物理实验中粒子径迹的重建)。

假设检验

参量估计和拟合方法用于由实验资料估计观测值统计分布中或被观测量间函式关系中的待定参量。但是,观测值所服从的统计分布或被观测量间函式关系的理论公式常常只是一种统计假设;这种假设是否能应用于实悬a href=’http://www.baiven.com/baike/222/323577.html’ target=’_blank’ >榈木咛迩榭觯欠裢鄄饨峁邢灾拿埽枰霉鄄馐萦枰约煅椤J笛橹行枰煅榈耐臣萍偕杌箍梢允枪赜诠鄄庵低臣品植疾瘟渴档哪持侄涎裕偕杓煅榉椒ǔS糜谂卸鲜笛樘跫ɡ缫瞧髦副辏┦欠裾#欠翊嬖诿飨缘南低澄蟛睿蛘呤笛榻峁惺欠癜殴鄄庵档耐臣品植蓟虮还鄄饬考浜叵档睦砺奂偕柚兴挥锌悸堑降男孪窒蟆<偕杓煅榉椒ɑ箍捎糜诖恿街掷砺奂偕柚刑粞∫桓鲎羁赡艿募偕瑁绱硬煌W拥幕旌鲜校莶獾玫氖萦行У靥粞〕瞿持中枰牧W印Ⅻ/p>

在实际问题中,应当根据具体情况选择适当的检验统计量。

一个广泛使用的检验统计量是皮尔孙 (Pearson)ⅹ2量,其定义为

式中ni为落入区间i中观测值的个数,Ei为区间i中观测值个数的理论预期值。显然,ⅹ2值的大小表现了实验资料与理论值差异的大小;同时,如果理论假设是正确的,则ⅹ2量渐近地服从一个已知的ⅹ2分布,可以利用ⅹ2分布对差异的大小作出定量的概率估计。

蒙特-卡罗模拟

见蒙特-卡罗法。

参考书目

李惕碚著:《实验的数学处理》,科学出版社,北京,1980。

A.G.Frodesen,et al.,ProBability and Statistics in particle Physics, Universitetsforlaget, Bergen,1979.

更多信息: bet9网址 汇旺担保 币安 汇旺担保 交易所 汇旺担保 直盘