- 经济发展、城乡统筹、居民生活质量与生态效率耦合协调发展研究:以长三角地区为例
- 白彩全 冯晨 肖薇薇
- 386字
- 2020-08-26 14:59:20
第一节 一元密度函数核估计
设X为一个随机变量,其密度函数f(x)未知,设x1,…,xn为X的样本观测值。可从经验分布函数导出密度函数的核估计,经验分布函数为:
![](https://epubservercos.yuewen.com/CDAF41/17517096806705106/epubprivate/OEBPS/Images/Figure-P56_56047.jpg?sign=1738916318-7Ma2IZn0qPkctzG5vDzs7h6aSnCwPAAi-0-f677dc9feda291ee33294f8c17b9e696)
式(2-1)中,N是观测值的数目;I(z)为指针函数;z是条件关系式,当z为真时,I(z)=1,当z为假时,I(z)=0。式(2-1)中条件关系式z为xi≤x,xi是i点的样本观测值,当xi≤x时,I(xi≤x)=1,否则取值为0。
取核函数为均匀核:
![](https://epubservercos.yuewen.com/CDAF41/17517096806705106/epubprivate/OEBPS/Images/Figure-P56_56049.jpg?sign=1738916318-L8agcc8UsAmsLAL3fMF3lHOmQUJWmWU3-0-c65aca316847c3f78924c29fdef03574)
则核密度估计为:
![](https://epubservercos.yuewen.com/CDAF41/17517096806705106/epubprivate/OEBPS/Images/Figure-P56_56052.jpg?sign=1738916318-xqdflVWorY9L6iAaryhaEXXfpCVuUYPZ-0-97fdc166a6685def1fce953dec0fee18)
式(2-2)中,h是带宽(或平滑参数),将核函数放宽就得到一般的核密度估计:
![](https://epubservercos.yuewen.com/CDAF41/17517096806705106/epubprivate/OEBPS/Images/Figure-P56_56054.jpg?sign=1738916318-iOzslGkS5PJMUrItDpquwXBkSvknKfTG-0-dcc70c65a3c99316896b3f33867cdddf)
式(2-3)中,K是核函数。
带宽h控制密度估计的平滑程度,带宽越大,估计越平滑,但估计的偏差越大。带宽的选取在密度估计中十分重要。Silverman方法是一种基于数据的自动带宽h=0.9kN1/5min{s,IQR/1.34},s是标准离差;IQR为四分位距(Interquartile Range),因子k是标准带宽变换,标准带宽变换用来调整带宽,以便对于不同核函数的密度估计有大致相当的平滑。