之前我在计算2014,2010年学生质调研数据的时候(2010年只计算了女生数据),我把每个省的数据,直接每个省算术平均,得出来的数据,和学生体质调研公布全国总表的数据是差不多的。
然后我再按照七普人口数据,每个省加权计算了一下。得出结论,学生体质调研的数据应该是每个省算术平均。实际如果像韩那样全民军检再平均的话,应该按照人口加权计算平均,这个数值会略低于算术平均3-4毫米。(帖子标题《学生体质调研按照全人口加权平均数和算术平均数对比》)
这次2019年的数据我准备按照同样的方法计算。但是第一步就出错了,我把每个省的数据,直接算术平均以后,得出来的数据,和学生体质调研公布的全国总表数据对不上。后来我才把问题搞清楚,因为2014年和2010年的每个省,基本上每个年龄段,城,乡分别150样本,17-18男生基本是600样本,女生16-18岁900样本。
但是2019年每个省,每个年龄段,样本波动很大,样本都不一样,但是最终公布出来的数据,是所有人的算数平均,那么在计算的时候,因为分省样本不一样,必须要先按照分省样本加权平均才行。我把所有分省数据,按照样本加权以后,最终计算出来数据,和公布出来的是完全一样的。(帖子标题《2019年学生体质调研汉族分省数据最准确版本》)
上面说了一堆,一句话概括就是,2019年学生体质调研,为了得到更准确的数据,所以一开始多了一个步骤,先算了分省详细数据。
然后我再按照七普人口数据,每个省加权计算了一下。得出结论,学生体质调研的数据应该是每个省算术平均。实际如果像韩那样全民军检再平均的话,应该按照人口加权计算平均,这个数值会略低于算术平均3-4毫米。(帖子标题《学生体质调研按照全人口加权平均数和算术平均数对比》)
这次2019年的数据我准备按照同样的方法计算。但是第一步就出错了,我把每个省的数据,直接算术平均以后,得出来的数据,和学生体质调研公布的全国总表数据对不上。后来我才把问题搞清楚,因为2014年和2010年的每个省,基本上每个年龄段,城,乡分别150样本,17-18男生基本是600样本,女生16-18岁900样本。
但是2019年每个省,每个年龄段,样本波动很大,样本都不一样,但是最终公布出来的数据,是所有人的算数平均,那么在计算的时候,因为分省样本不一样,必须要先按照分省样本加权平均才行。我把所有分省数据,按照样本加权以后,最终计算出来数据,和公布出来的是完全一样的。(帖子标题《2019年学生体质调研汉族分省数据最准确版本》)
上面说了一堆,一句话概括就是,2019年学生体质调研,为了得到更准确的数据,所以一开始多了一个步骤,先算了分省详细数据。