统计全过程
珠海市第四中学(519015) 邱金龙
我们今天生活的世界,是一个迅速变化着的世界,如果你看看报纸,听听广播,就会发现在报告新闻时十分频繁地使用着数字,这些数字有些是准确的,有些是大概的,这些数字的获得都是人们想方设法去收集、整理和分析的结果,也就是统计的结果,我们生活在一充满统计数字的世界里,那么如果进行庞大数据的统计呢?
一、数据的收集
收集数据往往通过调查来完成,在收集数据时,首先要明确要调查的问题和对象,其次是选择调查的方法,常用的调查方法有调查、实地调查及媒体调查等。
提出问题:男性与女性的寿命有什么关系吗?如果知道一个国家的男性的平均寿命,能否预测这个国家女性的平均寿命?
调查方法:因为不同国家男女的平均寿命可能不太一样,而我们每个人想实地调查是不现实的,因此,我们可采用官方公布的数据,选择媒体调查,即利用上网或报纸来调查,下面是一篇报道:
中新网5月19日电 综合报道,世界卫生组织18日公布了各国平均寿命排行榜,日本女性和圣马力诺男性分别以86岁和80岁的平均寿命排在首位。
根据世卫组织公布的《2007年世界卫生报告》中的数据显示,日本妇女的平均寿命达到86岁,这一数字和去年持平。而去年以79岁和日本并列男性长寿榜第一的圣马力诺,今年达到80岁,成为男子平均寿命最长的国家。
在男性长寿榜上,澳大利亚、冰岛、日本、瑞典和瑞士以79岁排在圣马力诺之后并列第二,加拿大、以色列、意大利、摩纳哥和新加坡为78岁,法国、新西兰和英国等国为77岁,德国为76岁,古巴和美国同为75岁,中国为71岁。
在女性排行榜上,摩纳哥以85岁排在日本之后列第二位,安道尔、澳大利亚、法国、意大利、圣马力诺、西班牙和瑞士同为84岁,加拿大、冰岛和瑞典为83岁,德国为82岁,英国81岁,哥斯达黎加、丹麦和美国为80岁,中国为74岁。
位于非洲的塞拉利昂和斯威士兰两国分别成为男女平均寿命最短的国家,只有37岁。 根据世卫组织的报告,新生婴儿死亡率最高的国家是阿富汗,最低的是新加坡和冰岛。产妇死亡率最低的国家是爱尔兰。
报告没有说明各国人均寿命存在差异的具体原因。通常,饮食被认为是影响人类寿命的重要原因之一。 报告指出,世界各国贫困人口中吸烟人数在不断增加,一些国家人均寿命偏低和艾滋病及肺结核病发病率过高有关。报告还指出,部分国家在卫生事业上的资金投入严重不足。 对于以上一篇报道,要对数据进行分析,必须实施第二步,数据的整理。
二、数据的整理
在这篇报道中,提炼出数据如下: 男性平均寿命: 80岁――圣马力诺
79岁----日本、澳大利亚、冰岛、瑞典、瑞士
78岁----加拿大、以色列、意大利、摩纳哥、新加坡 77岁----法国、新西兰、英国 76岁----德国
75岁----古巴、美国 71岁――中国
女性平均寿命 86岁----日本 85岁----摩纳哥
84岁----安道尔、澳大利亚、法国、意大利、圣马力诺、西班牙、瑞士 83岁----加拿大、冰岛、瑞典 82岁----德国 81岁----英国
80岁----哥斯达黎加、丹麦、美国 74岁――中国
对以上数据进行抽样,将各个国家编号,采用简单随机抽样,抽取样本容量为6的一个样本,抽出的国家制作成表格形式如下: 表一 国家 中国 美国 75 80 加拿大 日本 79 86 德国 76 82 瑞士 79 84 男性平均寿命(x) 71 女性平均寿命(y) 74 78 83 对表中的数据,要知道男性与女性的寿命之间是否有关系,还要对其进行数据分析。
三、数据分析
对于表一的数据,画出散点图如下:
由散点图可知,各个点都在一条直线的附近,因此,男性与女性寿命之间的线性相关性是较强的。
下面用“最小二乘法”求出其回归直线方程。 =76.33,=81.50
=37390,=35008,=39941, 由b===≈1.33
所以,=81.5-1.33×76.33≈-20.02
所以y与x的回归方程分别是=1.33x-20.02 求出线性回归方程后,对回归方程进行检验和估计,将的值代入方程,通过计算,可知,估计值与真实值非常接近。