数据的分析——知识讲解
【学习目标】 1.了解极差、方差和标准差的意义和求法,体会它们刻画数据波动的不同特征; 2.学会用极差、方差与标准差来处理数据.并用它们来解决实际问题. 【要点梳理】 要点一、极差、方差与标准差 1.极差 一组数据中最大值与最小值的差,能反映这组数据的变化范围,我们就把这样的差叫 做极差(range),极差=最大值-最小值. 要点诠释: 极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.一组数据的极差 越小,这组数据的波动幅度也越小,也就越稳定. 2.方差 在一组数据x x
1, ,
2…,
x
n中,各个数据与它们的平均数x
的差的平方分别是
2 1x
x
,
2
2 2 nx
x
,…,
x
x
, 我 们 用 它 们 的 平 均 数 , 即 用
2 2
2 2 1 21
x
x
(
x
x
)
...
(
x
x
)
n
S
n
来描述这组数据的离散程度,并把它叫做这 组数据的方差,记作 2s
. 要点诠释: (1)方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小, 数据的波动越小. (2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变. (3)一组数据的每一个数据都变为原来的k
倍,则所得的一组新数据的方差变为原来的 2k
倍. 3.标准差 通常,我们也用方差的算术平方根,即 来描述一组数据的离散程度,并把它叫做这组数据的标准差,记作 s. 要点诠释: (1)标准差的数量单位与原数据一致. (2)一组数据的方差或标准差越小,这组数据的离散程度越小,这组数据就越稳定. 要点二、极差、方差与标准差的联系与区别 联系:极差与方差、标准差都是表示一组数据离散程度的特征数. 区别:极差表示一组数据波动范围的大小,它受极端数据的影响较大;方差反映了一 组数据与其平均值的离散程度的大小.方差越大,稳定性越小;反之,则稳定性越好.所 以一般情况下只求一组数据的波动范围时用极差,在考虑到这组数据的稳定性时用方差. 【典型例题】类型一、极差、方差与标准差 1. (2015•黄冈模拟)某校要从小王和小李两名同学中挑选一人参加全国数学竞赛, 在最近的五次选拔测试中,他俩的成绩分别如下表: 次数 成绩(分) 姓名 1 2 3 4 5 小王 60 75 100 90 75 小李 70 90 80 80 80 根据上表解答下列问题: (1)完成下表: 姓名 极差(分) 平均成绩(分) 中位数(分) 众数(分) 方差 小王 40 80 75 75 190 小李 (2)在这五次测试中,成绩比较稳定的同学是谁?若将 80 分以上(含 80 分)的成绩视为 优秀,则小王、小李在这五次测试中的优秀率各是多少? (3)历届比赛表明,成绩达到 80 分以上(含 80 分)就很可能获奖,成绩达到 90 分以上 (含 90 分)就很可能获得一等奖,那么你认为应选谁参加比赛比较合适?说明你的理由. 【思路点拨】(1)根据平均数、中位数、众数、方差、极差的概念求得相关的数; (2)方差反映数据的离散程度,所以方差越小越稳定,应此小李的成绩稳定;小王的优秀 率= ,小李的优秀率= ; (3)选谁参加比赛的答案不唯一,小李的成绩稳定,所以获奖的几率大;小王的 90 分以 上的成绩好,则小王获一等奖的机会大. 【答案与解析】解:(1)小李的平均分= =80, 中位数=80, 众数=80, 方差= =40, 极差=最大的数﹣最小的数=90 70=20﹣ ; 姓名 极差(分) 平均成绩(分) 中位数(分) 众数(分) 方差 小王 40 80 75 75 190 小李 20 80 80 80 40 (2)在这五次考试中,成绩比较稳定的是小李, 小王的优秀率= ×100%=40%,小李的优秀率= ×100%=80%; (3)方案一:我选小李去参加比赛,因为小李的优秀率高, 有 4 次得 80 分,成绩比较稳定,获奖机会大. 方案二:我选小王去参加比赛,因为小王的成绩获得一等奖的机率较高, 有 2 次 90 分以上(含 90 分),因此有可能获得一等奖.
(注:答案不唯一,考生可任选其中一人,只要分析合理,都给满分.若选两人都去参加, 不合题意不给分). 【总结升华】本题考查了方差、中位数及众数的知识,属于基础题,一些同学对方差的公 式记不准确或粗心而出现错误. 举一反三: 【变式】我国著名的珠穆朗玛峰海拔高达 8844 米,在它周围 2 千米的附近,耸立的几座 著名山峰的高度如下表: 山峰名 珠穆 朗玛 洛子峰 卓穷峰 马卡 鲁峰 章子峰 努子峰 普莫 里峰 海拔高度 884 4m 8516 m 7589 m 846 3m 7543 m 7855 m 7145 m 则这七座山峰海拔高度的极差为 米. 【答案】1699 2. (2015•内江)有一组数据如下:3,a,4,6,7,它们的平均数是 5,那么这组数 据的方差是( ) A.10 B. C.2 D. 【思路点拨】先由平均数的公式计算出 a 的值,再根据方差的公式计算:
2 2
2 2 1 21
x
x
(
x
x
)
...
(
x
x
)
n
S
n
. 【答案】C 【解析】解:由题意得: (3+a+4+6+7)=5, 解得 a=5, S2= [(3 5﹣ )2+(5 5﹣ )2+(4 5﹣ )2+(6 5﹣ )2+(7 5﹣ )2]=2. 故选 C. 【总结升华】此类题关键是掌握求方差的步骤,记准求方差的公式. 举一反三: 【变式】学校篮球队五名队员的年龄分别为17 15 17 16 15
,,,,
,其方差为0.8
,则 3 年后这五 名队员年龄的方差为______. 【答案】0.8 类型二、极差、方差与标准差的实际应用 3.甲、乙两班举行汉字输入比赛,参赛学生每分钟输入汉字的个数经统计计算后,填 入下表: 班级 参加人数 中位数 方差 平均字数甲 55 149 191 135 乙 55 151 110 135 分析此表得出如下结论:( ) (1)甲、乙两班学生成绩的平均水平相同; (2)乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字 150 个为优秀) (3)甲班学生成绩的波动情况比乙班成绩波动大. A.(1)(2) B.(1)(2)(3) C.(2)(3) D.(1)(3) 【思路点拨】理清表格中所列数据代表的含义,以及数据差异而导致的不同. 【答案】B 【解析】甲、乙两班学生的平均字数都是 135 个/分钟,所以平均水平相同;从中位数上 看,乙班的 151 大于甲班的 149,表明乙班优秀的人数多于甲班优秀的人数;从方差上看, 甲班的方差大于乙班的方差,所以甲班学生成绩的波动情况比乙班成绩波动大 .因此, (1)(2)(3)都正确,选 B. 【总结升华】此类题关键是要能从表格中筛选出所需要的信息,理解每个数据所代表的含 义. 举一反三: 【变式】甲、乙两人各射击 6 次,甲所中的环数是 8,5,5,A,B,C, 且甲所中的环数 的平均数是 6,众数是 8;乙所中的环数的平均数是 6,方差是 4.根据以上数据,对甲、 乙射击成绩的正确判断是( ) A.甲射击成绩比乙稳定 B.乙射击成绩比甲稳定 C.甲、乙射击成绩稳定性相同 D.甲、乙射击成绩稳定性无法比较 【答案】B. 4. 从甲、乙两种玉米苗中各抽 10 株,分别测得它们的株高如下:(单位:cm) 甲: 21 42 39 14 19 22 37 41 40 25 乙: 27 16 40 41 16 44 40 40 27 44 (1)根据以上数据分别求甲、乙两种玉米的极差和方差. (2)哪种玉米的苗长得高些; (3)哪种玉米的苗长得齐? 【思路点拨】本题考察极差、方差的定义.要求极差,只要用数据中最大值减去最小值,求 到差值即可.利用方差的计算公式可以求到方差. 【答案与解析】 解:(1)甲的极差: 42-14=28(cm); 乙的极差:44-16=28(cm). 甲的平均值:
x
甲10
(
21
42
39
14
19
22
37
41
40
25
)
30
(
cm
)
1
乙的平均值: 甲的方差:104
.
2
(
)
10
)
30
25
(
)
30
42
(
)
30
21
(
2 2 2 2 2cm
S
甲
,乙的方差:
128
.
8
(
)
10
)
31
44
(
)
31
16
(
)
31
27
(
2 2 2 2 2cm
S
乙
(2)因为甲种玉米的平均高度小于乙种玉米的平均高度,所以乙种玉米的苗长的高. (3)因为S
甲乙2<
S
2 ,所以甲种玉米的苗长得整齐. 【总结升华】本题既是一道和极差、方差计算有关的问题,又是利用方差解决实际问题的 一道题目,关键是理解和掌握极差、方差的求解公式. 举一反三: 【变式】 为了比较甲、乙两种水稻的长势,农技人员从两块试验田中,分别随机抽取 5 棵植株, 将测得的苗高数据绘制成下图: 请你根据统计图所提供的数据,计算平均数和方差,并比较两种水稻的长势. 【答案】5.8
5.2
x
甲
x
乙
∵,
,∴
甲种水稻比乙种水稻长得更高一些.S
2
2.16
S
2
0.56
乙 甲∵,
,∴
乙种水稻比甲种水稻长得更整齐一些. 5.某社区准备在甲乙两位射箭爱好者中选出一人参加集训,两人各射了 5 箭,他们的 总成绩(单位:环)相同,小宇根据他们的成绩绘制了尚不完整的统计图表,并计算了甲 成绩的平均数和方差(见小宇的作业). 植株编号 1 2 3 4 5 甲种苗高 7 5 4 5 8 乙种苗高 6 4 5 6 5甲、乙两人射箭成绩统计表 第 1 次 第 2 次 第 3 次 第 4 次 第 5 次 甲成绩 9 4 7 4 6 乙成绩 7 5 7
a
7 (1)a
=_____; =_______; (2)请完成图中表示乙成绩变化情况的折线; (3)①观察图,可看出______的成绩比较稳定(填“甲”或“乙”).参照小宇的计算方法, 计算乙成绩的方差,并验证你的判断.②请你从平均数和方差的角度分析,谁将被选中. 【思路点拨】 (1)根据他们的总成绩相同,得出a
=30-7-7-5-7=4,进而得出 =30÷5= 6;(2)根据(1)中所求得出a
的值进而得出折线图即可;(3)①观察图,即可得出乙 的成绩比较稳定;②因为两人成绩的平均水平(平均数)相同,根据方差得出乙的成绩比 甲稳定,所以乙将被选中. 【答案与解析】 解:(1)由题意得:甲的总成绩是:9+4+7+4+6=30, 则a
=30-7-7-5-7=4, =30÷5=6, 故答案为:4,6; (2)如图所示:; (3)①观察图,可看出乙的成绩比较稳定, 故答案为:乙; 2
=
1
7 6
2 27 6
26
27 6
2=1.6
5
s
乙()(5- 6)()(4)()
由于s
2 乙<s
2甲,所以上述判断正确. ②因为两人成绩的平均水平(平均数)相同,根据方差得出乙的成绩比甲稳定,所 以乙将被选中. 【总结升华】此题主要考查了方差的定义以及折线图和平均数的意义,根据已知得出a
的 值进而利用方差的意义比较稳定性即可. 举一反三: 【变式】某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干 次测试成绩中随机抽取 8 次,数据如下(单位:分) 甲 95 82 88 81 93 79 84 78 乙 83 75 80 80 90 85 92 95 (1)请你计算这两组数据的平均数、中位数; (2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人 参加合适?请说明理由. 【答案】 解:1
(95 82 88 81 93 79 84 78) 85
8
x
甲
(分),1
(83 75 80 80 90 85 92 95) 85
8
x
乙
(分). 甲、乙两组数据的中位数分别为 83 分、84 分. (2)由(1)知x
甲乙
x
85
分,所以 21
[(95 85)
2(82 85)
2(78 85) ] 35.5
28
s
甲
, 21
2 2 2[(83 85)
(75 85)
(95 85) ] 41
8
s
乙
. ①从平均数看,甲、乙均为 85 分,平均水平相同;②从中位数看,乙的中位数大于甲,乙的成绩好于甲; ③从方差来看,因为