平均を語る記事を読むときに知っておくべきバラツキの話

雑談ログ

平均的な世帯に生まれ平均的な育ち方をし平均的な家庭を持つけど思考にだけはスキューがかかっているゴロドクさんです、どうも。

特に特定のマスメディア記事やブログ記事について揶揄しようということではありません。しばしば数字を扱う記事においては「平均」なるものが登場しますが、これはどれくらいあてになるのでしょうか、というお話。

平均と最頻値

例えば。

10人のグループに対し100点満点のテストを行った結果

85、80、65、55、75、80、95、90、80、75

という点数だったとします。このグループの平均点は78点ですね。あ、ちなみに今「平均点」と言ってしまいましたが、特に断りなく平均と世に言われるものはたいがい「相加平均」です。相加平均というのはデータの総和をデータの個数で割ったものです。

は?なに当たり前のこと言ってるの?という向きもあるかも知れません。しかし平均というとほかに「相乗平均」というものもあり、これはデータをすべて掛け合わせてデータの個数のべき乗を求めたもので、ランダムなデータの平均ではなく増加する数値の増加率を求めるのに使ったりします。ちょっと脱線しましたが参考までに。

さてこの相加平均(以下「平均」という)ですが、これはこのグループの得点を代表してあらわす数値と言えるでしょうか。得点を小さい順に次のように並べ替えてみましょう。

55、65、75、75、80、80、80、85、90、95

よく見ると80点が3人います。このようにデータの中でも最も数多く表れる数値を「最頻値」と呼びます。グループを代表する数値を考えるなら、この最頻値の方が適切だと考えることはできないでしょうか?

「いやいや、10人中たった3人ぐらいの得点をグループ全体を現す数値とするのはおかしいよ」という人もいるでしょう。では、次のような別の10人のグループ(このグループをG2、先に登場したグループをG1と呼ぶことにしましょう)の場合はどうでしょうか。

85、75、75、70、75、75、90、75、75、85

ちなみにこのグループの平均もG1と同じ78点です。このグループの得点も小さい順に並べ替えると

70、75、75、75、75、75、75、85、85、90

このグループでは75点の人が6人もいます。これなら最頻値をグループを代表する数値と言ってもいいんじゃないですか…とあれれ?最頻値はG1では平均値より大きく、G2では平均値より小さい。平均値はG1もG2も同じなのになぁ…平均値と最頻値、どっちがグループの代表値として適切なんでしょう?

ばらつきの度合い

そもそもG1とG2、データの分布の仕方が異なるんだから、一つの値で代表するのはおかしいんじゃないか、分布の仕方をあらわす指標についても考えなきゃいけないんじゃないかな…と考えた人、いい勘してます。

統計学では次のような考え方をします。

  • 平均値と、個々のデータとの差を考えるとバラツキの度合いが分かるんじゃないだろうか
  • ただ、この差分は正であることもあれば負であることもある
  • ということは差分の平均ではこれが0になってなにもわからない場合も考えられる
  • ならば差分の二乗を考えればいいのではなかろうか

算術的にはこういうことです。

n個のデータで構成される母集団の平均値をmとしたとき、n番目のデータXnと平均値との差を「偏差」といい、これをdとすると単純にd=Xn-mとなります。

当然dはXnが平均より大きければ正の値になるし、平均より小さければ負の値となります。合計すると0になる場合も考えられるので、これをそのまま扱うのはちょっと問題がありそうです。

そこで偏差の平方(二乗)の平均を考えるのはどうでしょう。これなら正の値しか現れないので平均から個々のデータのばらつきの大きさを考えるのに都合がよさそうです。この「偏差の平方の平均」を「分散」といいます。

また、分散の平方根を「標準偏差」と言います。分散でも各グループのばらつきの度合いを比較することはできますが、もとの母集団とは「単位」が異なります。

今回のような「得点」だと分かりにくいですが、例えば長さのデータの集団は単位は「m」です。分散は二乗をしているので「㎡」になってしまっています。標準偏差はこの平方根なので単位は元の「m」に戻ります。

平均値と、バラツキの大きさそのものを考えたり比較したりする場合には標準偏差の方が便利なのが分かると思います。

さてG1、G2とも一連の流れで標準偏差を求めてみましょう。

まずG1ですが平均値は先述したとおり78(点)。ここから

データ 偏差 偏差の平方
85 -7 49
80 -2 4
65 13 169
55 23 529
75 3 9
80 -2 4
95 -17 289
90 -12 144
80 -2 4
75 3 9

分散=偏差の平方の平均は121、標準偏差は11(点)となります。

次にG2ですが平均値は同じく78(点)。同様の計算で

データ 偏差 偏差の平方
85 -7 49
75 3 9
75 3 9
70 8 64
75 3 9
75 3 9
90 -12 144
75 3 9
75 3 9
85 -7 49

分散は36、標準偏差は6(点)となりました。

先の最頻値のくだりでその個数が全然違うことからG2の方がデータのバラツキ少ないんじゃね?とうっすら感じてた人もいると思いますが、こうしてみるとそれがよりはっきりわかりますね。

統計の話はこれくらいにしておいてまとめ

で、何が言いたかったかというとマスメディア等で平均をもって報道されるような事柄は必ずしもその事象や集団の全様をそれだけではあらわしていないからね、ってこと。

毎年春闘で賃金が平均何%上がったかみたいな話もあったりしますが、あれはもっそり上がるところも全然上がらないところ(あるいは企業内で上がる人、上がらない人)も含めての話なので全く世の中の賃金事情を代表した話とは言えません。

そもそも連合と日経連の蚊帳の外には自転車操業の中小零細もたくさんあり、逆に大爆発するネオヒルズみたいのもいるわけであれが(明示的ではないものの)世の中全部みたいな取り上げ方を今の時代にするのはちょっとおかしなことなのです。

あとアンケート調査などでは最頻値に着目するのが普通のような気もしますが、むしろ「最頻値以外の回答をする人はなぜそう考えたのか」ということを検討する方が価値のあることのような気もします。なにより質問の仕方でそのような最頻値が出るようにバイアスをかけてる場合もあるので、「人に見せられた資料」にはなにかと注意が必要ですね。

んじゃまた。

コメント

タイトルとURLをコピーしました