「平均値に惑わされるな!」に惑わされるな!

世間ではよく「平均値のトリック」ということが言われます。統計情報の代表値にはいくつかの種類があって、その代表的なものは平均値(average)、中央値(median)、最頻値(mode)であり、多くの場合は相加平均値が使用されるわけです。
今週の「R25」の中程に、「平均値に惑わされるな!」という記事が載っています。民間企業に勤めていれば誰でも気になる「平均年収」の件ですね。ちなみに雑誌の特集やwebサイトなどでこのような情報がなぜ分かるのかというと、株式公開している会社なら「有価証券届出書」という情報を年度ごとに公表しなければならず、その中の一つの項目として「従業員の状況」があり、そこに平均年収や平均勤続年数などが記載されているためです。
一部の従業員の年収が際だって高いために、平均年収も思いのほか高いかのように表されてしまうというのは、よくあることです。これを一般的には「平均値のトリック」などと呼びます。
例としてパレートの法則を擬似的に悪用して、「平均年収1,000万円の企業で、2割の従業員が8割の報酬を得ている」と仮定しましょう。この状態では大半を占める8割の従業員はたった250万円しか得ていないことになります。それでもこの企業の平均年収は1,000万円と表示されることになります。残りの2割の従業員が4,000万円ずつ受け取っているためです。
これが「平均値のトリック」であり、「だから仕方ないね」という話なら今週の「R25」の記事と同じです。しかし、平均値が持つ意味というのはそんな軽いものではありません。平均値は従業員数で乗算すればそのまま具体的な総報酬額になります。つまり、もっとも実態に即した代表値でもあるわけです。
平均に比べて自分の年収が少ないことを「そんなの平均値のトリックだろ、実際はみんな似たようなもんじゃないか」と片づけられる人は幸いです。しかしもう少し想像力のある人は、実際には自分の企業が負担している巨額の人件費のうち、非常に少ない部分の恩恵にしか与っていないことに容易に気づきます。
上記の例の企業が従業員100名だとすると、80人の従業員のうちのそれぞれ一人は100人のうちの一人(1%)であるにもかかわらず、10億円の総報酬額のうち250万円(0.25%)しか受け取れません。この例は従業員を2種類にしか分けていない点で極端ですが、現実によくある企業の年収の分布としてはこの傾向と大差ない現象が起きていると思われます。
(相加)平均値はデータの個数倍すればそのまま総和になるということは、当たり前ですが忘れがちです。私はこれを「『平均値のトリック』のトリック」と呼びます。