Babylon5以外のメモ by X^2

アクセスカウンタ

help リーダーに追加 RSS 正規分布信仰と偏差値

<<   作成日時 : 2005/08/22 20:32   >>

トラックバック 0 / コメント 0

8/20の朝日新聞Be on Sundayに、偏差値についての解説記事がありました。その中で、「最近、中学・高校の数学の得点分布は、(正規分布には従わずに)上位と下位の二つの山に分かれる傾向があることがわかった」とあり、「もはや、正規分布を神聖視してはいられない」という専門家のコメントが付いています。
しかし実際のところ、こんな事は当たり前なのではと思います。試験の得点分布が正規分布になる根拠は極めて曖昧で、信仰の域を出ないからです。試験に限らず、いろいろなデータの分布が正規分布に近くなる理論的根拠は、確率論の「中心極限定理」が基礎にある訳ですが、その主張は、「独立同分布なn個の確率変数の算術平均は、(より正確には、平均そのものは定数に収束するので、その定数との誤差は)、nが無限大に近づくとき、元の確率変数の分布に依らずに正規分布に法則収束する」というものです。ここで、「独立同分布」という仮定が重要で、それがなければ平均が正規分布に収束する保障はありません。
さて、ある試験の二つの問題を考えたとき、その二つに正解するかどうかは、個々の受験者にとって独立ではありません。分野が全く異なる問題であっても独立とは思えませんが、ましてや同一科目の問題なら、両方に正解不正解が連動する率が高いはずです。従って、中心極限定理の独立性の仮定は成り立っておらず、この定理は適用できない事になります。
逆に、もし全ての問題の正誤が100%相関するなら、その平均は単一の問題の得点分布に等しくなり、部分点が無ければ0点と100点に二本のスパイクが立つ分布になります。実際には100%は相関しないですから、スパイクの崩れた二山分布になるのはいかにも尤もらしい訳です。
グラフを書いて二山分布になれば、それが正規分布ではない事が誰の目にも明らかですが、より微妙な場合があります。分布の中央付近が盛り上がった一山分布であっても、正規分布より裾が厚い、つまり平均から離れた部分の面積がより大きい分布である可能性があります。この事実は最近の数理経済学で問題になっているようです。数理経済学で有名なBlack-Scholes公式では、例えば株価の偶然による動きはBrown運動に従い、従ってその変動は正規分布に従うと仮定しています。しかし、現実の動きを見たとき、正規分布に従うならあまりにも稀な現象が、実際にはより高い頻度で起こっており、それを積極的に説明するために、より裾の厚い分布を仮定すべきという議論が出てきました。直感的にも、分布の元となる個々の現象が独立ではなく、ある程度の相関があれば、正規分布より裾が厚くなるのは自然です。従って、試験の得点分布も、例え一山分布でも正規分布ではない事は十分に有り得ます。
試験の得点の場合、もう一つ問題なのは上下に有界な点です。普通の試験では、最高点が100点、最低点が0点ですが、正規分布を初めとする分布では上下に青天井です。従ってここからも、正規分布からのずれが生じる事になります。
このように考えて行くと、試験の点数が正規分布に従う(べき)というのは、信仰というより迷信に過ぎない事が良く解ります。そもそも、点数分布を本当に正規分布にしたいなら、あてずっぽうに答えるしかない選択問題を沢山並べれば良いわけですが、それが「良い試験問題」であるはずはありません。また、仮に入学試験の成績が正規分布であって、合否ラインがちょうどその山の辺りに来た場合(つまり倍率がほぼ二倍)、誤差でしかない点数の差という、運不運によって合否が分かれる事になります。これでは「良い」試験とは言えないでしょう。むしろ二山分布なら、合否ラインが人数の少ない谷の部分になり、運不運にあまり左右されない結果となりますから、良い試験と言えます。従って「試験問題の成績分布は正規分布になるべき」というのも思い込みです。このような事を理解しないままに、世間では正規分布信仰がまかり通っているようです。
さて、試験の成績が正規分布に従わないなら、「偏差値」産業は重大な影響を受けるでしょう。最初に挙げた記事に書かれていた通り、「正規分布に近くないなら、今の偏差値は指標としての役割を十分に果たしていない」事になります。確かに正規分布なら、偏差値45から55の間には全体の38%が入っており、また偏差値65以上は7%となる、などは事実です。しかし、正規分布でなければ、それらの数値には根拠がなくなりますから、その数値に基づいた受験指導も、正当性の根拠が失われます。また、五段階の相対評価において1と5を付ける割合を、上の割合に従って厳しく規定していた旧文部省の指導も、その正当性が無かった事になります。恐らく大手予備校なら、模試の点数分布の膨大なデータを持っているでしょうから、この辺りの問題を検証しているのではと想像していますが、実際の所はどうなのでしょうか?

設定テーマ

注目テーマ 一覧

月別リンク

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文