生徒の能力を適切に判断したい。そう思う先生、または試験作成担当者は多くいるのではないでしょうか?

ただ、せっかくテストを作っても「過去問」を持っている生徒のほうがテストの結果が良くなり、より評価されるようになる。
逆に、過去問を持っていない生徒はあまり評価されない。
となるとテストとして信用性がなくなりますよね?

今回は項目反応理論と呼ばれる、教育心理学などの領域で知られている、生徒の能力を適切に判断する統計的な手法についてわかりやすく紹介します。

テスト結果から生徒を評価する従来の方法

テスト結果から生徒を評価するにはどうしたら良いでしょうか?
クラス内で行ったテストでの平均点を求めて、その平均点より10点上なら良い。10点下ならだめ。20点より下は赤点といったように決めるのでしょうか?

確かにそのやり方も誰もがわかりますし、やりやすくて良いと思います。
ただし、その手法を使うといくつかの問題点が発生します。
わかりやすい例でいうと、どの生徒がどの領域について、どれくらいわかっていて、どの領域がどれくらいわかっていないかを把握するのが難しいです。

また、テストは毎回全く新しい問題を作る必要性が生じてきます。
なぜなら、仮に過去問に近しい問題を用意すると、生徒が過去問を解いていた場合、非常にその問題を解きやすくなるからです。
そうすると、
「過去問に近しい問題は簡単に解けるが、本来身につけてほしいスキルが身につかない。」といった問題が発生する可能性があります。

テスト結果から正確に生徒を評価する、項目反応理論とは?

項目反応理論とは何なのでしょうか?
その名の通り、あるテスト項目への反応(正解したか不正解だったか)をもとに、生徒の能力を正確に把握する理論です。

例えば、A君とB君の二人がいるときに、
A君は問題1〜10を7問正解、11〜20を3問正解
B君は問題1〜10を9問正解、11〜20を1問正解
といった状況がある時、どのように能力を判定するべきでしょうか?
正解数が、同じ10問だから、二人とも同じだけの理解度がある。
と考えるべきでしょうか?
しかし、もし、問題1〜10が簡単な問題で、11〜20が難しい問題だったらどうでしょうか?
その場合、A君は、おそらく簡単な問題は2つケアレスミスをしたけど、難しい問題をより多く解けたから、A君のほうが能力があるだろう。などと判断することができます。

では、
C君は問題1〜10を6問正解、11〜20を2問正解
という状況では、B君とC君はどちらが能力が上なのでしょうか?

確かに、難しい問題を2問解けたので能力があると言えるかもしれません。
しかし、簡単な問題を4問も間違えているなら、B君のほうがきちんと基礎力があると判断できるかもしれません。

このように、非常に多くの問題や、多くの生徒が様々なパターンで正解や不正解をすると、誰がどれくらいの能力があるのか?
というのを判断するのが非常に難しくなります。

これを統計的・数学的な理論を用いて、定量的にかつ正確に把握することができる手法が項目反応理論です。

項目反応理論を使うメリット

それでは、この「項目反応理論」を使うと、従来とどう違うのでしょうか?
詳細な理論はここでは割愛しますが、主に以下のようなメリットがあります。

1.問題の内容が違っても、生徒の能力を正確に測定できる
2.平均点をテスト実施する前に設定することができる
3.生徒ごとに適切な問題をリアルタイムで選び出すことができる
といった点です。

問題の内容が違っても生徒の能力を正確に測定できる

特に、この1番目のメリットが大きいです。
想像しやすい例でいうと、TOEICテストが項目反応理論を使ったテストです。
TOEICテストでは、毎回テストの内容は違いますが、どのタイミングで受けても、きちんとその時のテスト受験者の能力を測定することができます。
ですので、安心して、英語の能力として、TOEIC◯◯◯点というのが評価されるわけです。

従来の方法ですと、過去問に内容が似ていたので、その問題が解ける。
しかし、本来のその生徒の能力を正確に把握することは難しい
ということが起こりがちですが、TOEICの例のように、毎回のテストで項目反応理論はきちんと能力を把握することができます。

平均点をテスト実施する前に設定することができる

そもそもテストの平均点を求める意味とはなんでしょうか?
それは、クラスの平均を求めることで、ある生徒がクラスの平均より上なのか下なのかと判断することができるため、一つの指標として便利だからです。
つまり、平均点を求め、そこからの差分を考えることが、生徒を適切に評価することにつながると言えます。

しかし、もし極端に、クラスの平均点が偏っていたらどうでしょうか?
例えば、クラスの平均点が10点で、0点付近がほとんどだった
というようなテストがあった場合、全く理解できていない生徒、ちょっとは理解できている生徒などの細かい違いがわかりません。

逆に、みなほぼ100点といったテストを作ってしまった場合も同様でしょう。

時と場合によりますが、平均点をある程度コントロールしたいといった状況でも項目反応理論を使うと、適切に調整することができます。

生徒ごとに適切な問題をリアルタイムで選び出すことができる

項目反応理論を使うと、生徒に適した問題を瞬時に判断し、出題することも可能です。

紙をベースとしたテストでは難しいですが、
昨今のトレンドであるe-learningではこのリアルタイムで問題を出題することも可能です。

リアルタイムで問題を出題することができれば、それぞれの生徒が全く同じ問題を解いていく必要性もなくなり、それぞれの生徒が各自の進捗ペースに合わせて進めていくことができます。

そうすると、従来の皆一斉に同じテストを受ける。といったことが必要とされません。
得意な科目であればより得意を伸ばしていける。
苦手な科目はよりじっくり取り組める。
ということができます。

つまり
「授業が退屈になることも、授業に置いていかれることもなく、各生徒が楽しく勉強に熱中できる。」
そんなことが実現することも可能なのです。

項目反応理論を使って新しい形の教育を実現する

上記で述べたように、項目反応理論を使えば、
生徒の能力を正確に判断できるだけでなく、
過去問ばかり解けるけど、他は解けない。といった生徒ではなく
生徒が本来身につけてほしい能力を身につけてもらうためにも非常に有用です。

それだけでなく、e-learningなどと組み合わせれば、
一人一人の生徒の理解度や進捗度に応じた、授業の設計もすることができるかもしれません。

項目反応理論を使って、先生は生徒一人一人の能力を網羅的に把握し、それぞれの生徒に合った授業を提供し、その都度生徒一人一人と向き合って適切なアドバイスやサポートをすることができるようになります。

もしこのような項目反応理論や、新しいテクノロジーを使って教育を変えたい。もうちょっと理論の詳細も知りたいなどの興味がある方は是非お気軽にお問い合わせからご連絡ください。