テストの採点では公平性が絶対条件ですが、記述式問題を取り入れる大学入学共通テストではその公平性は確保できるのでしょうか(写真:Fast&Slow/PIXTA)

これは、私が講演を行ったとき、会場のママさんスタッフに聞いた話です。ある日、その人の小学6年生の子どもが学校で行われたテストを持ち帰りました。その子は、国語の記述式問題のところを見せながら次のような不満を口にしたそうです。

「この問題、最初はマルがついていたのに、後でサンカクになって、半分の5点になってる。こっちの問題は、最初サンカクだったのに後でマルになってて、これはうれしいけど……。でも、この問題は最初サンカクだったのが後でバツになってる。先生は、なんでこんなに丸付けのときに間違えるのかな? バツならバツって最初からつけてほしい」

これがマルなら、さっきのあの子とあの子のは…?

私はこの話を聞いて、自分も教師だったとき国語の記述式問題の採点で苦労したことを思い出しました。本当に、国語テストにおける記述式問題の採点は、教師にとって悩ましいものです。


この連載の記事一覧はこちら

同じ1つの問題について、はじめは、「これはマル」「あ、これはバツだな」「これはマル」などとつけていきますが、そのうちにマルかバツか微妙な解答が出てきます。マルにはできないけど、バツでもないという解答です。

その場合、部分点をあげるためにサンカクにします。そして、また続けていると、マルとサンカクの中間くらいの解答が出てきます。そこでまた困ります。そして、「う〜ん、これはマルでいいかな……」となったり、「これはやっぱりマルにはできないからサンカクだな」となったりします。

ところが、そう決めた瞬間、今まで丸つけした子の解答を思い出して、「これがマルなら、さっきのあの子とあの子のもマルにかえなきゃ」となることがよくあります。あるいは、その逆もあります。

それで、そこまで採点したものをもう一度最初から見直してサンカクをマルにかえたり、その逆をしたりします。ところが、それで終わればいいのですが、また採点を続けているうちにさらに微妙な解答が出てくることがあります。

低学年の場合は、問題も解答も単純で解答の文字数も少ないので、それほどでもありませんが、高学年になればなるほど、問題も解答も複雑になり文字数も増えるので、こういうことがよく起こります。なぜそこまで気をつかわなければならないのかというと、テストの採点では公平性が絶対条件だからです。

さて、このような経験を基に、私が今心配しているのは2021年1月に初めて行われる大学入学共通テスト(新テスト)のことです。これは、これまで行われていた大学入試センター試験にかわって新たに導入される大学の共通入学試験です。私が心配しているのは、今までの大学入試センター試験ではすべての問題がマークシートによる解答でしたが、新しい大学入学共通テストでは国語と数学において記述式問題が出されるからです。

2018年に行われた試行調査(プレテスト)の問題はこちら。

その中で国語の問題は、記述式問題が3つ出ています。

そして、国語の記述式問題の採点基準がこちら。

誤字・脱字の基準一つを取っても、徹底するのは難しい

一目見ればわかるとおり、記述式問題の採点基準は非常に複雑です。なぜなら、記述式問題の採点ではただ単にマルかバツかで終わることはできず、部分点をつける必要があるからです。でも、私は、このように複雑な採点基準を設けても、それでも判断に迷う微妙な解答はたくさん出てくると思います。

そして、この採点基準をパッと見て心配になるのが、採点基準の注意書きのところに、「(注) 正答の条件を満たしているかどうか判断できない誤字・脱字があった場合は、条件を満たしていないこととなる」と書かれていることです。実は、この誤字・脱字の判断がけっこう難しいのです。

例えば、「木」という字の2画目がはねてあった場合や、「天」の2画目が1画目より長い場合などは、どうでしょう? これらは本当は誤字ではありませんが、誤字だと判断する採点者が出てくるかもしれません。

あるいは、「達」のつくりのほうの横棒線を3本でなく2本にしてしまうとか、「描く」の草冠の下を「田」でなく「由」にしてしまう、などといった受験生がいるかもしれません。これらはもちろん誤字ですが、「これくらいはいい」と判断する採点者と「これはダメ」と判断する採点者に分かれるかもしれません。

または、「熱」の「れんが」の部分を急いで書いて行書体のようになった場合、「これくらいはいい」と判断する採点者と「点が4つないからダメ」と判断する採点者に分かれるかもしれません。このように、誤字・脱字の基準一つを取っても、徹底するのは難しいのです。公平性を確保しようと思えば、誤字・脱字の基準も作っておかなければなりませんが、簡単なことではありません。

さらによく見ると「正答の条件」がかなり曖昧だということにも気づきます。曖昧でないのは、問1「30字以内」、問2「40字以内」、問3「80字以上、120 字以内」という字数だけで、その他の「正答の条件」は「○○○が書かれていること」などとなっています。これは、つまり、「○○○が書かれているか否か」を判断するのは採点者に任されているということです。でも、実はこの判断が難しいのです。

というのも、実際の試験では多種多様な解答が出るはずですが、それを見てある採点者は、「う〜ん、この解答はちょっと物足りないけど一応○○○が書かれているからいいだろう」と判断するかもしれませんし、別の採点者は「物足りないからダメ」と判断するかもしれないからです。これでは公平性の確保はできません。

私は、今「多種多様な解答が出る」と書きましたが、そもそも問1、2、3のすべてにおいて3つずつ示されている「正答の条件を全て満たしている解答の例」(つまり正解例)がすでにかなり多種多様です。そもそも記述式問題の正解例がこんなに多種多様でいいのでしょうか? それは、すでに設問自体が不適切かつ曖昧だからなのではないでしょうか?

約50万の答案を1万人が20日間で公平に採点できるのか

それでも、小規模な試験で1つの会場ですべての採点作業が進むなら、その度に採点者同士が共通理解していくこともできないことはありません。でも、大学入学共通テストは非常に大規模ですから、そんなことはできません。日経新聞によると、約50万人の受験生の国語と数学の記述式問題を、約20日間で採点する必要があるとのことです。そのため、大学入試センターは1万人程度の採点者を確保し、事前研修を充実させるとも書いてあります。

また、次のようにも書かれています。「本番の試験前にはイメージ問題を使って採点者の事前研修を行う。問題が確定した後、試験実施前に同センターと採点責任者が採点基準について協議。試験後に実際の答案を見て採点基準を確定し、採点に取りかかる」。これを見てまた心配になるのは、「問題が確定した後、試験実施前に同センターと採点責任者が採点基準について協議。試験後に実際の答案を見て採点基準を確定」という部分です。

ここにも記述式問題の採点の難しさが表れています。「試験後に実際の答案を見て採点基準を確定」とのことですが、それには20日間のうちの何日間を充てるのでしょうか? 実際の答案を見るのは誰で、確定するのは誰なのでしょうか? 50万人分の答案を全部見るのでしょうか?そんなにドタバタな作業で適切な採点基準が作れるのでしょうか?確定した採点基準を、1万人もいる採点者に短期間でどのように周知徹底するのでしょうか?

採点基準は事前に作ってあるはずですが、実際の答案を見てからさらに細かい採点基準を作って周知徹底するということなのでしょうか? いろいろなことが不透明であり、なおかつ採点の実施に当たっては大きな混乱が予想されます。

以上、記述式問題の採点の難しさを書いてきました。繰り返しますが、一番心配なのは公平性を確保できるのかということです。

実際に、2018年の11月に約8万4000人の高校生が参加した試行調査(プレテスト)では、採点の途中で採点基準の調整が行われました。でも、それが採点担当者に十分伝わらなかったので、最終的にセンターで結果を補正するケースが出たとのことです。本番はそれよりはるかに大きな規模になるのですから、どうなることかと思います。

また、もう1つ記述式問題を取り入れることの大きな問題点は、受験生が試験結果の自己採点をしにくいということです。受験生は自己採点の結果によって出願大学を選ぶことになるわけですが、記述式問題の場合、自分が何点取れたかがわかりにくいのです。これは受験生の人生に多大な影響を及ぼすものであり大きな問題です。この問題については、おおたとしまさ氏が指摘しているとおりだと思います。