[박형주 칼럼] 시험과 평가의 난류
박형주 아주대 수학과 석좌교수(전 아주대 총장)
프랑스의 마크롱 정부는 2018년에 프랑스 교육제도의 개혁을 예고했다. 프랑스 교육의 상징으로 여겨지곤 하는 바칼로레아 제도의 개혁 시도가 날 선 대립으로 이어지며 프랑스는 사회적 갈등을 피할 수 없었고 교육계에는 전운이 감돌았다. 하지만 프랑스도 코로나 감염병의 확산을 피할 수 없었고, 그 여파로 마크롱 교육개혁도 미뤄지게 됐다. 필자가 프랑스를 방문한 것은 몇 년의 연기 끝에 프랑스 정부의 교육개혁이 본격적으로 시작된 2023년 봄, 현지에서 격렬한 찬반 논쟁이 벌어지고 있던 때였다.
바칼로레아는 나폴레옹 시대에 시작되어 200여 년간 지속되어 온 프랑스 대학 입학 자격시험이다. 대부분의 문제가 서술형으로 통합적 사고를 요구하는 시험이고, 답안 서술의 과정에서 자기 생각을 얼마나 논리적으로 설득력 있게 썼는지를 중시한다. ‘스스로 생각하는 힘’을 중시하는 프랑스 교육의 근간이자 자부심으로 불리기도 한다. 하지만 새로운 개혁안은 바칼로레아 시험 과목 수를 대폭 축소했고, 학교 내신시험 성적을 대학 입시전형에 상당히 반영하도록 했다. 당연히 전통주의자들의 반대는 불 보듯 했고, 실제로 필자가 파리에서 만난 수학자들은 하나같이 반대 의견이 강했다.
관찰자의 입장에서 이 논쟁을 지켜보며 든 생각은, ‘우리나라의 수시-정시 논쟁과 다를 게 없구나’라는 것이었다. 게다가 평가 제도의 근간을 바꾼다는 것은 정말 힘들다는 것도 분명해 보였다. 프랑스의 경우에는 단기적으로 수시가 더 힘을 받는 것 같았지만, 그마저도 아직 우여곡절이 남아있는 것으로 보였다.
초등학교에 입학하고 중고등학교를 거쳐 대학에 가는 현대적 교육 시스템은 나라마다 조금씩의 차이는 있지만, 이젠 보편적 제도가 됐다. 이러한 과정에서 학생은 많은 ‘시험’을 치르게 되는데, 시험을 대하는 각 나라의 방식에서 여러 가지 차이가 드러난다.
우리나라의 대학 입시처럼 수요가 공급을 초과하는 경우에는, 선발의 측면이 부각되고 ‘변별력’이 중요해진다. 변별력을 확보하기 위해서 여러 방안이 등장했는데, 일단 문항 수를 늘리는 방안이 있다. 문항 수를 줄이면 만점자가 너무 많이 나온다는 경험칙도 한몫했다. 2015년에 한국과 프랑스의 고등학교 1학년 수학 중간고사 문제를 바꾸어 풀게 하는 실험을 해본 적이 있었는데, 당시에 문항 수를 비교해 보면 한국 대 프랑스가 8대 1이었다. 선다형 중심의 8과 서술형 중심의 1의 대비는 극명했다. 한국 문제를 풀었던 프랑스 학생의 후일담은 지금도 기억이 생생하다. “이렇게 많은 문제를 풀어 본 적이 없어서 다 풀어볼 엄두가 안 났어요.”
그런데 공부와 문제 풀이에 나름 진심인 요즘 한국 학생들은 반복 학습을 통해 유형별 문제 풀이를 연습하고, 웬만큼 많은 문제도 주어진 시간 안에 풀어낸다. 유형별 반복학습은 사교육이 휘두르는 ‘전가의 보도’가 됐고, 입시를 정점에 둔 우리나라의 평가 제도에서 최적화된 해법으로 자리 잡았다. 그래서 질문하게 된다. 이렇게 많은 문제를 빠르게 ‘실수 없이’ 풀어내는 능력이, 그들이 살아갈 미래 사회에서 필요한 능력인가. 그런 능력이 미래에 그들이 선택한 분야에서의 성공을 담보해 줄 스킬인가.
학생들의 ‘빠르고 실수 없이 문제 풀기’ 역량이 늘면, 변별력 확보를 위한 난이도 조절은 더 어려운 문제가 된다. 이런 과정에서 개념을 극단적인 형태로 꼬아놓은 문제들이 등장하기도 했는데, 킬러 문항이 사회적 이슈가 되면서 최근엔 중간 난도 문항 등의 좀 더 순화된 방식으로 대치되고 있는 것 같다.
반면에 학교에서의 중간고사나 기말고사처럼, 학생의 교육과정 이해도를 ‘진단’하고 부족하거나 추가 학습이 필요한 부분을 학생에게 ‘피드백’해 주는 기능이 중요한 시험도 있다. 세계 최고 수준의 대학 진학률을 기록해 온 우리나라에서는 전자, 즉 변별력 중심의 대학 입시가, 다른 모든 교육 제도의 기능과 역할보다 우위에 있는 상태가 지속됐고, 결과적으로 여러 사회적 문제를 양산해 왔다. 후자, 즉 진단과 피드백이라는 평가의 가치가 종종 잊히고, 채점 공정성이라는 기준으로 볼 때 논란이 적은 선다형 또는 단답형 문제들이 선호됐다.
1980년대 초까지의 대학입시에서는 대학별 본고사 제도가 있었다. 난도가 높은 서술형 문항들로 이뤄진 본고사는, 당시의 주입식 암기 위주의 학교 교육에서 파생된 문제들을 상당히 상쇄시키는 역할을 했다. 서술형 문제에 답한다는 것은 학생의 생각을 기록한다는 측면과 채점자를 설득하려는 시도라는 측면을 갖기 때문이다. 이런 문제들의 풀이를 연습하는 과정에서, 주입식 암기 교육을 수동적으로 따르는 것으로는 다다를 수 없는 ‘생각하는 힘’을 얻을 수 있었던 것으로 해석할 수 있다.
대학의 수학과 전공과목을 가르치면서 서술형 문제들을 출제하고 채점할 때, 완결된 문장이 아닌 ‘비문’ 또는 ‘단어들의 나열’ 수준의 답안을 종종 본다. 분명히 문제의 해법을 알고 있지만 이를 효과적으로 서술하는 방법을 모르는 경우다. 이해심 많은 채점자를 만난다면 만점을 받을 수 있을지도 모르지만, 나중에 갖게 될 직장에서도 이런 수준의 보고서를 이해심 있게 받아줄까? 앞에서 언급한 프랑스 고등학교 학생들의 경우는, 선다형 문제에서조차도 풀이의 과정을 기록하는 습관을 보였다. 물론 ’빠르게 풀기’ 관점에서는 망하는 지름길이지만, 이런 연습을 거친 학생들의 보고서가 그들을 고용한 회사에는 훨씬 설득력 있는 보고서로 비치지 않을까?
오랫동안 간과되어 온 평가의 가치인 ‘진단과 피드백’을 복원하고 ‘실수해도 부분 점수를 받을 수 있는’ 서술형 평가를 획기적으로 확대하는 것은 어떻게 가능할까. 일단 ‘한번 쓰고 버리는’ 일회성 문제 출제 제도를 과감히 버리고, 적어도 서술형 문항에 한해서라도 ‘문제 은행’ 방식이 도입돼야 한다. 현행 제도에서는 주옥같은 좋은 문제를 만들어 놓고는 한번 쓰고 버려야 한다. 사교육에서 사용했던 문제라거나, 사설 문제지에 있는 문제라서 특정 학생들이 이익을 볼 수 있다는 등의 이유 때문이다. 이런 이유로 기존에 있던 문제를 피하고 새로운 문제를 만들다 보면, 오류가 있는 문제나 지엽적인 문제가 출제되는 경우가 종종 발생한다. 또는 기존 문제를 심하게 꼬는 기형적인 문제도 출현한다. 정말로 좋은 문제들을 엄선해서 문제은행을 만들고, 문제들을 투명하게 공개해서 특정 사교육 업체나 특정 학생군이 수혜를 받지 않도록 촘촘히 제도를 만들어야 한다. 이런 방식에서는 인공지능을 활용한 서술형 문항 채점도 가능하고 데이터의 축적에 따라 더 정교해지는 부가 효과도 있다. 서술형 문항의 인공지능 채점 방식이 확대되면, 채점 업무 과중이나 채점 공정성 이슈의 해결도 기대해볼 수 있지 않을까.
<한국대학신문>