Brown 시험서 대규모 AI 부정행위 고발한 교수

5 hours ago 3
  • Brown University의 고급 수리경제학 과목 ECON 1170에서 3월 중간고사 중 최소 50명이 AI로 부정행위를 했다는 의혹이 제기되며 학업 신뢰 문제가 커짐
  • 시험은 take-home 폐쇄형 방식이었고, 일부 답안에서 ChatGPT에 문제를 넣었을 때와 일치하는 비정상적인 대목이 발견됨
  • 중간고사 평균은 96점, 만점자는 40명이었지만 대면 기말고사로 바꾸자 평균은 48점으로 떨어지고 89명 중 59명만 출석함
  • Roberto Serrano는 대학의 대응이 충분하지 않다고 보고, 다음 학년부터 주간 과제를 성적에 반영하지 않고 take-home 시험도 중단하기로 함
  • Princeton도 1893년부터 이어진 Honor Code 기반 무감독 시험 관행을 끝내며, AI가 미국 엘리트 대학의 오래된 평가 방식을 바꾸고 있음

Brown ECON 1170에서 벌어진 AI 부정행위 의혹

  • Roberto Serrano는 Brown University의 Harrison S. Kravis University Professor of Economics이며, 고급 학부 수리경제학 과목 ECON 1170을 가르침
  • 3월 중간고사에서 최소 50명이 부정행위를 했다는 결정적 증거가 있다고 밝힘
  • 그는 이번 사건을 Brown과 Ivy League 전체에서 알려진 가장 큰 부정행위 스캔들로 봄
    • Ivy League에는 Princeton, Harvard, Yale, Columbia, Cornell, Dartmouth College, University of Pennsylvania 등이 포함됨
  • Brown 고위 관계자에게 사건을 보고했지만, 대학 측 반응은 충분하지 않았다고 말함
    • 총장은 침묵했고, 학장은 Academic Code Committee로 사건이 넘어간 뒤에야 “wake-up call”이라는 취지의 메모를 보냄
  • Serrano는 “Academic integrity is a value worth defending”라고 말하며, 고등교육의 미래를 지키려면 문제의 심각성을 공개적으로 인정하고 폭넓은 논의를 시작해야 한다고 봄

시험 방식과 비정상적으로 높은 성적

  • 이번 학기 중간고사와 기말고사는 모두 take-home, closed-book 방식으로 계획돼 있었음
    • Ivy League에는 이런 방식의 시험 전통이 일부 남아 있음
    • 학생에게 거의 제한 없는 시간을 주기 때문에, 평소보다 더 어려운 문제로 학생의 한계를 볼 수 있는 방식이라고 Serrano는 설명함
  • 시험은 수업에서 다룬 모형의 가정을 일부 바꾸고, 새로운 가정 아래 특정 명제가 참인지 거짓인지 증명하게 하는 형태였음
  • ECON 1170은 보통 수강생이 적고 우수한 학생들이 듣는 어려운 과목임
    • 과거 수강생은 한 번에 30명을 넘은 적이 없고, 어떤 때는 8명뿐이었음
    • 이번 학기에는 새 평가 방식 때문일 가능성이 있는 이유로 86명이 수강 신청함
  • 3월 5일 시행된 중간고사 결과는 이례적으로 높았음
    • 평균 점수는 100점 만점에 96점
    • 40명이 만점
    • 채점자들은 여러 불규칙성을 발견했고, 일부 답안에는 문제를 ChatGPT에 넣어 얻은 결과와 일치하는 비정상적인 대목이 있었음

대면 기말고사 이후 드러난 격차

  • Serrano는 중간고사를 무효 처리하지 않았지만, 최종 성적의 50%를 차지하는 기말고사는 대면 시험으로 치르겠다고 학생들에게 알림
  • 기말고사 점수 분포가 중간고사와 비슷하지 않으면 기말고사만 성적에 반영하겠다고도 공지함
  • 대면 기말고사 결과는 중간고사와 크게 달랐음
    • 평균 점수는 100점 만점에 48점으로 하락
    • 중간고사 응시자 89명 중 59명만 기말고사에 출석
    • 기말고사에 오지 않은 27명 중 22명은 중간고사에서 만점을 받았음
    • 평균 점수 비교: {b:96,48}
  • Serrano는 “부정행위에 대한 경험적 증거가 압도적”이라고 말함
  • 다음 학년부터 평가 방식을 바꾸기로 함
    • 주간 과제는 AI로 수행할 수 있으므로 최종 성적에 반영하지 않음
    • 아무리 적합해 보여도 take-home 시험은 더 이상 실시하지 않음

캠퍼스 총격 사건이 시험 방식에 미친 영향

  • Brown University에서는 전년도 12월 13일 총격 사건이 발생함
    • 48세 전 박사과정 학생 Neves Valentes가 캠퍼스에 총을 들고 나타나 발포함
    • 2명이 사망하고 9명이 다쳤으며, 일부는 중상이었음
  • 총격은 Introduction to Economics 기말고사 대비 질의응답 세션이 진행되던 교실에서 발생함
    • 이 세션은 Serrano의 동료 Rachel Friedberg가 이끌고 있었음
    • 부상자 9명 중 2명은 Serrano의 수업을 듣는 학생이었고, 몇 주간 생사를 다투다 살아남음
  • 사망자 중 한 명인 Ella Cook은 사건이 일어난 같은 주 Serrano의 사무실을 찾아온 학생이었음
    • 그녀는 다음 학기 Intermediate Microeconomics 수강 계획과 경제학·수학 공동 전공의 진로 조언을 요청함
  • Serrano는 총격 이후 정신적으로 매우 힘든 시간을 보냈고, 사건 한 달여 뒤 시작되는 학기에서 학생들의 부담을 덜기 위해 시험을 take-home 방식으로 바꾸기로 했음
    • 많은 학생이 12월 사건 이후 캠퍼스에서 불안을 느낀다고 말함
  • 그는 34년 동안 한 번, 매우 정당한 이유로 take-home 시험을 제공했는데 그 반응이 대규모 부정행위였다는 점이 고통스럽다고 말함

AI가 흔드는 엘리트 대학의 평가 관행

  • AI는 미국 엘리트 대학의 오래된 학업 평가 관행을 바꾸고 있음
  • Princeton은 133년 동안 유지한 관행을 끝내고, 앞으로 대면 시험에 교수가 감독으로 들어가기로 함
    • 1893년 Honor Code 도입 이후 Princeton에서는 학생들이 부정행위를 하지 않겠다고 서약했고, 교수는 시험지를 나눠준 뒤 방을 나갔다가 끝날 때 돌아오는 방식이었음
    • 누군가 부정행위를 하면 다른 학생이 신고해야 했음
  • Stanford를 졸업한 22세 저널리스트 Theo Baker는 The New York Times에 “A.I. has made deception easier and more remunerative than ever before”라고 썼음
    • 그는 ChatGPT 첫 버전 출시 두 달 전 Stanford에 입학했고, 4년 동안 주변 학생들이 AI 사용 유혹을 견디지 못하는 모습을 봄
    • “I don’t know a single person who hasn’t used A.I. to get through some assignment in college”라고도 썼음
  • Serrano도 AI가 학생들에게 부정행위를 할 더 큰 유인을 준다고 봄
  • 그는 이런 사건을 덮어서는 안 되며, 진실·품위·정직을 더 이상 지키지 않는다면 학계가 신뢰성을 유지하기 어렵다고 말함
Read Entire Article