Brown 시험서 대규모 AI 부정행위 고발한 교수

5 hours ago 3

Brown University의 고급 수리경제학 과목 ECON 1170에서 3월 중간고사 중 최소 50명이 AI로 부정행위를 했다는 의혹이 제기되며 학업 신뢰 문제가 커짐
시험은 take-home 폐쇄형 방식이었고, 일부 답안에서 ChatGPT에 문제를 넣었을 때와 일치하는 비정상적인 대목이 발견됨
중간고사 평균은 96점, 만점자는 40명이었지만 대면 기말고사로 바꾸자 평균은 48점으로 떨어지고 89명 중 59명만 출석함
Roberto Serrano는 대학의 대응이 충분하지 않다고 보고, 다음 학년부터 주간 과제를 성적에 반영하지 않고 take-home 시험도 중단하기로 함
Princeton도 1893년부터 이어진 Honor Code 기반 무감독 시험 관행을 끝내며, AI가 미국 엘리트 대학의 오래된 평가 방식을 바꾸고 있음

Brown ECON 1170에서 벌어진 AI 부정행위 의혹

Roberto Serrano는 Brown University의 Harrison S. Kravis University Professor of Economics이며, 고급 학부 수리경제학 과목 ECON 1170을 가르침
3월 중간고사에서 최소 50명이 부정행위를 했다는 결정적 증거가 있다고 밝힘
그는 이번 사건을 Brown과 Ivy League 전체에서 알려진 가장 큰 부정행위 스캔들로 봄
- Ivy League에는 Princeton, Harvard, Yale, Columbia, Cornell, Dartmouth College, University of Pennsylvania 등이 포함됨
Brown 고위 관계자에게 사건을 보고했지만, 대학 측 반응은 충분하지 않았다고 말함
- 총장은 침묵했고, 학장은 Academic Code Committee로 사건이 넘어간 뒤에야 “wake-up call”이라는 취지의 메모를 보냄
Serrano는 “Academic integrity is a value worth defending”라고 말하며, 고등교육의 미래를 지키려면 문제의 심각성을 공개적으로 인정하고 폭넓은 논의를 시작해야 한다고 봄

이번 학기 중간고사와 기말고사는 모두 take-home, closed-book 방식으로 계획돼 있었음
- Ivy League에는 이런 방식의 시험 전통이 일부 남아 있음
- 학생에게 거의 제한 없는 시간을 주기 때문에, 평소보다 더 어려운 문제로 학생의 한계를 볼 수 있는 방식이라고 Serrano는 설명함
시험은 수업에서 다룬 모형의 가정을 일부 바꾸고, 새로운 가정 아래 특정 명제가 참인지 거짓인지 증명하게 하는 형태였음
ECON 1170은 보통 수강생이 적고 우수한 학생들이 듣는 어려운 과목임
- 과거 수강생은 한 번에 30명을 넘은 적이 없고, 어떤 때는 8명뿐이었음
- 이번 학기에는 새 평가 방식 때문일 가능성이 있는 이유로 86명이 수강 신청함
3월 5일 시행된 중간고사 결과는 이례적으로 높았음
- 평균 점수는 100점 만점에 96점
- 40명이 만점
- 채점자들은 여러 불규칙성을 발견했고, 일부 답안에는 문제를 ChatGPT에 넣어 얻은 결과와 일치하는 비정상적인 대목이 있었음

Serrano는 중간고사를 무효 처리하지 않았지만, 최종 성적의 50%를 차지하는 기말고사는 대면 시험으로 치르겠다고 학생들에게 알림
기말고사 점수 분포가 중간고사와 비슷하지 않으면 기말고사만 성적에 반영하겠다고도 공지함
대면 기말고사 결과는 중간고사와 크게 달랐음
- 평균 점수는 100점 만점에 48점으로 하락
- 중간고사 응시자 89명 중 59명만 기말고사에 출석
- 기말고사에 오지 않은 27명 중 22명은 중간고사에서 만점을 받았음
- 평균 점수 비교: {b:96,48}
Serrano는 “부정행위에 대한 경험적 증거가 압도적”이라고 말함
다음 학년부터 평가 방식을 바꾸기로 함
- 주간 과제는 AI로 수행할 수 있으므로 최종 성적에 반영하지 않음
- 아무리 적합해 보여도 take-home 시험은 더 이상 실시하지 않음

Brown University에서는 전년도 12월 13일 총격 사건이 발생함
- 48세 전 박사과정 학생 Neves Valentes가 캠퍼스에 총을 들고 나타나 발포함
- 2명이 사망하고 9명이 다쳤으며, 일부는 중상이었음
총격은 Introduction to Economics 기말고사 대비 질의응답 세션이 진행되던 교실에서 발생함
- 이 세션은 Serrano의 동료 Rachel Friedberg가 이끌고 있었음
- 부상자 9명 중 2명은 Serrano의 수업을 듣는 학생이었고, 몇 주간 생사를 다투다 살아남음
사망자 중 한 명인 Ella Cook은 사건이 일어난 같은 주 Serrano의 사무실을 찾아온 학생이었음
- 그녀는 다음 학기 Intermediate Microeconomics 수강 계획과 경제학·수학 공동 전공의 진로 조언을 요청함
Serrano는 총격 이후 정신적으로 매우 힘든 시간을 보냈고, 사건 한 달여 뒤 시작되는 학기에서 학생들의 부담을 덜기 위해 시험을 take-home 방식으로 바꾸기로 했음
- 많은 학생이 12월 사건 이후 캠퍼스에서 불안을 느낀다고 말함
그는 34년 동안 한 번, 매우 정당한 이유로 take-home 시험을 제공했는데 그 반응이 대규모 부정행위였다는 점이 고통스럽다고 말함

AI는 미국 엘리트 대학의 오래된 학업 평가 관행을 바꾸고 있음
Princeton은 133년 동안 유지한 관행을 끝내고, 앞으로 대면 시험에 교수가 감독으로 들어가기로 함
- 1893년 Honor Code 도입 이후 Princeton에서는 학생들이 부정행위를 하지 않겠다고 서약했고, 교수는 시험지를 나눠준 뒤 방을 나갔다가 끝날 때 돌아오는 방식이었음
- 누군가 부정행위를 하면 다른 학생이 신고해야 했음
Stanford를 졸업한 22세 저널리스트 Theo Baker는 The New York Times에 “A.I. has made deception easier and more remunerative than ever before”라고 썼음
- 그는 ChatGPT 첫 버전 출시 두 달 전 Stanford에 입학했고, 4년 동안 주변 학생들이 AI 사용 유혹을 견디지 못하는 모습을 봄
- “I don’t know a single person who hasn’t used A.I. to get through some assignment in college”라고도 썼음
Serrano도 AI가 학생들에게 부정행위를 할 더 큰 유인을 준다고 봄
그는 이런 사건을 덮어서는 안 되며, 진실·품위·정직을 더 이상 지키지 않는다면 학계가 신뢰성을 유지하기 어렵다고 말함