AI 탐지기 ‘0%‘의 함정… 대학가는 지금 ‘창과 방패’의 전쟁 중
지난해 서울대·연세대에서 터진 대규모 집단 커닝 사건 이후 1년. 대학가는 “AI와의 전쟁”을 선포했지만, 현장은 오히려 더 은밀하고 정교해졌습니다. 본지는 실제 2025학년도 2학기 서울대 교양 수업에서 A학점을 받은 리포트 3건을 입수, 최신 AI 탐지 툴로 분석하고 해당 학생들을 심층 인터뷰했습니다.
”교수님은 절대 모릅니다”: 진화하는 치팅 수법
인터뷰한 학생 A씨(서울대 공대 3학년)는 “순수 챗GPT 생성물은 걸리지만, ‘AI 리라이팅(Rewriting) + 문체 이식(Style Transfer)’ 기술을 쓰면 탐지율 0%가 나온다”고 고백했습니다. 실제 그가 제출해 A+를 받은 과제물을 ‘GPTZero’, ‘Turnitin(턴잇인)’ 유료 버전으로 검사한 결과, ‘인간 작성 확률 98%‘로 판명되었습니다.
A씨는 AI가 쓴 초안을 자신의 과거 리포트 말투로 변환시키는 ‘퍼스널 AI 에이전트’를 활용했습니다. 이는 단순히 문장을 다듬는 수준을 넘어, 학생 고유의 오탈자 습관이나 문장 호흡까지 모방합니다. 이러한 개인화된 AI 모델은 기존의 대규모 언어 모델(LLM) 패턴 분석 방식으로는 잡아내기 불가능에 가깝습니다.
뚫리는 방패: 탐지 프로그램의 한계 현재 대학들이 도입한 턴잇인(Turnitin) 등의 표절 검사 프로그램은 기존 데이터베이스와의 일치도를 확인하는 데 특화되어 있습니다. 생성형 AI가 매번 새롭게 만들어내는 문장은 기존 데이터베이스에 존재하지 않기 때문에 표절률 0%로 통과됩니다. AI 작성 여부를 판단하는 기능이 추가되었지만, 위에서 언급한 리라이팅 기술 앞에서는 무용지물입니다.
“건당 1~2만 원만 주면 탐지기 프리패스 가능합니다.”
대학가 커뮤니티인 에브리타임과 각종 오픈채팅방에서는 일명 ‘AI 세탁’ 서비스가 성행하고 있습니다. AI가 작성한 글을 사람이 쓴 것처럼 문체를 수정해주는 서비스입니다. 심지어 일부 업체는 “탐지기에 걸릴 시 100% 환불”이라는 조건까지 내걸고 영업 중인 것으로 확인되었습니다.
학생들은 죄책감을 느끼기보다 이를 ‘효율성’의 문제로 받아들이고 있습니다. 인터뷰에 응한 B씨(연세대 사회과학대 2학년)는 “취업 준비와 스펙 쌓기에 바쁜데, 교양 과제 하나에 며칠 밤을 새우는 건 미련한 짓”이라며 “다들 쓰는데 나만 안 쓰면 손해라는 인식이 팽배하다”고 말했습니다.
형식적인 ‘AI 윤리 교육’과 무너진 평가 시스템
대학들은 ‘GPT 킬러’ 같은 탐지 프로그램을 도입하고 시험을 오프라인으로 전환했지만, 과제 비중이 높은 수업은 여전히 무방비 상태입니다. 교수들조차 명확한 기준 없이 혼란스러워하고 있으며, 이는 결국 공정한 평가 시스템의 붕괴로 이어지고 있습니다.
교수의 딜레마: 심증은 있지만 물증이 없다
익명을 요구한 서울대의 한 인문대 교수는 “리포트 문장이 학부생 수준이라고 믿기 힘들 만큼 유려해 의심은 가지만, 탐지 프로그램이 ‘표절 아님’이라고 뜨면 점수를 깎을 명분이 없다”고 토로했습니다.
- 심증만으로 학점 부여 불가: 학생이 교육부 소청 심사라도 청구하면 입증할 방법이 없어 골치 아프다는 입장입니다.
- 오프라인 시험의 부활: 이에 대한 대책으로 많은 강의가 과제 비중을 줄이고 100% 오프라인 자필 시험으로 회귀하고 있습니다. 하지만 이는 ‘암기 위주 교육’으로의 퇴보라는 비판을 받습니다.
‘구술 면접’의 확대와 현실적 제약 일부 교수들은 리포트 제출 후 1:1 구술 면접을 통해 학생이 내용을 제대로 숙지했는지 확인하는 방식을 도입했습니다. 하지만 수강생이 100명이 넘는 대형 강의에서는 물리적으로 불가능한 방법입니다. 또한 조교 인력 부족과 시간적 제약으로 인해 이마저도 형식적인 절차에 그치는 경우가 많습니다.
AI 활용 가이드라인의 모호성 교육부와 대학 본부는 ‘AI 활용 윤리 가이드라인’을 배포했지만, 내용은 “AI 사용 시 출처를 명기하라”는 원론적인 수준에 머물러 있습니다. 구체적으로 어디까지가 허용 범위인지, 리라이팅 도구를 사용한 것은 창작인지 표절인지에 대한 사회적 합의조차 이루어지지 않은 상황입니다.
이러한 상황 속에서 성적 경쟁이 치열한 일부 학과에서는 학생들이 서로를 감시하고 신고하는 일도 벌어지고 있습니다. “저 친구 리포트는 AI 냄새가 난다”며 조교에게 익명 제보를 하거나, 단체 채팅방에서 공론화시키는 등 학내 분위기가 살벌해지고 있습니다.
기술적 대응: ‘워터마킹’ 기술의 현주소
오픈AI(OpenAI)와 구글(Google) 등 빅테크 기업들은 생성된 텍스트에 보이지 않는 ‘워터마크’를 삽입해 AI 작성 여부를 식별하게 하겠다고 발표했습니다. 하지만 2025년 말 현재, 이 기술은 여전히 완벽하지 않습니다.
텍스트 워터마킹의 기술적 난제와 회피
텍스트 워터마킹은 특정 단어의 배열 패턴을 조작하여 표시를 남기는 방식입니다. 하지만 사용자가 단어 몇 개만 바꾸거나 문장 구조를 살짝만 비틀어도 워터마크 정보가 손상되어 탐지가 불가능해집니다.
- 교착어 특성: 한국어처럼 교착어 특성을 가진 언어에서는 워터마킹의 견고성이 더욱 떨어지는 것으로 나타났습니다.
- 오픈소스 모델의 확산: 더 큰 문제는 챗GPT 같은 상용 모델이 아닌, 라마(LLaMA) 기반의 오픈소스 모델들입니다. 개인 PC에서도 구동 가능한 경량화 모델(sLLM)들이 쏟아져 나오면서, 워터마크가 없는 순수 생성 텍스트를 누구나 쉽게 만들어낼 수 있게 되었습니다.
탐지 기술과 회피 기술의 무한 경쟁 보안 업계 관계자는 “탐지 기술이 발전하면 회피 기술은 그보다 한 발 더 빨리 진화한다”며 “이것은 끝나지 않는 창과 방패의 싸움”이라고 정의했습니다. 결국 기술적인 필터링만으로는 근본적인 해결책이 될 수 없다는 것이 전문가들의 중론입니다.
대학 자체 탐지 시스템 개발의 한계 일부 대학은 공대 연구팀을 중심으로 자체 탐지 알고리즘을 개발하고 있습니다. 하지만 학습 데이터 확보의 어려움과 유지 보수 비용 문제로 인해 상용화 단계에 이르지 못하고 있습니다. 또한 특정 대학이 개발한 툴이 공개될 경우, 해커들의 표적이 되어 우회 방법이 금방 공유될 것이라는 우려도 큽니다.
현재 전 세계적으로도 AI 표절에 대한 통일된 기준이나 탐지 표준이 없습니다. 각 대학이나 교수의 재량에 맡겨져 있다 보니, 같은 AI 활용 리포트라도 어떤 수업에서는 A학점을, 어떤 수업에서는 F학점을 받는 불공정한 상황이 계속되고 있습니다.
‘AI 리터러시’ 교육의 허상
대학들은 신입생 오리엔테이션과 필수 교양 과목을 통해 ‘AI 리터러시’ 교육을 강화하고 있다고 홍보합니다. 하지만 학생들이 체감하는 교육의 질은 턱없이 낮습니다.
”하지 마라”만 반복하는 금지 위주 교육
취재진이 참관한 서울시내 모 대학의 ‘AI 윤리’ 특강은 2시간 내내 표절의 위험성과 적발 시 징계 내용만을 나열하는 데 그쳤습니다. AI를 어떻게 학습의 도구로 활용할 것인지, 어떻게 비판적으로 수용할 것인지에 대한 건설적인 논의는 실종된 상태였습니다.
더 심각한 문제는 정작 학생들을 가르치는 교수자들의 AI 이해도가 학생들보다 낮다는 점입니다.
- “챗GPT가 뭐냐”고 묻는 노교수부터,
- AI가 만든 허위 정보(할루시네이션)를 팩트 체크 없이 수업 자료로 쓰는 경우까지 목격되었습니다.
실무와 괴리된 평가 기준 기업 현장에서는 이미 AI 활용 능력을 필수 역량으로 요구하고 있습니다. 보고서 초안 작성, 코딩, 데이터 분석 등에서 AI를 얼마나 잘 쓰느냐가 생산성을 좌우합니다. 하지만 대학은 여전히 ‘AI 없는 청정 구역’을 고집하며 시대착오적인 평가 방식을 고수하고 있습니다. 이는 대학 교육과 산업 현장의 미스매치를 심화시킵니다.
“교수님은 AI 쓰지 말라고 하지만, 취업 면접 가면 면접관은 ‘챗GPT로 업무 효율 높인 경험’을 묻습니다.”
한 재학생은 대학의 윤리 교육이 현실과 동떨어져 있다고 비판했습니다. 전문가들은 ‘금지’가 아닌 ‘공존’을 가르쳐야 한다고 입을 모읍니다. AI가 작성한 글을 비평하고 수정하는 과제, AI와 협업하여 결과물을 도출하는 프로젝트 등 평가 방식 자체를 혁신해야 합니다.
해외 대학들의 대응 사례
그렇다면 해외 유수의 대학들은 이 문제에 어떻게 대처하고 있을까요? 전면 금지보다는 적극적인 수용과 평가 혁신을 택한 사례들이 주목받고 있습니다.
하버드대의 ‘AI 튜터’ 도입
하버드대학교 컴퓨터과학과 입문 강좌인 CS50은 자체 개발한 AI 챗봇을 조교로 도입했습니다. 이 챗봇은 정답을 알려주는 대신, 소크라테스식 문답법으로 학생들이 스스로 답을 찾도록 유도합니다. AI를 치팅의 대상이 아닌 학습 파트너로 공식화한 것입니다.
호주 대학들의 평가 방식 전면 개편 호주의 주요 대학 협의체는 “생성형 AI로 수행 가능한 과제는 과제로서의 가치가 없다”고 선언했습니다. 그들은 에세이 위주의 평가를 대폭 축소하고, 현장 실습 보고서, 구술 시험, 멀티미디어 제작 등 AI가 대체하기 힘든 평가 비중을 늘렸습니다.
- 싱가포르 경영대(SMU): 학생들이 AI 도구를 사용하여 과제를 수행하는 것을 권장합니다. 대신, AI가 생성한 결과물을 검증(Verify)하고, 수정(Edit)하고, 발전(Improve)시키는 과정을 평가합니다.
- 유럽 대학들의 ‘슬로우 사이언스’: 일부 유럽 대학들은 전자기기 반입을 금지한 ‘리딩 리트리트(Reading Retreat)’ 프로그램을 운영하며, AI가 범접할 수 없는 인간 고유의 사유 능력을 키우는 데 집중하고 있습니다.
아이비리그를 포함한 전 세계 주요 대학들은 ‘AI 교육 혁신 컨소시엄’을 구성하여 AI 시대의 새로운 평가 모델과 윤리 기준을 공동 연구하고 있습니다. 서울대와 카이스트 등 국내 대학들도 최근 이 네트워크에 참여하여 글로벌 스탠다드를 모색하기 시작했습니다.
”치팅이 아니라 ‘스킬’입니다”
“AI는 이제 커닝 페이퍼가 아니라 계산기 같은 도구죠.”
고려대학교 4학년에 재학 중인 C씨(24)는 자신을 ‘치터(Cheater, 부정행위자)‘가 아닌 ‘얼리어답터(Early Adopter)‘라고 정의했습니다. 취재진이 만난 그는 학점 관리부터 과제 제출까지 대학 생활의 모든 영역에서 생성형 AI를 적극적으로 활용하고 있었습니다. 그의 주장은 명확했습니다. “남들보다 조금 더 빨리, 효율적인 도구를 선택했을 뿐”이라는 것입니다.
Q. AI를 과제에 사용하는 것에 죄책감은 없나? “전혀 없다. 계산기가 발명됐는데 주판을 놓는 사람은 없지 않나. AI를 써서 더 좋은 퀄리티의 리포트를 더 빨리 써내는 것은 능력이다. 나중에 회사에 가서도 맨땅에 헤딩하는 사람보다 AI 잘 쓰는 사람을 더 좋아할 것이다. 나는 미리 연습하는 것뿐이다.”
Q. 그래도 평가의 공정성을 해치는 것 아닌가? “공정성의 정의가 바뀌어야 한다고 생각한다. 예전에는 누가 더 많은 지식을 암기하고 있느냐가 기준이었다면, 지금은 누가 도구를 잘 활용해 최적의 답을 찾느냐가 기준이 되어야 한다. 교수님들이 내는 과제 방식 자체가 구식이다.”
Q. ‘리라이팅’까지 하는 건 속이는 행위 아닌가? “그건 교라방(교수님 라이프 스타일 방어)을 위한 어쩔 수 없는 선택이다. 교수님이 AI 사용을 허락하고, 대신 출처를 밝히라고 하면 떳떳하게 밝힐 것이다. 하지만 무조건 ‘쓰지 마’라고 하니까, 우리는 걸리지 않기 위해 숨길 수밖에 없다. 이건 제도가 만든 범죄다.”
Q. 본인이 생각하는 이상적인 평가는? “결과물만 보지 말고 과정을 봐줬으면 좋겠다. 내가 어떤 프롬프트를 썼고, AI가 내놓은 답을 어떻게 비판적으로 수정했는지, 그 로그(Log)를 제출하라고 하면 기꺼이 낼 것이다. AI는 내 생각을 확장시켜주는 도구이지, 내 생각을 대체하는 주인이 아니다.”
법적 쟁점과 교육부의 고민
이 문제는 단순히 대학 내의 규정을 넘어 법적인 논쟁으로까지 번지고 있습니다. 저작권법 위반, 업무방해죄 성립 여부 등 법조계에서도 뜨거운 감자입니다.
‘업무방해죄’ 적용 가능성
법무법인 태평양의 한 변호사는 “위계(속임수)로써 교수의 평가 업무를 방해했다고 볼 여지가 있다”면서도 “하지만 학생이 AI의 결과물을 검토하고 수정했다면, 이를 전적으로 ‘타인의 저작물’로 볼 수 있는지에 대해서는 다툼의 여지가 크다”고 설명했습니다. 아직 관련 판례가 없어 법적 처벌은 쉽지 않은 상황입니다.
현행 저작권법상 AI 생성물은 저작물로 인정받지 못합니다. 따라서 남의 글을 베낀 ‘표절’의 정의에도 딱 들어맞지 않는 맹점이 있습니다. 교육부는 이를 ‘연구 윤리 위반’으로 규정하려 하지만, 학부생 리포트 수준에 엄격한 연구 윤리 잣대를 들이대는 것이 타당한지에 대한 반론도 만만치 않습니다.
대학 자율성 vs 정부 규제 교육부는 “각 대학이 학칙으로 정할 사항”이라며 한 발 물러서 있습니다. 대학의 자율성을 침해할 수 있다는 우려 때문입니다. 하지만 대학들은 “가이드라인이라도 명확히 내려달라”며 책임을 떠넘기는 모양새입니다.
EU의 ‘AI 법(AI Act)‘은 교육 및 직업 평가에 사용되는 AI 시스템을 ‘고위험’으로 분류하여 엄격한 관리를 요구하고 있습니다. 미국 일부 주에서는 교육 현장에서의 AI 사용 공개를 의무화하는 법안이 발의되기도 했습니다. 한국도 이러한 글로벌 입법 추세를 참고하여 교육법 개정을 서둘러야 한다는 목소리가 높습니다.
결론 및 제언: 평가의 패러다임을 바꿔야 산다
단순 지식 나열형 리포트는 이제 변별력을 잃었습니다. ‘현장 답사 인증샷’이나 ‘구술 면접’을 필수로 넣는 수업이 늘고 있지만, 이는 교수와 학생 모두에게 피로감을 줍니다. “AI를 썼느냐”를 잡는 게 아니라, “AI를 얼마나 잘 써서 더 깊은 통찰을 냈느냐”로 평가 기준 자체를 송두리째 바꿔야 할 시점입니다.
프로세스 중심 평가로의 전환
결과물(Output)만 평가하는 방식에서 과정(Process)을 평가하는 방식으로 전환해야 합니다. 문제 정의, 자료 수집, AI 활용 및 검증, 최종 논리 전개 등 단계별로 평가 지표를 세분화하고, 학생이 자신의 사고 과정을 기록으로 남기게 해야 합니다.
- ‘하이브리드 러닝’의 정착: 온라인의 편리함과 오프라인의 깊이를 결합해야 합니다. 지식 습득과 단순 과제는 AI의 도움을 받아 온라인으로 수행하고, 강의실에서는 토론과 발표를 진행하는 ‘플립 러닝’이 보편화되어야 합니다.
- AI 시대의 새로운 인재상 정립: 암기왕이 우등생이던 시대는 지났습니다. AI와 협업하여 새로운 가치를 창출할 수 있는 창의적 인재, 질문할 줄 아는 인재(Questioner)가 필요한 시대입니다.
사회적 합의 기구 구성 대학, 교육부, 기업, 학생 대표가 참여하는 사회적 합의 기구를 구성하여 AI 윤리와 평가 기준에 대한 ‘그랜드 바겐’을 도출해야 합니다. 숨바꼭질 같은 소모적인 전쟁을 멈추고, AI라는 거대한 파도를 타고 넘을 수 있는 교육 생태계를 만드는 데 지혜를 모아야 할 때입니다.
2026년을 준비하며
2025년은 대학가에 AI 쇼크가 강타한 해로 기록될 것입니다. 다가오는 2026학년도, 우리 대학들은 AI를 금지할 것인가, 포용할 것인가의 갈림길에 서 있습니다. 분명한 것은, 변화를 거부하는 상아탑은 더 이상 지성의 전당으로 남을 수 없다는 사실입니다.