[위기의 ‘K-아카데미’] ②논문 표절

기술의 발달과 늘어나는 논문 표절 유형…국가·학계도 피해
2021년 4년제 대학 연구부정행위 1위는 ‘표절’…여전한 난제
챗GPT 등장으로 논문 표절 경각심…연구윤리 변곡점 예고
한국교양교육학회, “챗GPT 인용 양식 만들어 예시 보인다”
연구윤리 전문가들 “연구윤리 교육 더욱 강화돼야”

(출처=Freepic) — 2005년 황우석 사태 이후 연구 윤리가 강화됐지만 여전히 국내 연구부정행위 1위는 '표절'로 나타났다. 국내 전문가들은 논문 표절은 국가, 학계에도 피해를 끼칠 뿐만 아니라 크게는 후속 세대에도 피해를 끼치는 행위라고 경고했다. (출처=Freepik)

수준 낮은 논문 출판, 논문 표절, 갑질, 연구비 유용 등 각종 사건·사고로 인해 국내 학계가 멍들고 있다. 지성의 요람이라 불렸던 대학이지만 최근 대학을 둘러싼 추문들은 반지성주의가 팽배한 곳은 아닌가 하는 의심마저 들 정도다. 학계를 좀먹는 원흉은 여러 가지가 있겠지만 그 근본에는 연구자의 무너진 연구윤리가 자리잡고 있다. 외적인 성장을 통해 한국이 선진국 반열에 올랐다지만 진정한 선진국이 되기 위해서는 내적인 부분도 그 격을 높여야 한다. 내적인 부분이라 함은 문화, 시민의식 등 다양한 부분이 있지만 이번 기획 연재에는 ‘학계’를 중심으로 문제점과 해결책, 나아갈 길을 모색해보고자 한다. <편집자주>

[한국대학신문 백두산 기자] 대학의 연구 부정행위 가운데 가장 많은 유형은 바로 ‘표절’이다. 위조, 변조와 함께 가장 대표적인 연구 부정행위로, 타인의 독창적이거나 고유한 아이디어나 표현을 몰래 훔치거나 빼앗아 속이는 행위를 말한다.

최근에는 김건희 여사 논문 표절 사건, 챗GPT(ChatGPT)와 같은 생성형 알고리즘으로 인한 표절 위험성 등으로 인해 ‘논문 표절’에 대한 논의가 또다시 환기되고 있다. 특히, 챗GPT의 경우 방대한 양의 정보를 학습해 사람이 쓴 것과 같은 글을 작성해주는데, 논문 작성을 명령하면 기존 논문들을 베낀 그럴듯한 논문을 짜깁기해 보여줘 표절의 위험성이 높다.

교육부의 『연구윤리 확립을 위한 지침』에 따르면 논문 표절은 “일반적 지식(common knowledge)이 아닌 타인의 독창적인 아이디어 또는 창작물을 적절한 출처표시 없이 활용함으로써, 제3자에게 자신의 창작물인 것처럼 인식하게 하는 행위”를 의미한다.

대표적인 사례로는 △타인의 연구내용 전부 또는 일부를 출처를 표시하지 않고 그대로 활용하는 경우 △타인의 저작물의 단어·문장 구조를 일부 변형하여 사용하면서 출처표시를 하지 않은 경우 △타인의 독창적인 생각 등을 활용하면서 출처를 표시하지 않은 경우 △타인의 저작물을 번역하여 활용하면서 출처를 표시하지 않은 경우 등이다.

이와 함께 2021년 1월 1일부터 시행되고 있는 『국가연구개발혁신법 시행령』은 교육부의 기준과 달리 자기표절도 표절에 포함시키고 있다.

이인재 서울교대 윤리교육과 교수(전 연구윤리정보센터장)는 ‘표절 예방을 위한 출판윤리 주체의 역할 모색’이란 논문에서 표절을 “타인의 생각이나 글과 같은 정신적 산물을 절도하는 ‘지적 절도’ 행위”라고 정의하기도 했다.

즉 ‘논문 표절’은 타인의 정신적 산물을 절도하는 범죄라고도 볼 수 있다. 이 같은 표절 행위는 개인의 차원으로 끝나지 않고, ‘국가적 신뢰도 하락’, ‘해당 논문을 바탕으로 한 후속 연구 오류’를 낳는 등의 위험성을 내포하고 있다.

■ “논문 표절은 저자의 창의적인 노력을 갈취하는 행동” = 국내 학계 연구윤리 전문가들은 논문 표절에 대해 ‘타인의 창의적인 노력을 절도하는 범죄 행위’라고 입을 모았다.

논문 표절 유형도 다양한 방식으로 늘어나고 있다. 이인재 교수에 따르면 논문 표절은 크게 △아이디어 표절(idea plagiarism) △텍스트 표절(text plagiarism) △말바꿔쓰기(paraphrasing) △번역 후 출처 미표기 △2차문헌 표절(plagiarism of secondary sources) 등이 있다.

아이디어 표절은 타인의 텍스트 전체에 흐르고 있는 독창적인 또는 새로운 아이디어의 원저자에 대해 적절히 출처를 밝히지 않고 마치 자신의 것처럼 사용하는 것이다.

텍스트 표절 또는 직접적 표절은 가장 흔하게 발생하는 표절 유형으로, 타인의 저작물 속에 있는 단어·어휘(구)·문장·그림·표·사진·이미지·데이터 등 텍스트의 일부나 전부를 그대로 가져왔으면서도 인용부호로 표시하지 않고 원저자에 대한 출처표시를 하지 않는 것을 의미한다.

말바꿔쓰기는 타인이 쓴 글의 내용을 그대로 인용하지 않고 말바꿔쓰기를 하거나 요약해 다시 기술했지만 출처를 밝히지 않은 경우다.

번역 후 출처 미표기는 영어, 독일어, 일본어 등 외국어로 쓰여진 타인의 저작물을 다른 언어로 번역해 직접인용 또는 말바꿔쓰기를 통해 활용했으나 출처를 밝히지 않는 행위다.

마지막으로 2차문헌 표절은 연구자가 원문에 대해 출처를 표기해도 표절이 발생할 수 있기 때문에 주의가 필요하다. 1차문헌을 연구자가 직접 번역하거나 말바꿔쓰기 또는 요약을 하지 않고 타인의 논문에서 인용했음에도 불구하고 원문에 대해서만 출처를 표시하는 경우 2차문헌 표절에 해당된다.

이 교수는 “전 세계적으로 표절은 ‘비윤리적 행위 또는 사기’일 뿐만 아니라 ‘학문적인 부정행위’로 간주된다”며 “(연구자가) 자신의 논문이나 단행본에서 인용한 타인의 독창적인 아이디어나 중요한 저작물에 대해 출처를 정확하게 밝힌다면 대부분의 표절 의혹에서 자유로울 수 있다”고 조언했다.

고려대 연구진실성위원회 위원장인 엄창섭 교수에 따르면 △일반적 지식이 아닌 창의적인 내용을 출처 표시 없이 사용한 경우 △해당 논문을 읽은 제3자가 그 논문의 저자가 창의적으로 그 부분을 만들었다고 오해하게 만드는 경우도 논문 표절에 해당된다.

엄 교수는 논문 표절로 인한 부작용에 대해서도 지적했다. 그는 “표절한 논문을 통해 전문가가 되거나 승진이나 취직 등에서 업적으로 인정받게 됨으로써 이득을 얻는 사람이 있다”며 “이뿐만 아니라 학계 전체로 보면 인용한 부분에 실제적인 기여자가 바뀌게 됨으로써 학문이 왜곡돼 버린다”고 꼬집었다.

이어 “(논문 표절이 계속되면) 학회에 대한 신뢰도 저하된다”며 “이로 인해 연구비 감소와 사회 신뢰도 하락이 이어질 수 있다. 길게 보면 후속 세대들이 누려야 되는 혜택을 박탈하거나 줄이는 현상이 벌어질 수도 있다”고 덧붙였다.

■ 황우석 사태 이후 강화된 연구윤리에도 여전한 논문 표절 = 2005년 황우석 사태 이후 국내 학계의 연구윤리는 대폭 강화됐다. 그럼에도 불구하고 ‘표절’ 문제는 여전히 해결하지 못하고 있는 난제 중 하나로 꼽힌다.

이는 각종 통계에서도 잘 나타난다. 지난 1월 한국연구재단이 펴낸 ‘2021 대학 연구윤리 실태조사 보고서’에 따르면 2021년 한 해 동안 4년제 대학에서 연구부정행위 의혹 건수는 총 195건으로, 이중 표절이 73건으로 가장 많은 것으로 집계됐다.

또한 연구부정행위 의혹 195건 중 90건(46.2%)이 연구부정행위로 최종 판정됐으며, 이 가운데 표절이 36건(40%)으로 가장 많았다. 이어 부당한 저자 표시 20건(22.2%), 부당한 중복게재 15건(16.7%) 순으로 나타났다.

이와 함께 지난 1월 국민권익위원회가 발표한 ‘2022년도 공공기관 종합청렴도 평가’에서도 국공립대학에서 연구윤리 위반 행위로 ‘표절’이 가장 빈번하게 발생하는 것으로 나타났다.

지난해 8월부터 11월까지 국내 국공립대학 33개교 연구 및 행정 분야 구성원 총 6198명을 대상으로 ‘연구과정에서의 법령·규정 위반 항목’을 측정한 결과, 전체 응답자의 17.3%가 윤리 위반 행위 빈발 분야로 ‘표절’을 꼽았다.

학과별로는 인문, 예·체능 계열은 ‘표절’이, 자연, 의·약학 계열은 ‘부당한 저자표시’가 가장 위반 행위가 많이 나타나고 있다고 인식하는 것으로 나타났다.

학계는 챗GPT를 활용한 논문 표절에도 경각심을 나타내고 있다. 연구 논문은 기본적으로 저자의 창의적 아이디어를 요구한다. 그러나 챗GPT를 활용해 복사·붙여넣기를 하는 경우 기존에 있던 정보의 텍스트 나열에 불과하기 때문이다.

실제로, 미국 펜실베이니아주립대(PSU) 이동원 교수팀은 오픈AI의 ‘GPT-2’가 생성한 텍스트를 훈련에 사용된 자료와 비교 분석한 결과 복사해 붙여넣기와 출처 인용 없이 문장 바꾸기, 아이디어 도용과 같은 다양한 표절을 한다고 밝혔다.

■ “그때는 맞고, 지금은 틀리다” 변화하는 연구윤리 = 앞서 기술했던 것처럼 2005년 황우석 사태 이후 국내 학계 연구윤리는 지속적으로 강화되고 있다. 장관 후보자 청문회, 입시 비리, 논문 표절 사태 등 각종 사건이 터질 때마다 매번 강화됐기 때문이다.

연구윤리가 어려운 이유는 강화되는 과정 속에서 당시에는 졸업 요건, 논문 게재 조건 등에 부합했지만 현재의 연구윤리에는 적합하지 않는 등의 문제가 발생하기 때문이다.

한국교양교육학회 연구윤리위원장인 박상민 강남대 교수는 이 같은 상황에 대해 “연구 윤리 위반 시비는 시기별로 달라진다”고 짚었다.

그는 “예전에는 박사 논문 작성할 때 박사 논문의 주요 아이디어를 작은 학회에서 발표해 그걸 소논문으로 두 편 이상 실어야만 박사학위 논문 청구 자격이 생겼다”며 “그러나 최근에는 이런 방식으로 논문을 게재할 경우 연구 위반(중복 게재)에 걸리게 된다”고 설명했다.

사회계열의 경우에도 바뀐 연구윤리로 인해 이전보다 논문 게재가 어려워졌다. 이전에는 동일한 데이터를 두고 상이하게 해석한 논문을 작성하는 경우도 있었지만 ‘논문 쪼개기’ 논란이 생기면서 연구윤리 위반이란 주장이 제기되는 경우도 있다.

이 같은 상황에 대해 박 교수는 “시대가 바뀌고 텍스트가 많아지면서 전거를 인용하지 않고 쓰게 되면 다른 사람들이 알 수 없게 됐다”며 “그 사람의 아이디어인지, 다른 사람의 아이디어인지 제대로 알 수 없게 되면서 (연구윤리가) 점점 엄격해지고 있다”고 말했다.

최근에는 챗GPT가 등장하면서 연구윤리는 다시 한 번 변곡점이 찾아올 것으로 전망된다. 실제로 한국교양교육학회의 경우 챗GPT를 인용하는 양식을 만들 예정이다.

박 교수는 “논문 안에서 논문이 아닌 다른 자료도 인용하는 양식이 많이 있다”며 “타 학회에서 따라줄지 모르겠지만 한국교양교육학회에서는 선도적으로 챗GPT를 인용하는 양식을 만들어 예시를 보여주려고 한다”고 밝혔다.

■ 표절 검증 프로그램으로도 한계 있어…“연구윤리 교육 강화해야” = 대표적인 논문 표절 검증 프로그램으로는 ‘카피킬러(copy killer)’나 ‘턴잇인(turnitin)’ 등이 있지만 이들 프로그램으로는 논문 표절 검증에 한계가 있다는 지적도 제기된다.

국내 많은 대학이 사용하고 있는 논문 표절 검증 프로그램은 6어절 이상 일치 시 ‘표절’로 인식하고 잡아내는 방식이다. 그러나 최근에는 여러 꼼수를 통해 논문 표절 검증 프로그램을 통과한 논문이 게재되는 경우도 있는 것으로 밝혀졌다.

대표적으로 교묘하게 인용문을 삽입하거나 인용했다고 명시했지만 실제로 해당 내용이 인용한 논문이 삽입되지 않는 등의 방식이다.

즉, 프로그램을 통해 잡아내는 논문 표절에도 한계가 있다는 의미다. 이 같은 상황에 대해 국내 전문가들은 연구윤리 교육이 더 강화될 필요가 있다고 강조했다.

엄 교수는 “아직도 국내 학계에서는 표절 프로그램의 허점을 활용한 비정형적인 연구 부정이 일어나고 있다”며 “연구 윤리가 지켜지지 않았을 때 초래될 결과 등에 대한 교육을 통해 연구 윤리를 더 강화해야 한다”고 꼬집었다.

이 교수 또한 “국내 학회 회원들을 대상으로 표절 예방을 위한 연구윤리 교육 강화는 물론 학회 자체의 표절 판단 기준을 보다 구체적이고 명확하게 규정해 널리 홍보해야 한다”며 “연구자들이 논문을 투고할 때 자율적으로 표절을 예방할 수 있도록 도움을 줄 필요가 있다”고 조언했다.