OpenAI, 새 언어 모델 GPT-2를 위험성 이유로 전체 공개 보류

7 hours ago 3

OpenAI의 GPT-2 공개 보류와 인공지능 윤리 논쟁

OpenAI는 주어진 주제에 따라 일관된 문장을 생성할 수 있는 새로운 텍스트 생성 모델 GPT-2를 개발했으나, 안전과 보안상의 이유로 전체 모델 공개를 보류함
대신 축소된 버전만 공개하고, 학습에 사용된 데이터셋과 훈련 코드는 비공개로 유지함
언론은 이를 “인류를 위해 봉인해야 할 수준의 인공지능” 등으로 묘사하며 과도한 반응을 보였고, 전문가들은 위험성 과장이 있었다는 논의를 제기함
이 결정은 잠재적으로 위험한 AI 알고리듬의 공개 범위를 어디까지 허용할 것인가에 대한 논쟁을 촉발함

GPT-2는 8백만 개의 웹페이지 텍스트로 학습되어, 문장에서 다음 단어를 예측하는 방식으로 훈련된 언어 모델임
입력된 문장의 스타일과 주제에 맞춰 자연스럽게 이어지는 문장을 생성할 수 있음
예시로 “안데스 산맥에서 영어를 구사하는 유니콘 무리를 발견했다”는 문장을 입력하자, GPT-2는 가상의 과학 기사 형태의 텍스트를 완성함
또한 소설, 칼럼, 연설문 등 다양한 문체로 텍스트를 생성할 수 있음
생성된 문장은 때때로 중복 표현, 주제 전환의 부자연스러움, 비논리적 내용을 포함하지만, 기존 모델보다 맥락 이해력과 문장 일관성이 크게 향상된 것으로 평가됨
GPT-2는 단어의 다의어 구분과 희귀한 용례 인식이 가능하며, 번역, 챗봇, 글쓰기 보조 도구 등에 응용 가능성이 있음

OpenAI는 GPT-2가 가짜 뉴스 생성, 온라인 인물 사칭, 스팸 확산 등에 악용될 수 있다고 우려함
이에 따라 전체 모델 대신 축소 버전만 공개하고, 학습 데이터와 코드를 비공개로 유지함
그러나 AI 연구자 다수는 이러한 비공개 조치가 일시적 대응에 불과하다고 지적함
- 카네기멜론대 Robert Frederking은 “OpenAI가 사용한 기술은 새롭지 않으며, 다른 연구자들도 곧 비슷한 모델을 만들 수 있다”고 언급
충분한 자본과 지식을 가진 기관이라면 AWS 같은 클라우드 서비스만으로도 유사한 모델을 구축 가능하다는 의견이 제시됨
일부 연구자들은 OpenAI가 위험성을 과장해 주목을 끌었다며, 학계의 연구 기회를 제한했다고 비판함
반면 MIT의 David Bau는 이번 결정을 AI 윤리 논의를 촉발하기 위한 제스처로 평가하며, “OpenAI가 이 문제에 주목하게 만든 점은 긍정적”이라고 언급함

하버드대 Berkman Klein Center의 John Bowers는 AI 기술의 공개 여부는 비용-편익 분석의 문제라고 설명함
그는 자연어 처리 발전에 기여하는 텍스트 생성 알고리듬은 공개를 지지하지만, 감시나 조작에 악용될 수 있는 이미지 인식 기술은 신중해야 한다고 언급함
특히 딥페이크 기술은 “이익보다 해악이 훨씬 크다”고 지적함
Bowers는 이러한 판단이 AI 분야의 미성숙함을 드러낸다고 평가함
- 현재 머신러닝 분야에는 기술의 사회적 영향과 윤리적 고려를 평가할 체계적 기준이 부족함

최근 역사에서 보듯, AI 도구의 확산을 억제하거나 통제하려는 시도는 실패할 가능성이 높음
Frederking은 1990년대 암호화 기술 규제 실패 사례를 유사한 전례로 제시함
- 당시 정부는 통신 감청을 위한 백도어 설치 법안을 추진했으나, Phil Zimmerman이 PGP 암호화 도구를 개발하면서 무력화됨
- 이후 강력한 암호화 기술은 해외에서도 쉽게 입수 가능해졌고, 규제는 사실상 불가능해짐
Frederking은 “과학적 진보의 시기가 오면, 그것을 막을 수는 없다. 다만 어떻게 대응할지 결정해야 한다”고 강조함