[기고/이강한]K프리미엄 시대, 한국적 AI를 위한 산학협력 절실

4 days ago 3

이강한
K드라마, K푸드, K팝, K뷰티 등 일련의 K콘텐츠가 전 세계적으로 주목받고 있다. 전 세계 사람들이 인공지능(AI)으로 정보를 수집하는 상황에서 문화적 함의나 사회적 맥락을 반영하지 못한 정보는 한국에 대한 오해와 편향된 이미지를 재생산할 가능성이 높다. 게다가 언어의 문제도 없지 않다. 민주주의기술센터(CDT)가 발표한 ‘AI 언어 편향성 보고서’에는 전 세계 웹사이트 중 63.7%가 영어로 작성된 것으로 나타났다. 업계에서는 오픈AI의 챗GPT-3 기준 한국어 데이터 비율이 약 0.01∼0.1%에 불과한 것으로 추정한다.

서구 중심의 가치관과 데이터를 기반으로 작동하는 외국산 AI에 한반도의 독특한 역사적 맥락, 한국 사회만의 고유한 특질에 대한 이해까지 기대하긴 어렵다. 한국어 구사가 어려운 글로벌 생성형 AI에 높임말 문화, 공동체 중심 윤리 등에 대한 이해를 기대하기란 애초 어렵기 때문이다. 따라서 한국어 이해는 물론이고 한국의 문화, 윤리, 가치관 등 한국인의 정체성까지 이해하는 한국적 AI가 절실하다. 이제부터라도 글로벌 생성형 AI 언어 모델에 한국의 역사와 문화 사회적 맥락을 반영한 학습 데이터가 제공돼야 한다.

이를 위해서는 한국학에 종사하는 공공연구기관과 산업계 간의 협력이 필수적이다. AI 기술을 보유한 기업은 AI 모델을 개발하고 활용할 방안을 모색해야 한다. 또 연구기관은 고품질의 한국 관련 데이터를 제공하면서 글로벌 AI의 한국 친화성을 제고하는 동시에 궁극적으로 한국적 AI의 정확도를 높이는 역할을 해야 한다.

한국학 관련 국책연구기관 한국학중앙연구원(한중연)의 대표 콘텐츠인 한국향토문화전자대전은 전국 각 지역의 역사, 지리, 문화유산, 민속 등을 총망라한 현대판 지리지다. 현재 17만여 건의 텍스트와 33만여 건의 멀티미디어 자료를 자랑한다. 현재 7만5000여 건의 표제어와 10만여 건의 사진 자료를 보유한 한국학 사전의 정점이다. 이외에도 장서각의 왕실 문헌 및 고문서 자료, 한국학통합자료플랫폼(KDP)의 조선왕조실록 사전, 한국 역대 인물 정보, 구비문학 대계 등 방대한 콘텐츠가 구축돼 있다.

이러한 콘텐츠들은 한국의 역사와 문화, 사상과 의식 세계를 고스란히 담은 지식 자산으로서, AI가 한국 사회의 복잡한 맥락과 문맥을 이해하는 데 핵심적인 역할을 할 수 있다. AI에 이런 데이터들을 단순 부여하는 것을 넘어 정보의 맥락까지도 학습시키는 노력이 필요하다. 한국의 역사와 문화에서 특정 용어가 갖는 미묘한 의미 차이를 AI가 인식할 수 있도록 구조화된 데이터가 요구된다. 향후에는 데이터 전문가뿐 아니라 일반 연구자들 스스로 연구 과정에서부터 다루는 자료를 AI 친화적으로 가공하는 역량을 키울 필요가 있다. 또 데이터가 체계적으로 축적될 수 있도록 연구기관과 기업 간 협력도 모색해야 한다.

한국적 AI를 구축하는 것은 단순한 기술적 도전이 아니라 이제 국가적 과제가 됐다. AI가 생성하는 콘텐츠가 한국을 정확하게 반영하고 나아가 글로벌 환경에서 한국을 올바르게 소개할 수 있도록, 학계와 산업계가 협력해 체계적인 데이터 구축과 AI 학습을 위한 전략을 수립해야 할 시점이다.

기고 >

구독

이런 구독물도 추천합니다!

  • 오늘과 내일

    오늘과 내일

  • 오늘의 운세

    오늘의 운세

  • e글e글

이강한 한국학중앙연구원 한국사학 전공 교수

  • 좋아요 0
  • 슬퍼요 0
  • 화나요 0

지금 뜨는 뉴스

Read Entire Article