CULTURE 심층칼럼

생성형 AI로 글도 쓰고 그림도 그린다

글. 박대선 칼럼니스트(금융전문가)

오픈 AI가 만든 대화형 인공지능 ‘챗 GPT’를 공개한 지 두 달 만에 하루 1000만 명, 월 1억 명이 사용하고 있다. 실로 놀라운 돌풍이다.
'챗 GPT' 공개 전후 세상은 분명하게 달라지고 있다.

챗 서비스 외 다양한
서비스 생겨나

인공지능(AI)은 기업에서 특정목적으로 사용하는 알파고와 같은 ‘산업용 AI’와 일반사용자를 위한 ‘프런트 AI’형태로 1960년대부터 개발되어 왔다. AI는 최근 몇 년 동안 딥 러닝, 자연어 처리 등 기술 발전으로 급성장하면서 산업용이나 인간을 도와주는 프런트용의 구분이 모호해졌다. 사용자가 어떻게 활용하느냐의 선택이 더 중요하다.

챗 GPT는 학습한 지식(data)을 대규모언어모델(LLM, Large Language Model) 엔진을 기반으로 하는 문답(chat) 서비스다. LLM은 입력 텍스트를 기반으로 일관되고 의미 있는 언어를 생성하도록 설계된 일종의 언어 모델이다. 엔진을 기본으로 다양한 차가 만들어진 듯 ‘챗 서비스’ 이외에 음악, 그림, 프로그램 코딩 등 다양한 서비스가 생겨나고 있다. 정부나 기업 등 모두 필요한 목적으로 활용할 수 있는 자기만의 상품, 서비스를 만들 수 있다. 사실상 인류 문명 전반에 대변혁을 가져올 수밖에 없다. 챗 GPT의 간단한 문답 사례를 하나 보자.

“KEPCO(한국전력공사)가 챗 GPT를 활용하여 할 수 있는 업무를 중요도에 따라 5개만 고른다면?”
라고 챗 GPT에게 물었다. 3초 만에 나온 답이다.
  • 데이터 분석 및 예측 : KEPCO는 ChatGPT를 사용하여 한국 및 기타 국가의 에너지 생산 및 소비와 관련된 데이터를 분석하고 예측할 수 있습니다. 이는 KEPCO가 에너지원 및 분배에 대해 정보에 입각한 결정을 내리고 운영을 최적화하는 데 도움이 될 수 있습니다.

  • 고객 서비스 문의: KEPCO는 ChatGPT를 사용하여 에너지 청구 및 사용과 관련된 고객 서비스 문의를 처리할 수 있습니다. 여기에는 일반적인 질문에 답하고 정전, 계량기 판독 및 서비스 중단과 관련된 문제를 해결하는 것이 포함될 수 있습니다.

  • 규제 및 정책 분석: KEPCO는 ChatGPT를 사용하여 에너지 산업의 규제 및 정책 개발에 대한 최신 정보를 얻을 수 있습니다. 여기에는 제안된 규정 및 정책 분석, KEPCO 운영에 대한 잠재적 영향 식별 및 조치 권장 사항이 포함될 수 있습니다.

  • 에너지 효율성 및 지속 가능성 보고: KEPCO는 ChatGPT를 사용하여 에너지 효율성 및 지속 가능성에 대한 보고서를 생성할 수 있습니다. 여기에는 에너지 사용에 대한 데이터 분석 및 개선 영역 식별, 지속 가능성 목표를 향한 진행 상황 보고가 포함될 수 있습니다.

  • 언어 번역: KEPCO는 언어 번역, 특히 국제 커뮤니케이션 및 문서에 ChatGPT를 사용할 수 있습니다. 이를 통해 KEPCO는 다양한 국가 및 지역의 파트너, 고객 및 이해관계자와 효과적으로 소통할 수 있습니다.

이것은 챗 GPT가 KEPCO와 관련하여 지원할 수 있는 많은 작업 중 몇 가지 사례일 뿐이고, 중요한 특정 작업은 KEPCO의 목표와 우선순위에 따라 다를 수 있다고 챗 GPT는 말한다.

챗 GPT부터 바드·달리·미드저니까지

2월 17일 기준 뉴욕타임스 등 외신을 종합하면 현재 출시된 챗 GPT-3.5에 이어 챗 GPT-4로 업그레이드된다. 챗 GPT-4는 AI의 성능을 판단하는 기준인 매개변수(파라미터)가 현재보다 10배 이상 많은 1조 개가 정도라고 한다. 챗 GPT-4는 코딩 부문에 초점을 맞추고 있는데 이렇게 되면 사용자들이 원하는 복잡한 프로그램, 동영상 등을 쉽게 만들 수 있다. 챗 GPT-4가 메타버스 안에 들어가면 아바타가 자유로운 대화는 물론이고 가상공간에서 못 하는 일이 없게 된다.

오픈 AI의 AI챗봇인 챗 GPT에 대응해 구글은 유사한 AI챗봇 ‘바드’를 공개했다. 마이크로소프트(MS)는 챗 GPT의 성능을 개선한 AI챗봇을 탑재한 검색엔진 ‘빙’을 내놨는데 국내는 대기등록만 받고 있는 중이다. 챗 GPT와 MS 빙, 구글 바드는 운용되는 기반 언어 모델이 다르다.

챗 GPT에는 오픈 AI가 개발한 GPT-3.5가, MS의 빙엔 GPT-3.5를 업그레이드한 모델이 탑재됐다. 구글 바드에는 구글이 2년 전 개발한 대규모 언어 모델 람다의 경량 버전이 들어갔다. AI의 고성능을 보여주는 지표인 매개변수(파라미터) 수는 챗 GPT와 빙 챗봇이 1750억 개, 바드가 1370억 개다. 숫자만 보면 챗 GPT가 구글의 바드보다 나은 성능을 발휘할 것으로 보이지만 큰 차이는 없다. 가장 큰 차이점은 실시간 데이터를 결과물에 반영할 수 있느냐다. 챗 GPT는 2021년까지의 데이터만 학습해 실시간 데이터 반영이 불가능하다. MS의 빙은 1시간 전까지의 데이터를 반영한다. 구글 바드는 자세한 성능을 공개하지 않았지만, 최신 정보까지 반영할 것으로 추정된다. 여기에 간단한 텍스트로 관련 이미지를 만들 수 있는 AI인 ‘달리(DALL-E)’와 ‘미드저니’도 있다. SNS에서는 생성형 AI로 제작한 이미지를 공유하는 사람들이 늘고 있다. 해외에서는 생성형 AI가 그린 그림 관련 저작권 이슈도 있다. 미드저니나 오픈AI의 달리(Dall-E), 챗GPT 같이 텍스트나 이미지 등의 콘텐츠를 생성하는 생성형 AI 작품에 대한 저작권 논쟁이 뜨겁다.

국내도 AI 시장,
정부 적극 지원 필요

현재 오픈 AI 챗 GPT는 한글로 사용하면 답변시간도 오래 걸리고 오류가 종종 발견된다. 나무위키 자료에 따르면 챗 GPT가 사용하는 데이터의 92% 이상은 영어로 되어있고 한글 데이터는 0.19%에 불과하다. 따라서 한글 데이터가 많은 한국 기업들이 한국인 사용대상으로는 경쟁력이 높다. 하지만 국내 AI 기업들이 글로벌 회사로 성장하려면 영어데이터를 많이 가진 해외회사들과 연대할 필요가 있다. 절대적으로 필요한 일이다.

국내 기업들도 글로벌 빅테크에 뒤처지지 않기 위해 각자 수천억 원을 투자해 자체 개발에 나섰다.

최근 네이버는 차세대 인공지능(AI) 검색 프로젝트 ‘서치(Search)GPT’의 청사진을 공개했다. 네이버가 20년간 축적한 한글 검색 데이터를 바탕으로 한국 이용자에게 최적화한 대화형 검색 서비스를 연내 제공한다는 계획이다. 올 7월에는 서치GPT의 모체이자 챗GPT보다 6500배 규모의 한국어를 더 학습한 초거대 AI 모델 ‘하이퍼클로바X’를 공개할 예정이다.

네이버는 “GPT-3가 영어 중심으로 학습해 국내 기업들이 도입하기엔 한계가 있다”면서 “하이퍼크로버는 학습 데이터의 97%가 한국어다”라며 국내 AI 주권 확보에 유리할 것이라고 전했다. KT는 2017년 출시했던 음성인식 AI ‘기가지니’를 GPT-3을 뛰어넘는 초거대 AI로 발전시킬 계획이다. 후발주자인 SK텔레콤과 카카오는 지난 3월 서로 손잡고 초거대 AI 공동 개발에 속도를 내기로 했다.

사실상 초거대 AI사업은 궁극적으로 슈퍼컴퓨터 싸움이다. 정부는 후방에서 초거대 AI사업에 한국이 선도할 수 있도록 적극적으로 도와야 한다. 공연히 일부 부작용을 이유로 규제하려고 달려들면 안 된다. 챗 GPT 같은 초거대 AI 사업에 2등 몫은 거의 없다. 반도체처럼 한번 시장을 석권한 초거대 AI 기업이 사용자들의 딥러닝(deep learning)을 가속화하면 후발자는 영원히 따라갈 수 없기 때문이다.