인공지능은 창작이 가능할까? | Karlo
먼저 결론 부터 말하면, 인공지능의 창작이 가능해지고 있다. 기존의 인공지능은 인식의 단계에서 머물러 있다. 대상이 텍스트, 이미지 등으로 진화한 것이지 어디까지나 인식의 영역이였다. 이 영역에서는 인공지능이 할 수 있는 것은 무언가를 보고 저건 사람이다. 저건 컵이다. 혹은 저건 글자다 등을 인지 할 수 있는 영역에 그쳤다.
이렇게 인공지능이 판별한 것을 가지고 로직을 만들어서 행동의 영역으로 이끌어 내는 것이 우리가 흔히 말하는 인공지능 기술의 실태이다. 우리가 아는 테슬라, 애플, 카카오, 네이버, 아마존 같은 곳에서 하는 인공지능 기술 또한 이것이 위주였다. "저기 차가 온다." 이 속도면 충돌 할 수 있으니 차 속도를 줄이고 핸들을 피하자, "헤이 카카오, 오늘의 날씨는 어때?"라는 입력이 들어왔으니 날씨 정보를 말해주자. 같은 방식이다.
우리가 흔히 아는 OCR 역시 이런 인식의 영역이다. 사진 등에서 찍힌 '글자로 추정되는' 것들을 뽑아 그것을 텍스트 데이터로서 가지고 있게 해주는 것, 최근에 애플과 어도비에서 발표한 자동으로 누끼를 따는 것도 이 텍스트를 이미지 영역으로 확장 한 것이다. (물론, 이러한 확장 과정에는 많은 기술적 자원과 시간이 든다. 또한 기기의 성능도 영향을 미칠 수 밖에 없다.)
사람들에게 인공지능은 그래서 조금은 멍청한 형 같은 느낌이지만 영화 <Her>, <아이언맨>, <A.I>, <스페이스 오딧세이 2022>와 같은 곳에서 미래를 보여주며 조금은 가능할지도? 영역에 놓여져 있었다. 그러다 2015년도에 구글 산하 연구소인 딥마인드에서 알파고라는 모델을 선보인다.
너무 유명한 모델이라 굳이 설명을 따로 할 필요는 없겠지만 여기서는 인지가 아니라 학습의 개념이 쓰이기 시작했다. 바둑판을 인식하고 상대방과 대국을 하는 Bot은 로우바둑이에도 있었다. 체스 쪽에선 진작에 인간 챔피언을 이겼고 하지만 딥마인드의 알파고는 이것을 학습모델로 풀어내었다. 인식하고 그것을 바탕으로 수를 놓고 그걸 또 학습하여 인간이 감히 입력하기 힘든, 할 수 도 없는 량의 학습을 시작한다. 그래서 빠르게 성장할 수 있다. 그리고 우리는 이걸 Deep Learning이라고 부르기로 했다. (대중에게 알려진 시점이 이떄이다.)
이러던 와중 2018년 한 논문이 발표 된다. 솔직히 이 논문은 인공지능 쪽에서는 특이점이라 할 수 있다. 해당 논문을 기점으로 우리가 알던 인공지능에서 완전 새로운 접근이 시작되었으니. 바로 B.E.R.T(Bidirectional Encoder Representations from Transformers)라는 모델을 처음 설명한 <BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding> 논문이였다. "그게 뭔데 씹덕아"라고 할 수 있겠지만... 사전 학습된 대용량의 레이블링 되지 않는(unlabeled) 데이터를 이용하여 언어 모델(Language Model)을 학습하고 이를 토대로 특정 작업( 문서 분류, 질의응답, 번역 등)을 위한 신경망을 추가하는 전이 학습 방법이라고 설명할 수 있다. 아주 쉽고 무식하게 말하면 "개떡같이 말해도 찰떡같이 알아 듣고 학습하는" 모델이라고 생각하면 된다.
흔히 자연어 처리라고 부르는 우리가 평소에 쓰는 언어 쪽에서는 이 BERT를 기점으로 엄청난 성장이 일어났다. 대표적인 예가 GPT(Generative Pre-trained Transformer)이다. GPT는 앞서 말한 딥러닝 방식을 통해 인간처럼 소통할 수 있는 자언어 처리 모델이다. 기존에 입력된 정보(텍스트)를 통해 말투, 단어, 관용어 등을 학습해 말하는 자기회귀 언어모델이다. GPT는 거듭된 진화로 GPT-3가 나오면서 정말 정교해진 인공지능이 나오기 시작하였다.
앞서, 인공지능은 인식의 영역에 머물러 있었다고 했다. 이것이 학습의 영역으로 넘어갔고 이제는 창작의 영역으로 넘어가고 있다. 기존의 글, 어투, 화풍, 사진, 일러스트 등을 바탕으로 학습을 하여 이제 창작을 하기 시작하는 것이다. 대표적인게 앞서 말했던 GPT를 활용한 기술인데. 국내에선 네이버와 카카오가 하이퍼클로바와 ko-gpt를 출시해 사용할 수 있게 공개하고 있다. 특히 카카오는 자회사 카카오브레인을 통해 해당 기술을 오픈소스화 하여 공개하였다.
그림의 영역에선 오픈AI, 구글의 Imagen, 카카오의 Karlo 등이 다양한 분야에 활용되고 있다. 이미지 작업자들의 레퍼런스를 형성해준다던지, 인테리어, 배경 등의 영감을 준다던지, 산업 디자인적으로 사용된다던지 다양한 협업 사례들이 제안되고 있다. 더 나아가선 NFT 등과 연계해 재밌는 시도들도 시장에서 종종 보인다.
이뿐만이 아니라 최근 구글이 발표한 Lambda, 네이버에서 발표한 하이퍼클로바, 카카오에서 출시한 ko-GPT 등은 캐릭터 혹은 작가, 대화상대로서 역할을 다할 수 있다. 앞서 말한 창작을 채팅에 이식한 것이다. 이루다 같은 예시가 있긴 하지만 해당 건은 윤리적 이슈와 한계가 있었기에 다른 활용법을 보면 최근 네이버에서 하고 있는 노인들을 위한 케어 콜, 카카오에서 진행한 인공지능이 작성한 시집 등이 예시가 될 수 있다.
이러한 기술들이 일반 대중에게도 쉽게 다가가는 일도 이제는 종종 생기고 있다. 최근 삼성전자와 카카오브레인은 자신들의 이미지 생성 기술을 통해 노트북을 나만의 디자인으로 만드는 이벤트를 진행하기도 하고 트위터 등지에선 mini-dalle라고 하여 경량화 된 AI모델 데모사이트가 등장해 사람들에 큰 재미를 주기도 하였다.
여기까지 듣다 보면, 어? 인공지능이 이제 인간의 창작 영역을 넘보는거 아닌가? 인지 → 학습 ↻ 창작 이런 구조면 이제 인간을 지배하는 건가? 라고 생각할 수 있는데. 이것은 무척 SF적인 생각이다. 기존 각종 매체에서 등장하는 인공지능들이 무척 공격적인 대상으로 나왔기 때문에 인간 VS 인공지능이라는 구도가 생겼지만 대부분의 인공지능을 개발하는 곳들의 목표는 Assistant With AI이다. 인공지능으로 인간이 해결하지 못한 난제를 더욱 빠르게 도달하거나 우리가 하기 힘들것을 기계가 해주듯 인공지능이 하게끔 하여 인류가 더 도약하게 만드는 것이 이들의 역할이자 사명이다.
최근 구글의 람다 이야기나 어중간한 인공지능 지배론을 듣고 있으면 <2001: 스페이스 오디세이>의 HAL을 보고 오시길 바란다.(참고로 1968년 영화다) 만들어진 환상 속 괴물 때문에 기술적 진보를 미루는 것은 너무나도 안타까운 일이 아닐까?
'일상에서 영감찾기' 카테고리의 다른 글
[5WHY 시리즈] 이거 쓰면 본질에 다가갈 수 있겠지? (0) | 2022.08.04 |
---|---|
Notion이 전세계에서 사랑 받은 방법 (0) | 2022.07.31 |
Notion | No-Code/Low-Code 시대의 도래 (0) | 2022.07.23 |
코로나 시대에 오프라인 행사 기획/진행/운영 하기 (0) | 2022.07.19 |
서울일러스트레이션페어에서 Notion을 알려보자 (on Stage) (0) | 2022.07.18 |
댓글
이 글 공유하기
다른 글
-
[5WHY 시리즈] 이거 쓰면 본질에 다가갈 수 있겠지?
[5WHY 시리즈] 이거 쓰면 본질에 다가갈 수 있겠지?
2022.08.04 -
Notion이 전세계에서 사랑 받은 방법
Notion이 전세계에서 사랑 받은 방법
2022.07.31 -
Notion | No-Code/Low-Code 시대의 도래
Notion | No-Code/Low-Code 시대의 도래
2022.07.23 -
코로나 시대에 오프라인 행사 기획/진행/운영 하기
코로나 시대에 오프라인 행사 기획/진행/운영 하기
2022.07.19