본문 바로가기
project/개인공부

생성형 AI 란 무엇인가?

by 왕방개 2024. 2. 11.

최신 트렌드를 공부하고 공모전에 나가기 위해서 찾아보면서 생성형 AI가 정확히 뭘 의미하는지, 어떻게 활용되는지에 대해서 궁금해서 찾아봤습니다.

 

생성형 AI 란?

생성형 인공지능은 대화,이미지, 음악 등 새로운 콘텐츠와 아이디어를 만들수 있는 AI의 일종입니다. AI 기술은 이미지, 인식, 자연어 처리, 번역 과 같이 새로운 컴퓨팅 작업에서 인간 지능을 모방합니다. 다시 말하자면 인간 언어 랑 예술, 화학 등 복잡한 주제를 AI로 학습을 한뒤 학습 데이터를 재사용하여 새로운 문제를 해결하는 방식입니다. 

 

생성형 AI 의 대표사례로 ChatGPT가 있습니다.이러한 생성형 AI를 활용해서 이전에는 볼 수 없었던 새로운 애플리케이션을 만들고, 고객이 새로운 생산성 수준에 도달하도록 도울 수 있습니다. AI의 이점을 좀 볼까요?

 

연구 가속화

 

생성형 AI  알고리즘은 복잡한 데이터를 새로운 방식으로 탐색하고 분석할 수 있습니다. 연구자료들은 다른 방법으로는 나타나지 않을 수도 있는 새로운 경향과 패턴을 발견할 수 있습니다. 예를 들면 생성형 AI 시스템은 제약 산업에서 단백질 서열을 생성 및 최적화하고 신약 개발을 빠르게 가속화하는데 사용되고 있습니다.

 

 

고객 경험 강화

 

생성형 AI는 사람의 대화에 자연스럽게 반응하고 고객 서비스 및 고객 worflow의 개인화를 위한 도구 역할을 할 수 있습니다.예를 들어, AI  기반 챗봇,음성봇, 가상 비서를 사용하여 고객에게 보다 정확하게 응답하여 첫번째 연락으로 문제를 해결할 수 있습니다.

 

비즈니스 프로세스 최적화

 

생성형 AI를 사용하면 비즈니스의 모든 라인에서 ML 및 AI  애플리케이션을 활용하여 비즈니스 프로세스를 최적화할 수 있습니다. 예를 들어,지식 검색 기능을 위해 모든 소스에서 데이터를 추출하고 요약하기.합성 데이터를 생성하여 지도 학습 및 기타 ML 프로세스를 위한 레이블이 지정된 데이터를 생성합니다.

 

직원 생산성 향상

 

생성형 AI 모델은 직원 workflow를 강화하고 조직내 모든 사람을 위한 효율적인 보조 역할을 할 수 있습니다. 예를들면 애플리케이션 개발 작업을 위한 새 소프트웨어 코드 제안을 생성허거나 보고서 관리를 지원하여 조직 전체에서 시간을 절약하고 비용을 절감하며 효율성을 높일 수 있습니다.

 

생성형 AI 작동원리

모든 인공지능과 마찬가지로 생성형 AI도 방대한 양의 데이터를 기반으로 pre-trained 된 초대형 모델인 기계학습모델을 사용합니다.

 

기존의 기계 학습 모델은 차별적이거나 데이터 포인트를  분류하는데 중점을 두었습니다.알려진 용인과 알려지지 않은 요인 사이의 관계를 추론하려고 시도 했습니다.예를 들면 픽셀 배열,선,색상과 같이 알려진 데이터를 보고 이를 알 수 없는 요소인 단어에 매핑합니다. 수학적으로 모델은 알려지지 않은 인과 알려진 요인을 x 및 y 변수로 수치적으로 매핑할 수 있는 방정식을 식별하는 방식으로 작동했습니다.

 

생성형 모델은 이를 한 단계 더 발전시키는데, 특정 특징이 주어지면 레이블을 예측하는 방식 대신에 특정 레이블이 주어지면 특징을 예측하려고 합니다.수학적으로 생성형 모델링은 x와 y가 함께 발생할 확률을 계산합니다. 다양한 데이터 특징의 분포와 그 관계를 학습합니다. 예를 들어, 생성 모델은 동물 이미지를 분석하여 다양한 귀 모양, 눈 모양, 꼬리 특징, 피부 패턴등의 변수를 기록합니다. 다양한 동물들이 일반적으로 어떻게 생겼는지 이해하기 위해 특징과 관계를 배우고, 새로운 동물이미지를 다시 만들 수 있습니다.

 

확산 모델

 

확산 모델은 초기 데이터 샘플에 제어된 무작위 변경을 반복적으로 수행하여 새 데이터을 생성합니다.원본 데이터로 시작하여 미세한 변화를 추가하여 점차 원본과 덜 유사하게 만듭니다. 이 노이즈는 생성된 데이터가 일관되고 사실적으로 유지되도록 세심하게 제어됩니다.

 

여러 번의 반복에 걸쳐 노이즈를 추가한 후 확산 모델은 프로세스를 역전시킵니다. 역 노이즈 제거는 노이즈를 점진적으로 제거하여 원본과 유사한 새 데이터 샘플을 생성합니다.

 

 

생성형 대립 네트워크

 

생성형 대립 네트워크(GAN)은 확산 모델의 개념을 기반으로 하는 또 다른 생성형 AI 모델입니다.

GAN은 두 신경망을 경쟁적으로 훈련시키는 방식으로 작동합니다. 생성자라고 하는 첫번쨰 네트워크는 무작위 발생 노이즈를 추가하여 가짜 데이터 샘플을 생성하고, 판별자라고 하는 두번째 네트워크는 실제 데이터와 생성자가 생성한 가짜 데이터를 구별하려고 시도합니다.

 

훈련 중에 생성자는 사실적인 데이터를 생성하는 능력을 지속적으로 개선하며, 판별자는 가짜와 진짜를 더 잘 구분합니다. 이러한 대립적 과정은 생성자가 판별자가 실제 데이터와 구별할 수 없을 정도로 확실한 데이터를 생성할 떄까지 계속됩니다.

 

GAN은 사실적인 이미지 생성, 스타일 전송 및 데이터 증강 작업에 널리 사용됩니다.

 

변이형 오토인코더

 

변이형 오토인코더(VAE)는 잠재공간 이라는 간 간결한 데이터 표현을 학습합니다. 잠재 공간은 데이터를 수학적으로 표현한 것입니다. 예를 들어 얼굴을 연구하는 경우, 잠재 공간에는 눈 모양, 코 모양, 광대뼈 및 귀를 나타내는 숫자가 포함됩니다.

 

VAE는 인코더와 디코더라는 두개의 신경망을 사용합니다. 인코더 신경망은 입력데이터를 잠재 공간의 각 차원에 대한 평균 및 분산에 매핑합니다. 가우스 분포에서  무작위 표본을 생성합니다. 이 샘플은 잠재 공간의 한 지점이여 입력 데이터의 압축되고 단순화된 버전을 나타냅니다.

 

디코더 신경망은 잠재 공간에서 이 샘플링 된 지점을 가져와 원래 입력과 유사한 데이터로 다시 재구성합니다. 수학 함수는 재구성된 데이터가 원본 데이터와 얼마나 잘 일치하는지 측정하는데 사용됩니다.

 

트랜스포머 기반 모델

 

트랜스포머 기반 생성형 AI 모델은 VAE 의 인코더 및 디코더 개념을 기반으로 합니다. 트랜스포머 기반 모델은 인코더에 더 많은 레이어를 추가하여 이해, 번역, 창의적 글쓰기 와 같은 텍스트 기반 작업의 성능을 개선합니다. VAE는 여러 데이터 유형의 새로운 변형을 만들 수 있는 기능을 도입했습니다. 이로 인해 생성형 대립 네트워크(GAN) 및 확산 모델과 같은 다른 생성형 AI 모델이 급속히 등장했습니다. 이러한 혁신은 인위적으로 생성되었음에도 불구하고 점점 더 실제 데이터와 유사한 데이터를 생성하는데 중점을 두었습니다. 트랜스 포머는 인코더 및 디코더 아키텍처를 어텐션 매커니즘과 원활하게 통합했습니다. 그들은 뛰어난 효율성과 다양성으로 언어 모델의 훈련과정을 간소화했습니다.

 

트랜스포머 기반 모델은 셀프 어텐션 매커니즘을 사용합니다. 시퀀스의 각 요소를 처리할 때 여러가지 입력 시퀀스 부분의 중요성에 가중치를 둡니다.

 

또 다른 주요 특징은 이러한 AI 모델이 컨텍스트 임베딩을 구현한다는 것입니다. 시퀀스 요소의 인코딩은 요소 자체 뿐만 아니라 시퀀스 내의 컨텍스트에 따라 달라집니다.

 

트랜스포머 기반 모델의 작동 방식

 

트랜스포머 기반 모델이 어떻게 작동하는지 이해하려면 일련의 단어로 구성된 문장을 예시로 들어보겠습니다.

 

 셀프 어텐션은 모델이 각 단어를 처리할 때 관련 단어에 집중할 수 있도록 도와줍니다. 단어 간의 다양한 유형의 관계를 캡처하기 위해 트랜스포머 기반 생성 모델은 어텐션 헤드라고 하는 다중 인코더 레이어를 사용합니다. 각 헤드는 입력 시퀀스의 다른 부분에 주의를 기울이는 법을 배웁니다. 이를 통해 모델은 데이터의 다양한 측면을 동시에 고려할 수 있습니다. 또한 각 레이어는 컨텍스트  임베딩을 개선합니다. 레이어는 임베딩에 더 많은 정보를 제공하고 문법구문부터 복잡한 의미론적 의미에 이르기까지 모든 것을 캡처합니다.

 

생성형 AI 도입사례

 

실제 기업들은 생성형 AI를 어떻게 활용하고 있는지 소개하겠습니다. 

 

게임

 

게임 업계는 매번 신선한 콘텐츠를 만들어내야 한다는 과제를 가지고 있습니다. 하지만 캐릭터부터  스토리, 아이템 등 새롭게 만들어내야 하는 영역은 정말 넓고 다양한데요. 생성형 AI는 이러한 콘텐츠 생성 과정을 자동화 함으로써 여기에 투입되던 리소스와 시간을 절감시켜줍니다.

 

얼마전 Nvidia 는 게임용 아바타 클라우드 엔진을 공개했습니다. 캐릭터의 배경이나 성격을 설정하면, 주어진 맥락 안에서 설정값에 맞는 NPC 의 대사나 음성, 표정을 생성하는 기술입니다. 자연스러운 대화가 어려웠던 기존 NPC와는 달리 사용자와 상호작용이 가능한 NPC를 만들 수 있습니다.

 

엔씨소프트는 최근 자체 개발한 초거대 언어모델 VARCO LLM을 공개했는데요. 이미지, 텍스트 등의 게임 컨텐츠를 개발하는데 최적화되어 있으며 앞으로 다양한 도메인으로 확장시킬 계획이라고 밝혔습니다.

 

 

에듀테크

 

교육분야는 학생 개개인의 수준에 따른 맞춤형 교육 자료를 제공해 학습 효율을 높이는 것입니다. 생성형 AI가 활용되는 유형을 살펴보면 다음과 같습니다.

 

  • 학생의 이해 수준과 학습 진도를 바탕으로 답변할 수 있는 질문 생성
  • 학생의 강점과 약점을 기반으로 맞춤형 학습계획과 콘텐츠 생성
  • 게임,시뮬레이션 등 복잡한 개념 이해를 돕는 상호작용 학습 활동 생성
  • 실시간 피드백 과 평가를 통해 교사가 추가적으로 지원해야 할 영역 식별

에듀테크 기업은 Anthology는 학습 관리 시스템 Blackboard Learn에 생성형 AI를 적용했습니다. 시험 문제를 생성하고 채점 기준표를 개발하는 기능을 출시해 교사는 시험 문제 개발 등에 들어가는 시간을 절감해 학생 상담과 같은 더 중요한 일에 집중할 수 있습니다.

 

국내 기업 팀 스파르타는 온라인 코딩 강의 스파르타코딩클럽에 생성형 AI 기반의 AI 튜터 서비스를 도입했습니다. 이를 통해 수강생의 질문에 실시간으로 답변하고 더 궁금한 내용들을 추천해줍니다.

 

헬스케어

 

의료 분야는 이미 다양하게 활용되고 있었습니다. 생성형 AI의 등장으로 신약 개발 분야가 정말 빠르게 변화되어왔습니다. 기존의 신약 개발은 실제 시장에 출시되기까지 최소 12년이 걸리는 매우 어려운 프로젝트 입니다. 생성형 AI는 신약 발견부터 디자인, 임상 시험등의 프로세스 과정을 개선하고 가속화해 시간과 비용을 획기적으로 줄여주고 있습니다. 최근에 코로나도 팬데믹이 선포된 후 여러 대응과정이 있었는데, 이 과정에서 인공지능 데이터를 기반한 예측, 수학적 모델 등의 연구가 동원 되었습니다. 코로나의 유행양상과 전파속도, 확진자의 규모에 대한 에측의 정확성을 높이고, 방역을 위한 각종 제한 조치의 범위와 강도, 완급을 조절할 수 있는 근거를 확보했습니다.

 

클라우드 MSP

 

CSP와 기업 고객들 사이에서 클라우드 도입과 활용을 돕는 클라우드 MSP 기업들도 생성형 AI 시장을 주목하고 있습니다. AI와 클라우드는 엄청 밀접한 관계인만큼, 생성형 AI로 인해 클라우드 도입이 더 빠르게 증가하고 있습니다. OpsNow는 클라우드 관리 플랫폼에 생성형 AI 챗봇 OpsNow Assistant를 적용했습니다. 직접 데이터를 조회하지 않고 간단한 채팅 만으로 클라우드 관리 현황을 확인할 수 있습니다. 

 

최근 베스핀글로벌에는 AI MSP B2D2를 선보였습니다. 데이터 수집부터 전환,분석.,처리.운영 관리 까지 AI 비즈니스에 필요한 영역들을 체계적으로 지원하는 서비스입니다. AI 관련 기술이나 경험이 없어도 전략 수립부터 애플리케이션 개발까지 모두 지원합니다.

데이터 기반의 사업전략은 높은 정확성을 바탕으로 탁월한 성과를 이끌어냅니다. B2D2 Modern Data Stack은 기업의 정형 및 비정형 데이터를 핵심 자산화할 수 있도록 데이터 통합과 전환, 데이터 흐름 및 처리 프로세스를 자동화하여 기업의 데이터 활용을 극대화하는 전략적인 데이터 관리 프로세스이자 방법론입니다. 데이터 마이그래이션,데이터 레이크 구축, 빅데이터 시스템 구축 및 운영, BI Tools 를 제공합니다.