산업 공부

생성형 AI (Generative AI) 시장 살펴보기

ngiraffe 2023. 4. 26. 22:09

살펴보기 시리즈 포스트는 전반적으로 특정 산업/시장/기술 에 대한 이해도를 높이고, 인사이트를 정리하고, 기술은 어떻게 적용될 수 있을지 등을 자유롭게 기록하는 목적으로 작성되었습니다.

요즘 핫한 Generative AI 시장에 대해서 관련 분야에 있는 사람으로서 한번 정리해보았다. 실제 모 투자회사 인턴 채용 과정에서 과제로도 나온 것으로 보아 VC/CVC/AC 할것 없이 집중하고 있는 토픽이라 내 관점을 정리하고 공부해보는게 의미 있을 것 같았다.

본 포스트에서는 시장의 개요와 밸류체인, 주요 player 동향, 트렌드, 주목할 점 등을 커버하고 있으며 주목할 점에는 내 관점이 다수 들어있다.

이 포스트에서 커버하지 않는 (대부분이 관심없을 것 같은) Generative AI 모델이 무엇이고 간단한 원리에 대한 매우 라이트한 설명은 이 블로그 포스트 를 참조하면 되겠다.

아직 한번도 Generative AI의 능력을 체감해 보지 못한 사람은 직접 사용해보는 걸(Chat GPT나 Stable Diffusion 등) 강력히 추천해본다. 놀랄 것이다. 또한 아래 포스트를 읽어보면 알겠지만 곧 모든 분야에서 직접적으로든, 간접적으로든 영향을 미칠 것이다.

시장 개요

시장 규모 

  • USD 8B at 2021, USD 109B at 2030
  • CAGR of 34.6% from 2022 to 2030, Grand View Research

Generative AI 활용 유형 

  • Text Generation (Contact Center, Copyrighting, Professional Document, Media)
  • Image Generation (Entertainment, Advertisement, Game, Design, Media)
  • Sound Generation (Entertainment, Advertisement, Game, Media)
  • Code Generation (Productivity)
  • Video Creation (Media, Entertainment, Advertisement)
  • Industry-specific Content Generation / Design (drug, material, etc.)

밸류체인

Value Chain

  • 데이터 수집 → 데이터 라벨링 → 모델 학습 → 컨텐츠 생성 → 컨텐츠 정제 → 모델 배포 및 통합

Hierarchy (Tech Stack)

  • 계산 하드웨어 → 클라우드 플랫폼 → 파운데이션 모델 → 앱 → 유저 

 

Generative AI tech stack from a16z.

현재 초거대 AI 모델 개발은 특정 기술적 해자가 있다기 보다는 초거대 모델을 훈련 및 추론하는데 막대한 비용이 소모되어 Globally 소수 대기업에 국한됨. 밸류체인 내에서는 주로 Hyperscale 의 Foundation AI 모델(GPT3.5 등)을 개발하고 배포하는 빅텍 기업들과 이러한 모델을 API 형태로 이용하거나 튜닝해서 특정 용도에 맞는 서비스를 제공하는 기업들로 나눠볼 수 있다. 빅텍 기업의 경우 거의 전 단계를 커버하고 있으며, 각 단계에 특화한 서비스를 제공하는 기업들이 다수 있다.

Hyperscale AI 모델을 개발하고 서비스하는 관점에서 비용의 대부분이 모델의 추론시 소모되는 클라우드 / 전력 비용이며, GPT3 기준 한번 학습하는데에도 현재 약 50억원이 소요된다. 이를 얼마나 줄일수 있냐가 쟁점. 이와 같은 맥락에서 AI모델 추론 및 학습에 최적화된 컴퓨팅 하드웨어 GPU / NPU 제조업체들이 수혜를 입을 것으로 보인다.

 

주요 Player 동향

빅테크 기업

  • Open AI-MS, Google 
    • 대규모 언어모델(GPT-4), 이미지 생성모델(DALL-E), 자동음성인식모델(Whisper), 코드생성모델(Codex) 등 다양한 모달리티의 General 모델 개발 및 고도화
    • 구독 및 API 이용료 수취, 모델 경량화, 학습방법 최적화 등으로 수익성 증대 노력
    • 검색엔진, 오피스, Workspace 등 다양한 자사 B2C/B2B 솔루션에 생성형 AI 애드온
  • 네이버, 카카오 
    • 삼성전자, 퓨리오사AI와 AI 반도체 솔루션 개발 협약 및 컨소시엄 구축
    • 한국어 특화 서치 GPT 서비스 개발
    • 한국어 특화 AI 모델 API 공개 및 플랫폼 운영
  • LG 
    • 초거대 AI모델 EXAONE 기반으로 계열사 vertical 솔루션 개발 및 적용 중 (AICC, 신약 및 재료 물질 발굴 등)

반도체 설계 및 생산회사

  • 대기업(NVIDIA, AMD, 삼성, 하이닉스 등) 
    • Transformer 기반 GPT 최적화 제품 출시(H100)
    • AI 반도체 기업 인수
    • 맞춤형 AI 반도체 솔루션 개발
    • HBM 메모리 개발 및 납품
    • PIM(Processing In Memory) 반도체 연구개발
  • 팹리스 스타트업(리벨리온, 퓨리오사AI, 사피온 등) 
    • 생성형 모델 특화 AI 반도체(NPU) 개발
    • 애플리케이션(데이터센터, 파이낸스 등) 최적화 AI 반도체 개발
    • AI반도체용 소프트웨어 개발

SaaS 제공자

  • 세일즈포스 
    • 슬랙, CRM 소프트웨어에 챗GPT 탑재
  • 뤼튼 
    • 네이버 하이퍼클로바와 협업, 다양한 비즈니스 문서 작성 애플리케이션
  • 마이리얼트립 
    • 챗GPT와 번역 AI DeepL API 결합, 여행 계획 및 상품 추천 서비스

 

국내업체들의 글로벌 진출관련 제언

  • 대부분의 국내업체들은 기존 솔루션의 한글 최적화를 목표로 가져가고 있으나, 이는 글로벌 시장 확장성이 낮은 방향
  • 불특정 다수 대상 General 솔루션보다는 글로벌로 통용될 수 있는 한국이 강점을 가진 산업 분야(반도체, 배터리 등) 내Vertical Generative AI 솔루션을 개발하는 방향이 글로벌 진출 친화적인 방향

 

트렌드

Analytical AI에서 Generative AI로 

  • 데이터 분석 → 솔루션 생성 → 검토 → 결정 의 가치제안 사이클에서 사람의 관여부분이 검토와 결정 단계로 최소화

단일 모달리티에서 멀티 모달리티로 

  • 데이터 타입의 다양화 - 언어, 음성, 이미지로부터 도표, 그래프, 생체신호 등

연구 및 배포에서 상용화를 위한 운영 효율성 최적화로 

  • 낮은 전력, 낮은 비용, 빠른 처리속도 
    1. 모델 - 경량화, 양자화
    2. 하드웨어 - NPU, 메모리

주목할 점

  • General 
    • 생성 모델은 다량의 불특정 학습 데이터를 이용하는데, 이러한 데이터에 대한 저작권 및 보안 이슈관련 규제 동향 파악 필요
    • 초거대 AI 모델 개발 경쟁 뿐만 아니라 API를 중심으로한 생태계 경쟁으로 확산 중. 얼마나 저렴한 가격으로 안정적인 성능의 API를 제공하는지가 핵심
    • 전문 지식 분야 (법학, 의학 등)에 대한 접근성이 매우 낮아져, 공증 및 책임이 필요하지 않은 유관 업무에 대한 수요 감소
    • 컨텐츠 생성에 대한 진입장벽 감소로 불특정 공간에 검증되지 않은 컨텐츠 범람 → Quality Control / Verification 시스템 / 서비스 니즈 확대
  • 검색 및 광고 생태계
    • LLM은 학습데이터를 기반으로 최대한 자연스러운 문장 생성이 목표, 사실 여부와 출처가 중요한 검색용도로서는 적절치 않음 (구글이 Open AI보다 훨씬 더 많은 인력과 기반기술을 가지고 있었음에도 LLM기반 프로덕트 활성화에 늦은 이유 - 레거시 캐시카우 시스템과 상충)
    • 현재 검색 엔진을 기반으로 한 광고 생태계의 변화 방향
    • 초개인화 타겟 광고 활성화
  • 컴퓨팅 인프라 
    • 현재의 GPU에서 NPU / TPU 기반으로 어떤 분야에서 얼마나 넘어갈 것인가, 이는 의외로 연산 효율성 그 자체보다 NVIDIA의 CUDA와 같은 Processor Unit 개발 도구가 Key일 수 있음.
    • AI 반도체는 특정 연산에 최적화되있는 만큼 범용성이 떨어진다. 빠르게 새로운 모델이 개발되는데 이에 대한 대응능력 중요
  • 생산성 
    • 기업 내부의 반복적인 Operation 처리속도 가속화 - 기존 항목 고정비용 감소 및 지급수수료 증대 예상
    • 노 코드, 로우코드 툴 및 플랫폼 활성화
    • Synthetic Data 발전으로 인한 데이터 부족 분야 AI 모델 개발 속도 가속화
    • 컨텐츠 크리에이터, 디자이너들의 생산성 증가 – 최적화된 솔루션 등장 예상
 

'산업 공부' 카테고리의 다른 글

방위 산업 살펴보기  (0) 2023.05.04
제약 산업 살펴보기  (2) 2023.04.26
건설 산업 살펴보기  (0) 2023.04.26
탄소 포집 기술(CCUS) 살펴보기  (0) 2023.04.26
화장품 산업 살펴보기  (0) 2023.04.26