책소개
초거대 언어 모델로 비즈니스 문제 해결하기
현대 비즈니스 혁신의 핵심으로 떠오른 초거대 언어 모델과 그 활용 방안을 다룬다. 생성형 AI의 일종인 초거대 언어 모델은 사람처럼 텍스트를 생성하고 이해하는 능력을 갖춘 기술로 대규모 데이터를 바탕으로 비즈니스의 다양한 문제 해결을 가능하게 한다. 초거대 언어 모델이 가져온 변화, 기술적 특징, 그리고 이를 실제 비즈니스에 적용할 전략을 제시하며 훈련된 데이터에 없는 새로운 문제도 해결할 수 있는 확장성, 초거대 언어 모델의 창발성을 강조한다.
이 책은 초거대 언어 모델의 실제 비즈니스 적용 사례들을 통해 복잡한 업무의 단순화, 비용 절감, 업무 효율성 증대를 가능케 하는 구체적인 방법을 다룬다. 특히 고객 지원 자동화, 데이터 분석을 통한 맞춤형 마케팅, 문서 요약, 감정 분석 등 다양한 분야에서 초거대 언어 모델이 어떻게 기업의 혁신을 이끌 수 있는지 구체적으로 설명한다. 효율적 사용을 위한 프롬프트 최적화, 데이터 품질 관리, 윤리적 문제 해결을 위한 가이드라인도 제공하여 AI 활용에 필요한 전반적 이해를 돕는다. 초거대 언어 모델은 복잡한 문제를 인간의 언어로 처리할 수 있어 기존 인공지능의 한계를 넘어서며 비즈니스 영역에서 강력한 도구로 자리 잡고 있다. 초거대 언어 모델의 잠재력을 통해 비즈니스의 문제 해결을 꿈꾸는 CEO와 관리자들에게 도움이 될 실천적 내용을 담았다.
200자평
초거대 언어 모델의 특징과 비즈니스 적용 방법을 다룬다. 텍스트 생성과 문제 해결을 통해 고객 지원, 데이터 분석, 마케팅 등에서 업무 효율과 비용 절감을 이끄는 전략을 제시한다. 프롬프트 최적화와 윤리적 문제 해결까지 포괄적인 가이드를 제공한다.
지은이
김다현
업스테이지 인공지능 연구원이다. 광주과학기술원에서 전기전자컴퓨터공학을 전공했고, 학사 및 석사 학위 과정을 수석으로 졸업했다. 석사 학위 논문은 “이진 신경망 구조 탐색 및 비지도 학습(Architecture Search and Unsupervised Learning for Binary Networks)”으로, 인공 신경망의 경량화 분야를 연구하며 ECCV, CVPR, ICLR 등 최고 권위의 인공지능 학회에 논문을 다수 게재했다. Naver AI Lab에서 연구 인턴으로 재직하다 업스테이지에 인공지능 연구원으로 합류했다. 업스테이지 합류 이후엔 광학 문자 인식(optical character recognition) 분야를 연구하며 구글 등이 개최한 대회를 포함해서 총 4개의 해당 분야 최고 권위 대회에서 우승했다. 이후, 초거대 언어 모델을 연구하며 NAACL, ACL 등 세계적인 자연어 처리 학회를 포함해 다수의 논문을 게재했고, 다른 경쟁 상대보다 훨씬 작은 모델로 Open LLM 리더 보드 세계 1등을 달성했다. 현재는 한국을 대표하는 초거대 언어 모델 중 하나인 Solar LLM 개발에 힘쓰고 있다.
차례
초거대 언어 모델과 비즈니스 문제 해결
01 초거대 언어 모델과 개인
02 초거대 언어 모델과 기업
03 초거대 언어 모델로 해결할 수 있는 문제들
04 초거대 언어 모델로 해결할 수 없는 문제들
05 경제적 관점에서 초거대 언어 모델
06 비즈니스 문제 해결 1: 프롬프트 엔지니어링
07 비즈니스 문제 해결 2: 검색 증강 생성
08 비즈니스 문제 해결 3: 미세 조정
09 비즈니스 문제 해결 4: 지속 사전 학습
10 초거대 언어 모델의 비즈니스 도입 사례
책속으로
프로그램이라고 해서 엄청 복잡하고 어려운 것이 아니다. 예를 들어, 사무직에서 많이 사용하는 엑셀의 함수 기능 또한 일종의 프로그램이다. 여러 값 간의 관계를 특정 계산식을 적용해서 정의하면, 손으로 하나하나 계산하는 것보다 훨씬 빠르고 정확하게 숫자를 채울 수 있다. 다만, 이 함수 기능을 효과적으로 사용하는 것 또한 경험과 연습이 필요한데, 초거대 언어 모델을 이용하면 수월하게 함수 계산식을 얻을 수 있다. 단지 초거대 언어 모델한테 사용자가 원하는 계산식을 설명하고 몇 가지 예시를 주기만 하면 된다. 기존에 엑셀을 사용하던 사람뿐만 아니라 엑셀이 어려워서 제대로 활용하지 못했던 사람도 초거대 언어 모델의 도움을 받으면 업무 생산성이 증대되는 것이다.
-01_“초거대 언어 모델과 개인” 중에서
예를 들어, 초거대 언어 모델한테 ‘오늘의 날씨는?’이라는 질문을 했다고 가정하자. 이때, 초거대 언어 모델 입장에서는 날씨에 대한 질문 다음으로 올 확률이 높은 단어들을 선택해 답변을 만들 것이다. 그러나 애석하게도 그 답변이 실제 오늘의 날씨와 일치할 확률은 매우 낮다. 이러면 오늘의 날씨에 대한 환각 현상이 발생하는 것이다. 하지만 만약 이번 일주일 동안의 기상 예보 정보를 같이 알려 주면서 오늘의 날씨에 관해서 물으면 어떻게 될까?
-03_“초거대 언어 모델로 해결할 수 있는 문제들” 중에서
한 번의 질문으로 해결이 어려운 비즈니스 문제들은 보통 중간에 암묵적으로 이루어지는 판단의 결과에 따라 분기를 나눠야 하는 경우가 많다. 좋은 리뷰일 때와 안 좋은 리뷰일 때 그 이후의 대응 방식이 다른데, 이를 초거대 언어 모델이 내부적으로 알아서 처리해 주길 바라는 셈이다. 이런 암묵적인 판단을 기준으로 문제를 분할하고, 판단 결과에 따라서 명시적으로 다른 대응 방식을 취하면 훨씬 수월하게 복잡한 비즈니스 문제를 해결할 수 있다.
-06_“비즈니스 문제 해결 1: 프롬프트 엔지니어링” 중에서
지속 사전 학습을 할 때 또 하나 중요한 점은 바로 특정 분야를 어떻게 지정하느냐다. 직관적으로는 법률, 의료, 금융 등 우리가 흔히 알고 있는 전문 분야를 떠올릴 수 있다. 그러나 새로운 언어에 대한 지식처럼 전문 분야보다 더 넓은 범주의 지속 사전 학습을 진행할 수도 있다. 예를 들어, 영어 위주로 개발된 시중의 초거대 언어 모델에 대해서 한국어나 일본어 등의 추가 언어를 확장해 세계의 더 많은 인구를 대상으로 해당 모델을 활용할 여지를 만드는 것이다. 특정 전문 분야를 개척하든, 새로운 언어를 확장해 아예 새로운 나라를 개척하든, 지속 사전 학습은 여러모로 비즈니스의 큰 전략에 따라서 진행되는 경우가 많다.
-09_“비즈니스 문제 해결 4: 지속 사전 학습” 중에서