본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

LLM 서비스 설계와 최적화 상세페이지

LLM 서비스 설계와 최적화

비용은 낮추고 성능은 극대화하는 AI 서비스 구축과 운영 가이드

  • 관심 0
소장
종이책 정가
32,000원
전자책 정가
20%↓
25,600원
판매가
25,600원
출간 정보
  • 2025.04.14 전자책 출간
  • 2025.04.10 종이책 출간
듣기 기능
TTS(듣기) 지원
파일 정보
  • PDF
  • 297 쪽
  • 7.1MB
지원 환경
  • PC뷰어
  • PAPER
ISBN
9791169219297
ECN
-
LLM 서비스 설계와 최적화

작품 정보

생성형 AI의 경쟁력을 높이는 LLM 최적화 전략



AI와 머신러닝의 발전으로 거대 언어 모델(LLM)에 대한 관심은 급증했지만, 높은 비용 때문에 수많은 기업이 도입을 주저하고 있습니다. 이 책은 적은 비용으로 LLM을 구축하고 배포하는 효율적인 접근법을 소개합니다. 모델 선택, 프롬프트 엔지니어링, 파인튜닝, 배포의 각 단계에서 성능을 지나치게 희생하지 않으면서 비용을 최소화하는 방법을 만나 보세요.
검색 시스템이나 AI 에이전트와 같은 생성형 AI 애플리케이션 구현에 필요한 실용적이고 기술적인 지식을 제공합니다. 모델 양자화, 스케일링 등의 추론 최적화 기법과 인프라 비용 절감 방법을 탐구하여 생성형 AI 서비스의 경쟁력을 강화해 보세요.

작가

슈레야스 수브라마니암
경력
AWS
작가 프로필 수정 요청
작가의 대표 작품더보기
  • LLM 서비스 설계와 최적화 (슈레야스 수브라마니암, 김현준)

리뷰

0.0

구매자 별점
0명 평가

이 작품을 평가해 주세요!

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.
  1. 타인에게 불쾌감을 주는 욕설
  2. 비속어나 타인을 비방하는 내용
  3. 특정 종교, 민족, 계층을 비방하는 내용
  4. 해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
  5. 의미를 알 수 없는 내용
  6. 광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
  7. 저작권상 문제의 소지가 있는 내용
  8. 다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용
* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.
이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.
아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!
'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.
무료 작품 (프로모션 등으로 무료로 전환된 작품 포함)
'구매자'로 표시되지 않습니다.
시리즈 내 무료 작품
'구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소
'구매자' 표시가 자동으로 사라집니다.

개발/프로그래밍 베스트더보기

  • 나만의 MCP 서버 만들기 with 커서 AI (서지영)
  • 핸즈온 LLM (제이 알아마르, 마르턴 흐루턴도르스트)
  • LLM을 활용한 실전 AI 애플리케이션 개발 (허정준, 정진호)
  • 아키텍트 첫걸음 (요네쿠보 다케시, 조다롱)
  • 조코딩의 랭체인으로 AI 에이전트 서비스 만들기 (우성우, 조동근)
  • 테디노트의 랭체인을 활용한 RAG 비법노트_기본편 (이경록(테디노트))
  • AI 에이전트 인 액션 (마이클 래넘, 류광)
  • 개정2판 | 시작하세요! 도커/쿠버네티스 (용찬호)
  • 랭체인과 랭그래프로 구현하는 RAG・AI 에이전트 실전 입문 (니시미 마사히로, 요시다 신고)
  • 챗GPT, 글쓰기 코치가 되어 줘 (이석현)
  • 개정3판 | UX/UI 디자이너를 위한 실무 피그마 (클레어 정)
  • 러닝 랭체인 (메이오 오신, 누노 캄포스)
  • 요즘 개발자 (임동준, 고예슬)
  • 데이터 중심 애플리케이션 설계 (마틴 클레프만, 정재부)
  • Real MySQL 8.0 (1권) (백은빈, 이성욱)
  • 개정2판 | 인프라 엔지니어의 교과서 (사노 유타카, 김성훈)
  • Do it! LLM을 활용한 AI 에이전트 개발 입문 (이성용)
  • LLM 엔지니어링 (막심 라본, 폴 이우수틴)
  • 주니어 백엔드 개발자가 반드시 알아야 할 실무 지식 (최범균)
  • 윌 라슨의 엔지니어링 리더십 (윌 라슨, 임백준)

본문 끝 최상단으로 돌아가기

spinner
앱으로 연결해서 다운로드하시겠습니까?
닫기 버튼
대여한 작품은 다운로드 시점부터 대여가 시작됩니다.
앱으로 연결해서 보시겠습니까?
닫기 버튼
앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.
모바일 버전