본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

QA를 넘어 개발자도 알아야 할 AI 에이전트 품질 가이드 상세페이지

QA를 넘어 개발자도 알아야 할 AI 에이전트 품질 가이드

정답 없는 AI 서비스의 신뢰 기준, LLM Judge 평가 전략

  • 관심 0
소장
종이책 정가
28,000원
전자책 정가
30%↓
19,600원
판매가
19,600원
출간 정보
  • 2026.06.10 전자책 출간
  • 2026.02.26 종이책 출간
듣기 기능
TTS(듣기) 지원
파일 정보
  • PDF
  • 329 쪽
  • 12.2MB
지원 환경
  • PC뷰어
  • PAPER
ISBN
9788965404354
UCI
-
QA를 넘어 개발자도 알아야 할 AI 에이전트 품질 가이드

작품 정보

AI 시대 요즘 QA, AI 에이전트 품질 평가, 이 한 권으로 시작하자!
정답 없는 AI 시대, 무엇을 기준으로 PASS를 줄 것인가?
QA팀이 없어도, 품질은 누군가 책임져야 합니다.

AI 서비스는 왜 ‘어제는 괜찮았는데 오늘은 실패하는지’ 설명하기가 어렵습니다. 같은 질문에도 답이 달라지고, 맥락에 따라 결과가 바뀌며, 문제를 재현하기도 쉽지 않기 때문입니다. 저자는 이런 흔들림을 줄이기 위해, 개발이 끝난 뒤에 검증을 덧붙이는 방식이 아니라 Shift-Left Testing 관점에서 초기에 품질을 설계하고 운영하는 흐름을 실무 언어로 정리했습니다. 이 책은 그 결과를 담은 AI 에이전트 품질 평가 입문서입니다.

먼저 “좋은 답변”을 말로만 판단하지 않도록, Responsible AI Testing 프레임워크인 RaiT를 바탕으로 품질의 조건을 항목별로 정리합니다. 정확도뿐 아니라 의도 이해, 안전성, 표현의 적절성, 일관성처럼 실제 서비스에서 문제가 되는 지점을 기준으로 삼아, 팀이 합의할 수 있는 평가 기준표를 만들고, 그 기준을 Judge 프롬프트로 구현해 누가 보더라도 납득할 수 있는 판정 체계로 바꾸는 방법을 안내합니다.

그리고 사람이 매번 확인하는 방식에서 벗어나, 평가를 반복 가능하게 만드는 운영 방식을 제시합니다. 릴리스가 반복될수록 평가가 느슨해지거나 결과가 흔들리지 않도록, 테스트 준비부터 실행, 결과 정리와 공유까지의 흐름을 표준화하고, 현업에 즉시 적용할 수 있는 체크리스트와 보고서 템플릿도 함께 제공합니다. 더 나아가 품질이 좋아도 느리면 실패한다는 관점에서, 사용자가 체감하는 반응 속도인 TTFT와 완성 속도인 TTLT까지 함께 다루며, 릴리스마다 더 단단해지는 운영 루프로 연결합니다.

이 책을 통해 여러분은 흔들리는 결과 앞에서 당황하기보다, 정리하고 재현하고 개선하는 방식으로 문제를 다루게 될 것입니다. 완벽함보다 중요한 건 꾸준히 운영 가능한 체계를 만드는 일이고, 그 과정에서 여러분은 분명 한층 더 강한 품질 담당자로 성장하게 될 것입니다.

작가 소개

정상미
(smjung8710@gmail.com)
소프트웨어 품질보증 분야의 발전을 위해 노력하고 있는 전문가이다. AI를 비롯한 다양한 소프트웨어 영역에서 품질보증 적용 확대와 테스트 자동화, 테스트 환경 구축에 관심을 가지고 있으며, 특히 자동화 기반 검증과 대규모 언어모델(LLM) 검증, 보안성 검증 기술 연구에 주력하고 있다. 음성 AI 서비스와 모빌리티 플랫폼의 품질보증 업무를 수행하며, 윈도우, 리눅스, 맥, 모바일, 웹 브라우저 등 다양한 이기종 플랫폼에서 동작하는 제품들의 테스트 자동화 프로젝트를 수행해 왔다. 정보관리기술사로서 IT 보안과 소프트웨어 품질관리 전문성 향상에 힘쓰고 있다. 저서로는 『더 괜찮은 QA가 되기 위한 프랙티컬 테스트 자동화』가 있다.

김성수
(ksszidane@naver.com)
소프트웨어 품질보증(SQA) 분야의 전문가이다. 2008년부터 포털 서비스, 게임 플랫폼 등 기술적 난도가 높은 다양한 도메인에서 품질 전략을 수립하고, QA Ops 기반의 효율적인 자동화 시스템 도입에 주력해 왔다. 네이버, 넥슨 등 국내 주요 빅테크 기업을 거치며 풍부한 실무 경험을 쌓았으며, 현재는 국내 유수 통신사에서 초거대 언어모델(LLM) 기반 AI 에이전트 서비스의 검증과 품질 자동화 구축 및 운영을 이끌고 있다. 급변하는 AI 시대에 걸맞은 새로운 품질 기준을 제시하기 위해 끊임없이 연구하며 실천하는 실무 전문가이다.

리뷰

0.0

구매자 별점
0명 평가

이 작품을 평가해 주세요!

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.
  1. 타인에게 불쾌감을 주는 욕설
  2. 비속어나 타인을 비방하는 내용
  3. 특정 종교, 민족, 계층을 비방하는 내용
  4. 해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
  5. 의미를 알 수 없는 내용
  6. 광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
  7. 저작권상 문제의 소지가 있는 내용
  8. 다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용
* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.
이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.
아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!
'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.
무료 작품 (프로모션 등으로 무료로 전환된 작품 포함)
'구매자'로 표시되지 않습니다.
시리즈 내 무료 작품
'구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소
'구매자' 표시가 자동으로 사라집니다.

본문 끝 최상단으로 돌아가기

spinner
앱으로 연결해서 다운로드하시겠습니까?
닫기 버튼
대여한 작품은 다운로드 시점부터 대여가 시작됩니다.
앱으로 연결해서 보시겠습니까?
닫기 버튼
앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.
모바일 버전