◈ 지은이의 말 ◈
“설명 가능한 AI”(eXplainable AI, XAI)라고도 알려진 “해석 가능한 머신러닝”(Interpretable Machine Learning)은 모델로부터 학습해 모두가 모델에 바라는 대로 모델을 안전하고 공정하고 신뢰할 수 있도록 만들기 위해 계속 발전하고 있는 일련의 방법론이다.
그러나 AI가 소프트웨어와 인간을 대체하면서 머신러닝 모델은 더 “지능적인” 형태의 소프트웨어로 여겨진다. 실제로는 1과 0으로 이뤄져 있지만, 머신러닝 모델의 논리가 인간에 의해 프로그래밍되고 디자인돼 의도된 대로 수행된다는 점에서 머신러닝 모델은 소프트웨어가 아니다. 그러므로 해석은 인간이 머신러닝 모델과 그 모델의 실수를 이해하고, 그들이 해를 끼치기 전에 결점을 고칠 수 있게 해 주는 방법이다. 따라서 해석은 신뢰할 수 있고 윤리적인 모델을 만드는 데 중요하다. 또한 머지않아 모델을 학습시킬 때 코드가 아닌 드래그 앤 드롭 인터페이스를 사용하게 될 것이다. 그러므로 파이썬은 매우 인기있기는 하지만 결국 시간의 테스트를 견뎌 낼 기술은 머신러닝 해석이다.
현재로서는 데이터를 준비하고 탐색한 다음 모델을 학습하고 결과를 내기 위해서 여전히 상당한 코드가 필요하고, 이 책의 모든 장에는 자세한 파이썬 코드 예제를 포함하고 있다. 그러나 이 책은 유스 케이스와 목적 의식이 서로 단절된 프로그래밍 "쿡북(cookbook)"으로 설계되지 않았다. 대신 이 책은 패러다임을 뒤집는다. 그 이유는 간단하다. 결국, 해석의 모든 것은 "왜?"라는 질문에 답하기 위해 존재한다. “해석 가능한 머신러닝”이 독자에게 효과적이려면 "어떻게?"보다 “왜?”가 선행돼야 한다.
이런 이유로 대부분의 장은 과제('왜?')와 접근법('어떻게?')으로 시작한다. 그 다음 장 전체에 걸쳐 학습할 방법론('어떻게?')을 사용해 과제를 완료하는 것이 목표이며, 결과를 해석하는 데('왜?')에 초점을 맞춘다. 마지막으로 과제를 완료하면서 어떤 실행 가능한 통찰력을 얻었는지 되짚어 볼 것이다.
책 역시 기초부터 시작해 더 발전된 주제로 넘어가는 구조다. 사용되는 도구는 모두 오픈소스이며 마이크로소프트, 구글, IBM 등과 같은 최첨단 연구소에서 빌드한 것이다. 매우 광범위한 분야이므로 대부분은 아직 연구 단계지만 앞으로 널리 쓰이게 될 것이다. 이 책은 그 모든 분야를 다루진 않을 예정이다. 대신 머신러닝에 관련된 많은 실무자와 전문가에게 유용하도록 많은 해석 가능성 도구를 충분히 깊이 있게 제시하는 게 목적이다.
1부는 해석 가능성(interpretability)에 대한 초급 안내서로, 비즈니스와의 연관성을 다루고 해석 가능성의 주요 측면과 과제를 탐구한다. 2부에서는 다양한 해석 방법론들을 분류나 회귀에 대해서, 테이블 데이터, 시계열, 이미지, 텍스트 등 다양한 유스 케이스에 적용하는 방법을 살펴본다. 3부에서는 해석 가능성을 위해 복잡성을 줄이고, 편향을 완화하고, 가드레일을 배치하고, 안정성을 향상시키면서 모델을 튜닝하고 데이터를 학습하는 방법에 관해 실습한다.
이 책을 끝내면 머신러닝 모델을 더 잘 이해하고, 해석 방법론을 사용한 해석 가능성 튜닝을 통해 모델을 개선할 수 있게 될 것이다.
◈ 지은이 소개 ◈
세르그 마시스(Serg Masís)
지난 20년 동안 인터넷, 애플리케이션 개발 및 분석의 교차점에 있었다. 현재 세계 식량 안보 향상의 임무를 가진 선도적인 농업 비즈니스 기업인 신젠타(Syngenta)의 기후 및 농업 데이터 과학자다. 그 전에는 클라우드 컴퓨팅과 머신러닝의 힘을 의사결정 과학의 원리와 결합해 사용자를 새로운 장소와 이벤트에 노출시키는 하버드 이노베이션 랩스(Harvard Innovation Labs)가 인큐베이팅한 스타트업을 공동 설립했다. 여가 활동이나 식물의 질병, 또는 고객 평생 가치 등 분야에 상관없이 데이터와 의사결정 사이에서 자주 놓치는 연결 고리를 제공하는 데 열정을 쏟고 있으며, 머신러닝 해석은 이런 격차를 해소하는 데 강력한 도움이 된다.
◈ 옮긴이의 말 ◈
얼마 전 국내의 한 대화형 인공지능 챗봇이 출시된 지 얼마 지나지 않아 혐오 및 차별 발언을 했을 뿐만 아니라 학습 데이터를 불법으로 수집했음이 밝혀진 사건이 일어났다. 이는 훨씬 전에 마이크로소프트의 챗봇인 테이(Tay)가 인종차별 관련 혐오 발언으로 서비스가 중단된 사례가 있었음에도 모델 구축 시 이를 전혀 고려하지 않았기 때문이었다. 이 사건을 통해 국내에서도 ‘AI 윤리’가 핵심 이슈로 떠올랐다. 또한 등장하자마자 큰 관심을 받고 있는 챗GPT에 대해서도 윤리적 문제를 일으킬 수 있는 답변을 유도하는 질문 방식이 온라인상에 공유되면서 ‘AI 윤리’에 관한 논란이 다시금 빚어지고 있다.
이 책은 ‘AI 윤리’에서 중요한 주제인 인공지능 모델의 공정성, 책임성, 투명성을 기반으로 ‘머신러닝 해석 가능성’이 왜 중요한지 다룬다. 그 다음 머신러닝 해석에 사용되는 전통적인 방법론의 한계를 살펴보고 예측 성능과 모델 해석 가능성 사이에서 어떻게 절충할 수 있을지 고민한다.
모델을 해석하기 위한 방법론으로 먼저 피처 중요도와 피처의 영향력을 기반으로 하는 여러 가지 해석 방법론을 살펴본다. 그 다음 해석 방법론 중에서 가장 두드러진 주목을 받고 있는 SHAP(SHapley Additive exPlanations)과 LIME(Local Interpretable Model-Agnostic dEscriptions)을 활용한 모델 독립적인 해석 방법론을 다룬다. 또한 인간이 해석할 수 있는 방식으로 불공정한 예측을 설명하는 방법론인 대조적 설명 방법론 등을 소개한다.
이미지를 처리하는 컨볼루션 신경망에 대해서도 다양한 해석 방법론을 살펴보며, 더 나아가 신경망 모델을 공격하는 다양한 적대적 공격에 대해서 모델의 견고성을 구축하기 위한 방어법을 설명한다. 또한 예측과 불확실성이 본질적으로 어떻게 연결돼 있는지, 입력과 관련된 모델 출력의 불확실성 측정을 위해 어떤 방법론들이 설계됐는지도 다룬다. 마지막으로 모델의 공정성을 시각화하는 방법과 함께 모델의 편향을 줄이고 공정성과 견고성을 위해 모델을 튜닝하는 방법론을 살펴본다.
이 책을 통해 독자들은 ‘AI 윤리’의 기초 지식뿐만 아니라 이를 실무에 적용하기 위한 다양한 방법론을 배울 수 있을 것이다. 여러분이 구축하는 인공지능 모델이 머신러닝 해석 가능성 생태계에서 윤리적 문제를 극복하고 고성능의 견고한 서비스가 되기를 기원한다.
◈ 옮긴이 소개 ◈
김우현
대학생 시절, 선배와 함께 창업한 이후 20년 넘게 소프트웨어 개발자로 살고 있으며 인공지능 분야에서 새로운 길을 만들어 가고 있다. 숙명여자대학교 나노/바이오 전산화학 연구센터에서 데이터 과학자로 근무했으며, 현재 프리랜서 AI 개발자로 일하는 중이다. 옮긴 책으로는 에이콘출판사에서 출간한 『R 데이터 구조와 알고리즘』(2017), 『자바 데이터 사이언스 쿡북』(2018), 『피처 엔지니어링, 제대로 시작하기』(2018), 『The Python 3 Standard Library by Example』(2020), 『파이썬 객체지향 프로그래밍 4/e』(2022) 등이 있다.