◈ 지은이의 말 ◈
그래프 머신러닝은 네트워크 데이터를 처리하고 예측, 모델링, 분석 작업에 사용할 수 있는 개체 간의 강력한 관계를 활용할 수 있는 새로운 도구를 제공한다.
그래프 이론과 그래프 머신러닝을 간단하게 소개하고, 그래프의 잠재력을 이해하는 방법을 배운다. 이어서 그래프 표현 학습을 위한 주요 머신러닝 모델, 즉 목적과 작동 방식, 다양한 지도 학습과 비지도 학습 응용 프로그램에서 구현하는 방법을 익힌다. 그런 다음 그래프 데이터의 잠재력을 최대한 활용하고자 데이터 처리부터 모델 학습 그리고 예측을 포함한 완전한 머신러닝 파이프라인을 구축한다. 계속해서 소셜 네트워크 데이터를 수집하고, 텍스트 분석과 금융 거래 시스템, 자연어 처리와 같은 실제 시나리오를 다룬다. 마지막으로 네트워크 정보를 저장하고, 질의하고 처리하기 위한 그래프 분석용 데이터 기반 응용 프로그램을 구축하고 확장하는 방법을 배운 다음, 그래프의 최신 동향을 알아본다.
이 책을 통해 그래프 이론의 필수 개념과 머신러닝 응용 프로그램을 성공적으로 구축하는 데 사용되는 모든 알고리듬과 기술을 배울 수 있을 것이다.
◈ 지은이 소개 ◈
클라우디오 스타밀레(Claudio Stamile)
2013년 9월 이탈리아 칼라브리아 대학(University of Calabria)에서 컴퓨터 공학 석사 학위를 받았으며, 2017년 9월 벨기에 뢰번 가톨릭 대학(KU Leuven) 및 프랑스 끌로드 베흐노리용 1 대학(Université Claude Bernard Lyon 1)에서 공동 박사 학위를 받았다. 석박사 학위 과정 동안 생물 의학 분야를 전공하면서 인공지능, 그래프 이론, 머신러닝에 관해 탄탄한 배경 지식을 쌓았다. 현재 최상위 고객이 데이터 기반 전략을 구현하고 인공지능 기반 솔루션을 구축해 효율성을 높이고 새로운 비즈니스 모델을 수행하도록 지원하는 컨설팅 회사인 CGnal의 선임 데이터 과학자다.
알도 마르줄로(Aldo Marzullo)
2016년 9월 칼라브리아 대학에서 컴퓨터과학 석사 학위를 받았다. 알고리듬 설계와 그래프 이론, 그리고 머신러닝을 포함한 여러 분야에서 견고한 배경 지식을 쌓았다. 2020년 1월 칼라브리아 대학과 끌로드 베흐노 리용 1(프랑스 리용) 대학에서 「Deep Learning and Graph Th eory for Brain Connectivity Analysis in Multiple Sclerosis(다발성 경화증 뇌 연결성 분석을 위한 딥러닝과 그래프 이론)」이라는 논문으로 공동 박사 학위를 받았다. 알도는 현재 칼라브리아 대학의 박사후 연구원으로 여러 국제기관과 협력하고 있다.
엔리코 듀세비오(Enrico Deusebio)
현재 최고 수준의 고객이 데이터 기반 전략을 구현하고 인공지능 기반 솔루션을 구축하는 것을 지원하는 컨설팅 회사인 CGnal의 최고 운영 책임자다. 학문적, 산업적 맥락에서 10년 이상 고성능 시설과 대규모 컴퓨팅 센터를 사용해 데이터와 대규모 시뮬레이션을 연구해 왔다. 케임브리지 대학(University of Cambridge), 토리노 대학(University of Turin), 스톡홀름 왕립기술원(KTH) 등 최상위권 대학과 협력해 박사학위를 취득했다. 또한 2014년 토리노 폴리테크닉(Politecnico di Torino)의 항공 우주 공학 학사 및 석사 학위를 받았다.
◈ 옮긴이의 말 ◈
처음 접하는 이들에게는 그래프 데이터가 어렵게 느껴질 수 있다. 하지만 그래프 데이터는 우리의 일상과 친숙해질 수 있는 데이터 형식이다. 사회는 복잡한 관계의 연속으로 구성되는데, 노드와 간선으로 표현되는 그래프 데이터는 이러한 관계의 표현을 가장 잘 나타낼 수 있는 데이터 형식이다. 관계 표현을 가장 쉽게 할 수 있다는 강점이 있어 최근에는 그래프 형식으로 데이터를 저장하는 데이터베이스 등이 각광받고 있다.
이 책은 그래프 데이터를 다루기 위한 아주 기본적인 것들로 시작해서, 실생활에 적용할 수 있는 예시를 통해 보다 쉬운 이해를 제공한다. 예시를 통해서 그래프 데이터를 다루는 기본기를 쌓고, 머신 러닝 알고리즘들을 활용해 고급 응용 스킬들을 배워볼 수 있다. 단순히 이론적인 설명에서 끝나는 것이 아니라 실제 서비스에 필요한 기본 지식들을 소개한다는 점에서 훌륭한 책이다. 물론 나와있는 내용만으로 그래프 머신 러닝 전문가가 될 수 있다고는 할 수 없을 것이다. 그러나 훌륭한 시작을 함께하기 위해 좋은 책이라고 생각한다.
이 책에서는 보다 복잡한 설명이나 심도 있는 이해가 필요한 부분에 참고할 만한 자료들에 대한 소개가 나와있다. 이러한 참고 자료들을 찾아보고 스스로 새로운 문제를 해결하기 위해 노력해보기를 꼭 권장한다. 이러한 노력이 인공지능 연구의 선도자가 되는 길이라고 생각한다.
◈ 옮긴이 소개 ◈
김기성
파이썬 개발자로서 주로 이상 음원 탐지 모델 개발과 단어 인식과 관련된 자연어 처리 모델 개발을 담당했다. 그리고 개발한 모델을 서비스하기 위한 서버 플랫폼도 파이썬으로 개발해 국내 CCTV 관제실에 다수 도입됐다.
장기식
경희대학교에서 대수학을 전공했으며, 고려대학교 정보보호대학원에서 박사 학위를 취득했다. 이후 약 10년간 경찰청 사이버안전국 디지털포렌식센터에서 디지털 포렌식 업무를 담당했다. 경찰대학 치안정책연구소에서 데이터 분석을 접한 이후 데이터 분석을 기반으로 한 머신러닝 기술을 연구했으며, 이 경험을 바탕으로 현재 아이브스 CTO 및 AI LAB 연구소장으로 딥러닝 기반 영상 및 음향·음성 보안 솔루션과 데이터 분석 플랫폼 개발 및 연구를 책임지고 있다. 번역서로는 『보안을 위한 효율적인 방법 PKI』(인포북, 2003)와 『EnCase 컴퓨터 포렌식』(에이콘, 2015), 『인텔리전스 기반 사고 대응』(에이콘, 2019), 『적대적 머신러닝』(에이콘, 2020), 『사이버 보안을 위한 머신러닝 쿡북』(에이콘, 2021), 『양자 암호 시스템의 시작』(에이콘, 2021), 『스크래치로 배워보자! 머신러닝』(에이콘, 2022), 『Pandas를 이용한 데이터 분석 실습 2/e』(에이콘, 2022)이 있다.