Name: 머신러닝을 위한 실전 데이터셋
Price: 14400 KRW
Availability: OnlineOnly
Rating: 3.0 (1 reviews)
Author: 칼리드 엘 에맘 외 2명

머신러닝을 위한 실전 데이터셋 상세페이지

출간 정보

2021.01.11 전자책 출간
2021.01.04 종이책 출간

듣기 기능

TTS(듣기) 미지원

파일 정보

PDF
173 쪽
5.1MB

지원 환경

앱
웹
PC뷰어
PAPER

ISBN

9791162247310

ECN

머신러닝을 위한 실전 데이터셋

작품 정보

개인 정보 보호와 광범위한 데이터 사용의 균형을 이루다.

머신러닝 모델을 구축하고, 테스트를 진행하려면 크고 다양한 종류의 데이터가 필요하다. 그러나 대부분의 데이터셋은 개인 정보 문제로 사용이 제한적이라 광범위하게 사용할 수 없다. 이 책에서는 실제 데이터로 새로운 데이터를 만드는 실용적인 합성 데이터 기술을 소개한다. 합성 데이터는 이차 분석에 용이하여 데이터 연구, 고객 행동의 이해, 신제품 개발 등 다양한 목적으로 활용될 수 있다.

이 책은 실제 데이터를 합성해 다양한 산업에서 사용할 수 있는 방법을 제공하며, 개인 정보 문제를 해결하는 방법을 다룬다. 또한 실제 데이터셋에서 합성 데이터를 생성하기 위한 원칙과 단계를 배운다. 더 나아가 합성 데이터가 제품이나 솔루션 개발에 드는 시간을 어떻게 단축할 수 있는지를 학습한다.

다변량 정규 분포를 사용해 합성 데이터 생성하기
다양한 적합도 메트릭을 분포 적합하기
원본 데이터의 구조를 복제하기
관계가 복잡한 데이터를 모델링하기
데이터 효용성을 평가하는 방식과 측정 기준 정하기
실제 데이터를 분석해 합성 데이터를 복제하기
합성 데이터의 개인 정보와 신원 노출을 평가하기

출판사 리뷰

합성 데이터는 지난 몇 년간 주목을 받으며 사회적 관심이 급속도로 증가했는데, 이러한 현상은 다음과 같은 두 가지에 관심이 쏠리면서 촉발됐다. 첫째는 인공지능과 머신러닝(AIML) 모델을 양성하고 구축하는 데 따른 대량의 데이터 수요다. 둘째는 고품질의 합성 데이터를 생성하는 효과적인 방법을 입증한 최근의 작업이다. 이로 인해 합성 데이터가 특히 AIML 커뮤니티 내에서 어려운 문제를 일부 상당히 효과적으로 해결할 수 있음을 인식하게 됐다. 따라서 NVIDIA, IBM, 알파벳과 같은 회사들만이 아니라 미국 인구조사국 같은 정부 기관도 모델 구축, 애플리케이션 개발, 데이터 배포를 지원하기 위해 다양한 유형의 데이터 합성 방법론을 채택하기에 이르렀다.

1장 : 합성 데이터와 그 이점이 무엇인지 설명한다. 인공지능과 머신러닝(AIML) 프로젝트는 다양한 산업에서 사용되고 있으며, 광범위한 활용 사례 중 맛보기로 몇 가지를 발췌해 수록했다.

2장 : 데이터 합성의 목표를 설정하고 다른 방법들에 비해 비즈니스 우선순위에 적합한 시기를 결정하는 데 도움되는 의사결정 프레임워크를 제시한다.

3장 : 데이터 합성 프로세스의 첫 번째 단계인 분포 모델링을 다룬다. 비정형 데이터 분포를 머신러닝 모델에 적합하는 방법을 개략적으로 설명한다.

4장 : 합성 데이터에 사용할 수 있는 데이터 효용성 프레임워크를 설명한다. 데이터 합성기 최적화, 데이터 합성 접근법, 합성 데이터의 결과 파악 등을 살펴본다.

5장 : 기본 개념을 이용해 합성 데이터를 생성해본다. 몇 가지 기본적인 접근법으로 시작해서 뒤로 갈수록 복잡한 접근법으로 발전하며 입문자용 기술부터 고급 기술까지 다룬다.

6장 : 먼저 데이터 합성이 보호하려는 노출 유형을 정의한다. 미국과 유럽연합의 주요 프라이버시 규정이 합성 데이터를 어떻게 다루는지 검토하고, 프라이버시 보장 분석을 시작할 방법을 제시한다.

7장 : 합성 데이터셋과 합성 데이터 생성 기술을 전수해온 경험을 바탕으로 실제 데이터를 처리할 때 도움될 실용적인 고려사항을 제시한다. 도전적인 과업을 강조할 뿐만 아니라 과업을 해결할 방안도 제시한다.

작가

칼리드 엘 에맘

경력

오타와 대학교 의과대학 교수

2021.01.07 업데이트

작가 프로필 수정 요청

Eastern Ontario Research Institute의 아동병원 선임 과학자이자 종합적인 전자 건강 정보연구소 소장으로 합성 데이터 생성 방법과 도구에 대한 응용 학술 연구를 수행하고 재식별 위험성을 측정한다. 또 오타와 대학교 의과대학 교수로 재직 중이다

칼리드는 의료산업에서 인공지능과 머신러닝(Artificial Intelligence and Machine Learning, AIML)의 응용을 추진하기 위해 합성 데이터 개발에 주력하는 Replica Analytics의 공동 설립자다. 동시에 데이터 보호 기술을 개발하고 의료 서비스를 제공하며 신약 발명을 지원하는 분석 도구를 구축하는 기술 회사의 이사회에서 투자, 자문, 이사를 겸임하고 있다..

작가의 대표 작품더보기

데이터 익명화를 위한 파이프라인 (루크 아버클, 칼리드 엘 에맘)
머신러닝을 위한 실전 데이터셋 (칼리드 엘 에맘, 루시 모스케라)

리뷰

3.0

구매자 별점

1명 평가

별점 분포 보기

이 작품을 평가해 주세요!

리뷰 작성 유의사항

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.

타인에게 불쾌감을 주는 욕설
비속어나 타인을 비방하는 내용
특정 종교, 민족, 계층을 비방하는 내용
해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
의미를 알 수 없는 내용
광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
저작권상 문제의 소지가 있는 내용
다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용

* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.

이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.

아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!

구매자 표시 기준은 무엇인가요?

'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.

무료 작품 (프로모션 등으로 무료로 전환된 작품 포함): '구매자'로 표시되지 않습니다.
시리즈 내 무료 작품: '구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제: 작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소: '구매자' 표시가 자동으로 사라집니다.

개발/프로그래밍 베스트더보기

한 걸음 앞선 개발자가 지금 꼭 알아야 할 클로드 코드 (조훈, 정찬훈)
AI 엔지니어링 (칩 후옌, 변성윤)
블렌더로 애니 그림체 캐릭터를 만들어보자! -모델링편- (나츠모리 카츠, 김모세)
헤드 퍼스트 소프트웨어 아키텍처 (라주 간디, 마크 리처드)
AI 프로덕트 기획과 운영 (마릴리 니카, 오성근)
안티프래질 프런트엔드 (김상철)
밑바닥부터 시작하는 웹 브라우저 (파벨 판체카, 크리스 해럴슨)
AI 에이전트 생태계 (이주환)
테디노트의 랭체인을 활용한 RAG 비법노트 심화편 (이경록)
개발자를 위한 생성형 AI 활용 가이드 (핫토리 유우키, 하승민)
할루시네이션을 줄여주는 프롬프트 엔지니어링 (한성민 )
블렌더로 애니 그림체 캐릭터를 만들어보자! 카툰 렌더링편 (나츠모리 카츠, 김모세)
소문난 명강의 : 크리핵티브의 한 권으로 끝내는 웹 해킹 바이블 (하동민)
딥러닝 제대로 이해하기 (사이먼 J. D. 프린스, 고연이)
실무로 통하는 웹 API (조 아타디, 김태곤)
테디노트의 랭체인을 활용한 RAG 비법노트_기본편 (이경록(테디노트))
멀티패러다임 프로그래밍 (유인동)
개정판 | 혼자 공부하는 머신러닝+딥러닝 (박해선)
시작! AWS (가와바타 고헤이, 기쿠치 다카아키)
데이터 중심 애플리케이션 설계 (마틴 클레프만, 정재부)

성인 인증 안내

성인 재인증 안내

성인 인증 안내

성인 재인증 안내

청소년보호법에 따라 성인 인증은 1년간
유효하며, 기간이 만료되어 재인증이 필요합니다.
성인 인증 후에 이용해 주세요. 해당 작품은 성인 인증 후 보실 수 있습니다.
성인 인증 후에 이용해 주세요.

청소년보호법에 따라 성인 인증은 1년간
유효하며, 기간이 만료되어 재인증이 필요합니다.
성인 인증 후에 이용해 주세요. 해당 작품은 성인 인증 후 선물하실 수 있습니다.
성인 인증 후에 이용해 주세요.

본문 끝 최상단으로 돌아가기

무료이용권

무료이용권을 사용하시겠습니까?

사용 가능 : 장

<>부터 총 화
무료이용권으로 대여합니다.

무료이용권

무료이용권으로
총 화 대여 완료했습니다.

남은 작품 : 총 화 (원)

도움말

머신러닝을 위한 실전 데이터셋

- 본 작품은 1일마다 1편씩 무료입니다.
- 최근 10편은 해당 이용권으로 볼 수 없습니다.
- 해당 이용권으로는 무료로 3일간 볼 수 있습니다.

무료로 보기

작품 제목

대여 기간 : 일

이용권 선택

결제하기

작품 제목

결제 금액 : 원

리디포인트 사용: 0원 (원 보유)
리디캐시 사용: 100원 (원 보유)

결제하기

결제 가능한 리디캐시, 포인트가 없습니다.

리디캐시 충전하고 결제없이 편하게 감상하세요.
리디포인트 적립 혜택도 놓치지 마세요!

결제하기

이미 구매한 작품입니다.

결제 방법 선택

작품 제목

원하는 결제 방법을 선택해주세요.

이어보기

작품 제목

대여 기간이 만료되었습니다.
다음화를 보시겠습니까?

앱으로 연결해서 다운로드하시겠습니까?

대여한 작품은 다운로드 시점부터 대여가 시작됩니다.

앱으로 연결해서 보시겠습니까?

앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.

모바일 버전

머신러닝을 위한 실전 데이터셋

개인 정보를 보호하고 머신러닝 학습에 사용할 합성 데이터 만들기

작품 정보

작품 소개

목차

작가

작가 프로필

작가 소개

리뷰

3.0

이 작품을 평가해 주세요!

개발/프로그래밍 베스트더보기

성인 인증 안내

성인 재인증 안내