본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

개정판 | 파이썬 텍스트 마이닝 완벽 가이드 상세페이지

개정판 | 파이썬 텍스트 마이닝 완벽 가이드

데이터 사이언스 시리즈 088 | 자연어 처리 기초부터 딥러닝 기반 BERT와 트랜스포머까지

  • 관심 0
소장
종이책 정가
30,000원
전자책 정가
20%↓
24,000원
판매가
24,000원
출간 정보
  • 2023.07.20 전자책 출간
  • 2023.02.28 종이책 출간
듣기 기능
TTS(듣기) 지원
파일 정보
  • PDF
  • 424 쪽
  • 5.8MB
지원 환경
  • PC뷰어
  • PAPER
ISBN
9791158394561
ECN
-
개정판 | 파이썬 텍스트 마이닝 완벽 가이드

작품 정보

텍스트 마이닝에는 자연어 처리, 통계, 딥러닝 기법에 대해 많은 지식이 필요하지만, 이론적인 내용에 얽매이다 보면 정작 구현은 너무 먼 이야기가 되어 버리기 쉽다.

이 책에서는 실무에 바로 적용할 수 있는 실전적인 예제를 중심으로 텍스트 마이닝을 설명한다. 특히 초보자를 위해 텍스트 전처리 과정의 개념과 다양하고 상세한 활용방법을 기초부터 설명한다. 문서 분류와 감성 분석 같은 텍스트 마이닝 작업을 대상으로 다양한 머신러닝 기법을 사용하는 예를 보여주며, 차원을 축소하고 결과를 시각화하는 방법, 토픽 모델링을 수행하고 토픽 트렌드를 구해서 시각화하는 방법을 설명한다.

기본적인 딥러닝 기법을 이용한 문서 분류 외에, 최근 많이 사용되는 BERT를 이용한 미세조정학습까지 포함한다. 또, 사전학습 언어모델에 대한 관심이 높아짐에 따라, 사전학습 언어모델의 이론적 내용과 다양한 트랜스포머 변형 모형을 설명한다. 그리고 트랜스포머 모형을 활용한 문서 요약, 질의 응답의 실습과 미세조정학습을 추가했다. 더불어 한국어 문서 분석에 자신을 갖도록 대부분의 장에 관련 예제를 충분히 다뤘다.



★ 이 책에서 다루는 내용 ★

* 토큰화, 어간 추출, 표제어 추출, 불용어 처리, 품사 태깅과 같은 텍스트 전처리 기법
* 단어 빈도 그래프, 워드 클라우드 그리기
* 카운트 벡터, TF-IDF 벡터로 문서를 변환하고, 문서 간 유사도 구하기
* 다양한 머신러닝/딥러닝 기법으로 문서 분류와 감성 분석 수행
* KoNLPy를 이용해 한국어 문서를 변환하고 다양한 머신러닝 알고리즘으로 분석
* 문서 벡터의 차원 축소, LDA 토픽모델링, 동적 토픽 모델링, 토픽 트렌드를 구하고 시각화
* Word2Vec, ELMo와 같은 워드 임베딩 기법과 Doc2Vec의 이해
* BERT의 이해와 활용, 파이토치를 이용한 미세조정 학습의 실습, 한국어 문서에 대한 BERT 사용법 실습
* 사전 학습 언어모델과 GPT-2, GPT-3, chatGPT, RoBERTa, ALBERT, ELECTRA, BART, T5 등 다양한 트랜스포머 변형 모형의 이해
* T5, KoBART, DistilBERT, KoELECTRA 등의 트랜스포머 모형을 이용한 문서 요약과 질의 응답 실습

작가 소개

박상언
2007년 3월부터 경기대학교 경영정보전공 교수로 재직하고 있으며, 주요 관심분야는 텍스트마이닝, 머신러닝, 딥러닝 등이다. KAIST에서 전산학 학사, 경영공학 석사와 박사학위를 취득했다. 현재 행정안전부 위원을 맡고 있다.

강주영
2005년 9월부터 아주대학교 e-비즈니스학과 교수로 재직하고 있으며, 주요 관심분야는 빅데이터, 텍스트 마이닝, 지능정보시스템, 블록체인 등이다. 포항공대에서 컴퓨터공학 학사, 서울대에서 컴퓨터공학 석사, KAIST에서 경영공학 박사학위를 취득했다. 현재 아주대 경영빅데이터센터장, 한국빅데이터학회지 편집위원장, 한국지능정보학회 부회장을 역임하며, 빅데이터 및 텍스트마이닝 분야 관련 프로젝트, 자문 및 연구를 수행한다.

리뷰

0.0

구매자 별점
0명 평가

이 작품을 평가해 주세요!

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.
  1. 타인에게 불쾌감을 주는 욕설
  2. 비속어나 타인을 비방하는 내용
  3. 특정 종교, 민족, 계층을 비방하는 내용
  4. 해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
  5. 의미를 알 수 없는 내용
  6. 광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
  7. 저작권상 문제의 소지가 있는 내용
  8. 다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용
* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.
이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.
아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!
'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.
무료 작품 (프로모션 등으로 무료로 전환된 작품 포함)
'구매자'로 표시되지 않습니다.
시리즈 내 무료 작품
'구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소
'구매자' 표시가 자동으로 사라집니다.

데이터 사이언스 시리즈더보기

  • PyTorch를 활용한 강화학습/심층강화학습 실전 입문 (오가와 유타로, 심효섭)
  • 실전 예제로 배우는 GAN (조시 칼린, 박진수)
  • 파이썬을 활용한 딥러닝 전이학습 (디파니안 사르카르, 러그허브 발리)
  • 실전! GAN 프로젝트 (카일라쉬 아히르와, 박진수)
  • 기초부터 시작하는 강화학습/신경망 알고리즘 (손민규)
  • 개정판 | 데이터 분석을 떠받치는 수학 (손민규)
  • 수학으로 풀어보는 칼만 필터 알고리즘 (박성수)
  • 데이터 분석을 위한 수리 모델 입문 (에자키 타카히로, 김범준)
  • 수학으로 풀어보는 강화학습 원리와 알고리즘 (박성수)
  • 파이썬 데이터 클리닝 쿡북 (마이클 워커, 최용)
  • 머신러닝 시스템 디자인 패턴 (시부이 유우스케, 하승민)
  • 실전! 파이토치 딥러닝 프로젝트 (아쉬쉬 란잔 자, 김정인)
  • 개정판|텐서플로 2와 머신러닝으로 시작하는 자연어 처리 (전창욱, 최태균)
  • 파이썬 웹스크레이핑 완벽가이드 (최은석)
  • 모두를 위한 메타러닝 (정창훈, 이승현)
  • 개정판 | 파이썬 데이터 사이언스 핸드북 (제이크 밴더플래스, 김정인)
  • 실전! 컴퓨터비전을 위한 머신러닝 (라이언 길라드, 마틴 괴르너)
  • 파이토치 트랜스포머를 활용한 자연어 처리와 컴퓨터비전 심층학습 (윤대희, 김동화)
  • 파이썬 텍스트 마이닝 바이블 [1권] (이상엽)
  • 파이썬 텍스트 마이닝 바이블 [2권] (이상엽)

개발/프로그래밍 베스트더보기

  • 핸즈온 LLM (제이 알아마르, 마르턴 흐루턴도르스트)
  • 개정4판 | 스위프트 프로그래밍 (야곰)
  • 모던 소프트웨어 엔지니어링 (데이비드 팔리, 박재호)
  • LLM 엔지니어링 (막심 라본, 폴 이우수틴)
  • 잘되는 머신러닝 팀엔 이유가 있다 (데이비드 탄, 에이다 양)
  • 러닝 랭체인 (메이오 오신, 누노 캄포스)
  • 혼자 만들면서 공부하는 딥러닝 (박해선)
  • 주니어 백엔드 개발자가 반드시 알아야 할 실무 지식 (최범균)
  • 스테이블 디퓨전 실전 가이드 (시라이 아키히코, AICU 미디어 편집부)
  • 개정판|혼자 공부하는 파이썬 (윤인성)
  • 실리콘밸리에서 통하는 파이썬 인터뷰 가이드 (런젠펑, 취안수쉐)
  • 7가지 프로젝트로 배우는 LLM AI 에이전트 개발 (황자, 김진호)
  • 미래를 선점하라 : AI Agent와 함께라면 당신도 디지털 천재 (정승원(디지털 셰르파))
  • 요즘 우아한 AI 개발 (우아한형제들)
  • 개정판 | 개발자 기술 면접 노트 (이남희)
  • 최고의 프롬프트 엔지니어링 강의 (김진중)
  • 혼자 공부하는 네트워크 (강민철)
  • 입문자를 위한 맞춤형 AI 프로그램 만들기 (다비드스튜디오)
  • Do it! JSCODE의 AWS 입문 (박재성)
  • Do it! LLM을 활용한 AI 에이전트 개발 입문 (이성용)

본문 끝 최상단으로 돌아가기

spinner
앱으로 연결해서 다운로드하시겠습니까?
닫기 버튼
대여한 작품은 다운로드 시점부터 대여가 시작됩니다.
앱으로 연결해서 보시겠습니까?
닫기 버튼
앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.
모바일 버전