본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

개정판 | 파이썬 텍스트 마이닝 완벽 가이드 상세페이지

개정판 | 파이썬 텍스트 마이닝 완벽 가이드

데이터 사이언스 시리즈 088 | 자연어 처리 기초부터 딥러닝 기반 BERT와 트랜스포머까지

  • 관심 0
소장
종이책 정가
30,000원
전자책 정가
20%↓
24,000원
판매가
24,000원
출간 정보
  • 2023.07.20 전자책 출간
  • 2023.02.28 종이책 출간
듣기 기능
TTS(듣기) 지원
파일 정보
  • PDF
  • 424 쪽
  • 5.8MB
지원 환경
  • PC뷰어
  • PAPER
ISBN
9791158394561
ECN
-
개정판 | 파이썬 텍스트 마이닝 완벽 가이드

작품 정보

텍스트 마이닝에는 자연어 처리, 통계, 딥러닝 기법에 대해 많은 지식이 필요하지만, 이론적인 내용에 얽매이다 보면 정작 구현은 너무 먼 이야기가 되어 버리기 쉽다.

이 책에서는 실무에 바로 적용할 수 있는 실전적인 예제를 중심으로 텍스트 마이닝을 설명한다. 특히 초보자를 위해 텍스트 전처리 과정의 개념과 다양하고 상세한 활용방법을 기초부터 설명한다. 문서 분류와 감성 분석 같은 텍스트 마이닝 작업을 대상으로 다양한 머신러닝 기법을 사용하는 예를 보여주며, 차원을 축소하고 결과를 시각화하는 방법, 토픽 모델링을 수행하고 토픽 트렌드를 구해서 시각화하는 방법을 설명한다.

기본적인 딥러닝 기법을 이용한 문서 분류 외에, 최근 많이 사용되는 BERT를 이용한 미세조정학습까지 포함한다. 또, 사전학습 언어모델에 대한 관심이 높아짐에 따라, 사전학습 언어모델의 이론적 내용과 다양한 트랜스포머 변형 모형을 설명한다. 그리고 트랜스포머 모형을 활용한 문서 요약, 질의 응답의 실습과 미세조정학습을 추가했다. 더불어 한국어 문서 분석에 자신을 갖도록 대부분의 장에 관련 예제를 충분히 다뤘다.



★ 이 책에서 다루는 내용 ★

* 토큰화, 어간 추출, 표제어 추출, 불용어 처리, 품사 태깅과 같은 텍스트 전처리 기법
* 단어 빈도 그래프, 워드 클라우드 그리기
* 카운트 벡터, TF-IDF 벡터로 문서를 변환하고, 문서 간 유사도 구하기
* 다양한 머신러닝/딥러닝 기법으로 문서 분류와 감성 분석 수행
* KoNLPy를 이용해 한국어 문서를 변환하고 다양한 머신러닝 알고리즘으로 분석
* 문서 벡터의 차원 축소, LDA 토픽모델링, 동적 토픽 모델링, 토픽 트렌드를 구하고 시각화
* Word2Vec, ELMo와 같은 워드 임베딩 기법과 Doc2Vec의 이해
* BERT의 이해와 활용, 파이토치를 이용한 미세조정 학습의 실습, 한국어 문서에 대한 BERT 사용법 실습
* 사전 학습 언어모델과 GPT-2, GPT-3, chatGPT, RoBERTa, ALBERT, ELECTRA, BART, T5 등 다양한 트랜스포머 변형 모형의 이해
* T5, KoBART, DistilBERT, KoELECTRA 등의 트랜스포머 모형을 이용한 문서 요약과 질의 응답 실습

작가 소개

박상언
2007년 3월부터 경기대학교 경영정보전공 교수로 재직하고 있으며, 주요 관심분야는 텍스트마이닝, 머신러닝, 딥러닝 등이다. KAIST에서 전산학 학사, 경영공학 석사와 박사학위를 취득했다. 현재 행정안전부 위원을 맡고 있다.

강주영
2005년 9월부터 아주대학교 e-비즈니스학과 교수로 재직하고 있으며, 주요 관심분야는 빅데이터, 텍스트 마이닝, 지능정보시스템, 블록체인 등이다. 포항공대에서 컴퓨터공학 학사, 서울대에서 컴퓨터공학 석사, KAIST에서 경영공학 박사학위를 취득했다. 현재 아주대 경영빅데이터센터장, 한국빅데이터학회지 편집위원장, 한국지능정보학회 부회장을 역임하며, 빅데이터 및 텍스트마이닝 분야 관련 프로젝트, 자문 및 연구를 수행한다.

리뷰

0.0

구매자 별점
0명 평가

이 작품을 평가해 주세요!

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.
  1. 타인에게 불쾌감을 주는 욕설
  2. 비속어나 타인을 비방하는 내용
  3. 특정 종교, 민족, 계층을 비방하는 내용
  4. 해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
  5. 의미를 알 수 없는 내용
  6. 광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
  7. 저작권상 문제의 소지가 있는 내용
  8. 다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용
* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.
이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.
아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!
'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.
무료 작품 (프로모션 등으로 무료로 전환된 작품 포함)
'구매자'로 표시되지 않습니다.
시리즈 내 무료 작품
'구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소
'구매자' 표시가 자동으로 사라집니다.

데이터 사이언스 시리즈더보기

  • PyTorch를 활용한 강화학습/심층강화학습 실전 입문 (오가와 유타로, 심효섭)
  • 실전 예제로 배우는 GAN (조시 칼린, 박진수)
  • 파이썬을 활용한 딥러닝 전이학습 (디파니안 사르카르, 러그허브 발리)
  • 실전! GAN 프로젝트 (카일라쉬 아히르와, 박진수)
  • 기초부터 시작하는 강화학습/신경망 알고리즘 (손민규)
  • 개정판 | 데이터 분석을 떠받치는 수학 (손민규)
  • 수학으로 풀어보는 칼만 필터 알고리즘 (박성수)
  • 데이터 분석을 위한 수리 모델 입문 (에자키 타카히로, 김범준)
  • 수학으로 풀어보는 강화학습 원리와 알고리즘 (박성수)
  • 파이썬 데이터 클리닝 쿡북 (마이클 워커, 최용)
  • 머신러닝 시스템 디자인 패턴 (시부이 유우스케, 하승민)
  • 실전! 파이토치 딥러닝 프로젝트 (아쉬쉬 란잔 자, 김정인)
  • 개정판|텐서플로 2와 머신러닝으로 시작하는 자연어 처리 (전창욱, 최태균)
  • 파이썬 웹스크레이핑 완벽가이드 (최은석)
  • 모두를 위한 메타러닝 (정창훈, 이승현)
  • 개정판 | 파이썬 데이터 사이언스 핸드북 (제이크 밴더플래스, 김정인)
  • 실전! 컴퓨터비전을 위한 머신러닝 (라이언 길라드, 마틴 괴르너)
  • 파이토치 트랜스포머를 활용한 자연어 처리와 컴퓨터비전 심층학습 (윤대희, 김동화)
  • 파이썬 텍스트 마이닝 바이블 [1권] (이상엽)
  • 파이썬 텍스트 마이닝 바이블 [2권] (이상엽)

개발/프로그래밍 베스트더보기

  • 나만의 MCP 서버 만들기 with 커서 AI (서지영)
  • 핸즈온 LLM (제이 알아마르, 마르턴 흐루턴도르스트)
  • 개정2판 | 인프라 엔지니어의 교과서 (사노 유타카, 김성훈)
  • 생성형 AI를 위한 프롬프트 엔지니어링 (제임스 피닉스, 마이크 테일러)
  • 조코딩의 랭체인으로 AI 에이전트 서비스 만들기 (우성우, 조동근)
  • 개정2판 | 시작하세요! 도커/쿠버네티스 (용찬호)
  • 코드 너머, 회사보다 오래 남을 개발자 (김상기, 배문교)
  • 개발자를 위한 IT 영어 온보딩 가이드 (장진호)
  • 개정2판 | 파인만의 컴퓨터 강의 (리처드 파인만, 서환수)
  • 조코딩의 AI 비트코인 자동 매매 시스템 만들기 (조동근)
  • 타입스크립트, 리액트, Next.js로 배우는 실전 웹 애플리케이션 개발 (테지마 타쿠야, 요시다 타케토)
  • 혼자 공부하는 데이터 분석 with 파이썬 (박해선)
  • 그림으로 이해하는 알고리즘 (이시다 모리테루, 미야자키 쇼이치)
  • 생성형 AI 인 액션 (아미트 바리, 이준)
  • 도커로 구축한 랩에서 혼자 실습하며 배우는 네트워크 프로토콜 입문 (미야타 히로시, 이민성)
  • 테디노트의 랭체인을 활용한 RAG 비법노트 심화편 (이경록)
  • 아키텍트 첫걸음 (요네쿠보 다케시, 조다롱)
  • 지속적 배포 (발렌티나 세르빌, 이일웅)
  • 주니어 백엔드 개발자가 반드시 알아야 할 실무 지식 (최범균)
  • 개정판 | 개발자 기술 면접 노트 (이남희)

본문 끝 최상단으로 돌아가기

spinner
앱으로 연결해서 다운로드하시겠습니까?
닫기 버튼
대여한 작품은 다운로드 시점부터 대여가 시작됩니다.
앱으로 연결해서 보시겠습니까?
닫기 버튼
앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.
모바일 버전