■ 담 당 : 이상엽 교수 (연세대학교 언론홍보영상학부)
■ 일 시 : 2024년 7월 1일 – 7월 5일 (월-금, 9:30~13:30) [5회 과정]
■ 수업방식 : ZOOM 실시간 온라인 강의
■ 수강신청 : [2차] 2024년 6월 21일(금) 오전 10시부터
1. 과정 개요
워크숍 목표 및 개요 |
파이썬을 이용한 텍스트 분석 방법을 강의합니다. |
참가 대상 |
텍스트 마이닝에 관심 있는 학부, 대학원생 및 일반 연구자 모두 |
선수 과목 |
기초적 파이썬 코딩 |
워크숍 운영방식 |
강의와 실습을 병행합니다. |
교재 및 참고문헌 |
강사의 강의노트가 제공됩니다.
<참고문헌> - 이상엽 (2023). 파이썬 텍스트 마이닝 바이블 1: 텍스트 전처리 및 머신러닝을 이용한 텍스트 분석, 위키북스 - 이상엽 (2023). 파이썬 텍스트 마이닝 바이블 2: 딥러닝을 활용한 텍스트 분석, 위키북스 |
실습자료 |
강사가 제공하는 실습용 자료 (추후 공지) |
사용될 프로그램 |
파이썬 |
담당강사 정보 |
<학력/경력> - 학사: 연세대학교, 컴퓨터 과학과 - 석/박사: 미시간주립대학교, 미디어·정보 - 연세대학교 언론홍보영상학부 부교수
<주요 논문/저서> - 이상엽 (2023). 파이썬 텍스트 마이닝 바이블 1: 텍스트 전처리 및 머신러닝을 이용한 텍스트 분석, 위키북스 - 이상엽 (2023). 파이썬 텍스트 마이닝 바이블 2: 딥러닝을 활용한 텍스트 분석, 위키북스 |
유의사항 |
모든 강의는 실시간으로만 수강 가능하며, 다시보기는 제공되지 않습니다. |
2. 강의 계획
일시 | 강의 및 실습 내용 | |
1강 |
7월 1일(월) |
▪텍스트 분석 소개 ▪텍스트 전처리 ▪NLTK를 사용한 영어 텍스트 전처리 ▪Kiwi 형태소 분석기를 사용한 한글 텍스트 전처리 |
2강 |
7월 2일(화) |
▪빈도 분석 ▪텍스트 네트워크 분석 ▪문서의 벡터화 (단어 가방, TF-IDF 방법) |
3강 |
7월 3일(수) |
▪벡터 간 유사도 ▪문서 군집화 (K-Means, 위계적 군집 분석) ▪차원 축소 (PCA) 후 군집화 |
4강 |
7월 4일(목) |
▪문서 분류 (감성 분석) ▪지도학습 알고리즘의 작동 원리 |
5강 |
7월 5일(금) |
▪토픽 모델링 (LDA) ▪단어 임베딩 (Word2vec, FastText) |
1. 파이썬을 활용한 텍스트 마이닝 1강 [7/1, 월] -
2. 파이썬을 활용한 텍스트 마이닝 2강 [7/2, 화] -
3. 파이썬을 활용한 텍스트 마이닝 3강 [7/3, 수] -
4. 파이썬을 활용한 텍스트 마이닝 4강 [7/4, 목] -
5. 파이썬을 활용한 텍스트 마이닝 5강 [7/5, 금] -