닫기
과정 구분
과정 카테고리
태그
검색어

수강신청

온라인 데이터 수집 및 텍스트 마이닝 과정이미지
Zoom 온라인라벨
2026동계

온라인 데이터 수집 및 텍스트 마이닝

교육기간
2026.02.02 - 2026.02.09
교육시간
24시간
담당강사
이상엽 교수 (연세대 언론홍보영상학부)

수강료 250,000

수강료

학생할인 (증빙 후 적용)

총 결제금액

 

■ 담 당 : 이상엽 교수 (연세대학교 언론홍보영상학부)

■ 일 시 : 2026년 2월 2일 – 2월 9일 (월-월, 9:30~13:30) [6회 과정]

■ 수업방식 : ZOOM 실시간 온라인 강의

■ 수강신청 : [1차] 2025년 12월 18일(목) 오전 10시부터

 

 

1. 과정 개요

워크숍 목표

및 개요

파이썬을 이용한 온라인 데이터 수집 방법과 텍스트 분석 방법을 강의합니다.

참가 대상

온라인 데이터 수집과 텍스트 마이닝에 관심 있는 학부, 대학원생 및 일반 연구자 모두

선수 과목

기초적 파이썬 코딩 (파이썬 사전 설치 필수)

워크숍 운영방식

강의와 실습을 병행합니다.

교재

및 참고문헌

강사의 강의노트가 제공됩니다.

 

<참고문헌>

- 이상엽 (2023). 파이썬 텍스트 마이닝 바이블 1: 텍스트 전처리 및 머신러닝을 이용한 텍스트 분석, 위키북스

- 이상엽 (2023). 파이썬 텍스트 마이닝 바이블 2: 딥러닝을 활용한 텍스트 분석, 위키북스

실습자료

강사가 제공하는 실습용 자료 (추후 공지)

사용될 프로그램

파이썬

담당강사 정보

<학력/경력>

- 학사: 연세대학교, 컴퓨터 과학과

- 석/박사: 미시간주립대학교, 미디어·정보

- 연세대학교 언론홍보영상학부 교수

 

<주요 논문/저서>

- 이상엽 (2023). 파이썬 텍스트 마이닝 바이블 1: 텍스트 전처리 및 머신러닝을 이용한 텍스트 분석, 위키북스

- 이상엽 (2023). 파이썬 텍스트 마이닝 바이블 2: 딥러닝을 활용한 텍스트 분석, 위키북스

- 이상엽 (2024). AI를 이용한 사회과학 연구 방법, 커뮤니케이션북스

유의사항

모든 강의는 실시간으로만 수강 가능하며, 다시보기는 제공되지 않습니다.

 

2. 강의 계획

일시 강의 및 실습 내용

1강

2월 2일(월)

온라인 데이터 수집
▪requests / selenium
▪BeautifulSoup

2강

2월 3일(화)

▪텍스트 분석 소개
▪텍스트 전처리
▪NLTK를 사용한 영어 텍스트 전처리
▪Kiwi 형태소 분석기를 사용한 한글 텍스트 전처리

3강

2월 4일(수)

▪빈도 분석
▪텍스트 네트워크 분석
▪벡터에 대한 이해

4강

2월 5일(목)

▪문서의 벡터화 (단어 가방, TF-IDF 방법)
▪문서 군집화 
▪차원 축소 (PCA) 후 군집화

5강

2월 6일(금)

▪문서 분류 (감성 분석)
▪지도학습 알고리즘의 작동 원리

6강

2월 9일(월)

▪토픽 모델링 (LDA)

▪단어 임베딩 (Word2vec)

수강료 할인 안내

■ 수강료
- 일반 : 250,000원
- 학생 : 210,000원 [약 15% 할인]
- 서울대 대학원생 : 179,000원 [약 15% 추가할인]
※ 서울대 대학원생 추가할인은 서울대학교 "BK21 대학원 혁신사업"의 예산지원에 따른 것으로, 1인 1개 강좌만 적용가능합니다.

■ 할인 적용 방법 [학생 증빙 완료후 환급]
Step1. 일반 수강료를 납부하여 수강신청을 완료한다.
Step2. 학생 증빙서류(재학·재적·휴학·연구생 증명서)를 이메일로 제출한다. [kossda@snu.ac.kr]
Step3. 수강료 할인에 따른 차액을 환급받는다.

강의목차(총 6강)