닫기
과정 구분
과정 카테고리
태그
검색어

수강신청

R을 이용한 빅데이터분석 과정이미지
Zoom 온라인라벨
2025하계

R을 이용한 빅데이터분석

교육기간
2025.07.21 - 2025.07.25
교육시간
20시간
담당강사
박종희 교수 (서울대 정치외교학부)

수강료 210,000

수강료

학생할인 (증빙 후 적용)

총 결제금액

 

■ 담 당 : 박종희 교수 (서울대학교 정치외교학부)

■ 일 시 : 2025년 7월 21일 – 7월 25일 (월-금, 9:30~13:30) [5회 과정]

■ 수업방식 : ZOOM 실시간 온라인 강의

■ 수강신청 : [2차] 2025년 6월 25일(수) 오전 10시부터

 

 

1. 과정 개요

워크숍 목표

및 개요

이 워크숍은 R을 사용해서 다양한 빅데이터 자료를 분석하는 방법을 연습하는 것을 목적으로 한다. 수업에서는 빅데이터 분석의 기초에 해당되는 자료수집, 전처리, 시각화, 통계분석을 다룬다. 웹 자료, 텍스트 자료, 네트워크 자료를 중심으로 수업이 진행되며 이론과 실습으로 나눠서 진행한다.

참가 대상

빅데이터를 이용한 학술연구를 계획하는 학부, 대학원생, 일반 연구자

선수 과목

R을 기초수준 이상으로 활용할 수 있는 능력과 회귀분석에 대한 통계적 이해

워크숍 운영방식

코딩 방법에 대한 강의와 해설

교재

및 참고문헌

강의노트

 

<참고문헌> 
 - 박종희. 2020. 사회과학자를 위한 데이터 과학. 사회평론 아카데미
 - 김영우. 2017. Do it! 쉽게 배우는 R 데이터 분석. 이지스퍼블리싱
 - Rafael A. Irizarry. 2021. Introduction to Data Science (웹에 공개됨)
 - Hadley Wickham & Garrett Grolemund. 2021. R for Data Science (웹에 공개됨)

실습자료

수업에서 배포

사용될 프로그램

R 또는 R Studio

담당강사 정보

<학력/경력>

- 서울대학교 정치외교학부 교수 (2012 ~ 현재)

- 서울대학교 국제정치자료센터장 (2018 ~ 현재)

- 시카고대학교 정치학과 조교수 (2007 ~ 2012)

- 미시간대학교 ICPSR, Summer Program in Quantitative Methods of Social Research 베이지안 방법론 강사 (2008 ~ 2012)

- Washington University in St. Louis. 정치학 박사. 2007.

 

<주요 논문/저서>

- Sooahn Shin, Johan Lim, and Jong Hee Park. 2024. “l1-based Multidimensional Ideal Point Estimation for Identifying Political Cleavages” Journal of the American Statistical Association.

- Sung Eun Kim, Jong Hee Park, Inbok Rhee, and Joonseok Yang. 2023. “Target, Information, and Trade Preferences: Evidence from a Survey Experiment in East Asia” American Journal of Political. Science. Vol. 67, No. 4. pp. 898-914.

- Jong Hee Park and Soichiro Yamauchi. 2023. “Change-point Detection and Regularization in Time Series Cross Sectional Data Analysis” Political Analysis. Vol. 31, No. 2. pp.257-277.

유의사항

- 모든 강의는 실시간으로만 수강 가능하며, 다시보기는 제공되지 않습니다.

 

2. 강의 계획

일시 강의 및 실습 내용

1강

7월 21일(월)

빅데이터 분석 기초

▪빅데이터의 개념과 특징

▪데이터 분석 파이프라인 구축

▪R을 활용한 빅데이터 처리 방법

▪효율적인 데이터 로딩 및 요약 기법

2강

7월 22일(화)

회귀분석과 머신러닝

▪선형회귀의 기본 원리와 적용

▪분류를 위한 로지스틱 회귀

▪정규화 기법(릿지, 라쏘 회귀)

▪의사결정나무와 랜덤포레스트
▪모델 평가 및 선택 방법

3강

7월 23일(수)

텍스트 마이닝

▪정규화 표현식의 기본
▪텍스트 데이터의 수치화 방법

▪quanteda 패키지를 활용한 텍스트 전처리
▪토픽 모델링과 stm 패키지 활용
▪고급 텍스트 분석 기법

4강

7월 24일(목)

네트워크 분석

그래프 이론의 기본 개념
▪네트워크 측정 지표들
▪igraph 패키지를 활용한 네트워크 분석 및 시각화
▪네트워크 분석의 실제 적용 사례

5강

7월 25일(금)

웹 스크래핑

웹 스크래핑의 기본 개념과 HTML 구조 이해
▪정적 웹페이지에서 텍스트 데이터 추출
▪테이블 형태 데이터 스크래핑
▪동적 웹페이지 처리를 위한 RSelenium 소개

학습목표

■ 수강료
- 일반 : 210,000원
- 학생 : 180,000원 [약 15% 할인]
- 서울대 대학원생 : 153,000원 [약 15% 추가할인]
※ 서울대 대학원생 추가할인은 서울대학교 "BK21 대학원 혁신사업"의 예산지원에 따른 것으로, 1인 1개 강좌만 적용가능합니다.

■ 할인 적용 방법 [학생 증빙 완료후 환급]
Step1. 일반 수강료를 납부하여 수강신청을 완료한다.
Step2. 학생 증빙서류(재학·재적·휴학·연구생 증명서)를 이메일로 제출한다. [kossda@snu.ac.kr]
Step3. 수강료 할인에 따른 차액을 환급받는다.

강의목차(총 5강)