■ 담 당 : 박종희 교수 (서울대학교 정치외교학부)
■ 일 시 : 2025년 7월 21일 – 7월 25일 (월-금, 9:30~13:30) [5회 과정]
■ 수업방식 : ZOOM 실시간 온라인 강의
■ 수강신청 : [2차] 2025년 6월 25일(수) 오전 10시부터
1. 과정 개요
워크숍 목표 및 개요 |
이 워크숍은 R을 사용해서 다양한 빅데이터 자료를 분석하는 방법을 연습하는 것을 목적으로 한다. 수업에서는 빅데이터 분석의 기초에 해당되는 자료수집, 전처리, 시각화, 통계분석을 다룬다. 웹 자료, 텍스트 자료, 네트워크 자료를 중심으로 수업이 진행되며 이론과 실습으로 나눠서 진행한다. |
참가 대상 |
빅데이터를 이용한 학술연구를 계획하는 학부, 대학원생, 일반 연구자 |
선수 과목 |
R을 기초수준 이상으로 활용할 수 있는 능력과 회귀분석에 대한 통계적 이해 |
워크숍 운영방식 |
코딩 방법에 대한 강의와 해설 |
교재 및 참고문헌 |
강의노트
<참고문헌> |
실습자료 |
수업에서 배포 |
사용될 프로그램 |
R 또는 R Studio |
담당강사 정보 |
<학력/경력> - 서울대학교 정치외교학부 교수 (2012 ~ 현재) - 서울대학교 국제정치자료센터장 (2018 ~ 현재) - 시카고대학교 정치학과 조교수 (2007 ~ 2012) - 미시간대학교 ICPSR, Summer Program in Quantitative Methods of Social Research 베이지안 방법론 강사 (2008 ~ 2012) - Washington University in St. Louis. 정치학 박사. 2007.
<주요 논문/저서> - Sooahn Shin, Johan Lim, and Jong Hee Park. 2024. “l1-based Multidimensional Ideal Point Estimation for Identifying Political Cleavages” Journal of the American Statistical Association. - Sung Eun Kim, Jong Hee Park, Inbok Rhee, and Joonseok Yang. 2023. “Target, Information, and Trade Preferences: Evidence from a Survey Experiment in East Asia” American Journal of Political. Science. Vol. 67, No. 4. pp. 898-914. - Jong Hee Park and Soichiro Yamauchi. 2023. “Change-point Detection and Regularization in Time Series Cross Sectional Data Analysis” Political Analysis. Vol. 31, No. 2. pp.257-277. |
유의사항 |
- 모든 강의는 실시간으로만 수강 가능하며, 다시보기는 제공되지 않습니다. |
2. 강의 계획
일시 | 강의 및 실습 내용 | |
1강 |
7월 21일(월) |
빅데이터 분석 기초 ▪빅데이터의 개념과 특징 ▪데이터 분석 파이프라인 구축 ▪R을 활용한 빅데이터 처리 방법 ▪효율적인 데이터 로딩 및 요약 기법 |
2강 |
7월 22일(화) |
회귀분석과 머신러닝 ▪선형회귀의 기본 원리와 적용 ▪분류를 위한 로지스틱 회귀 ▪정규화 기법(릿지, 라쏘 회귀) ▪의사결정나무와 랜덤포레스트 |
3강 |
7월 23일(수) |
텍스트 마이닝 ▪정규화 표현식의 기본 |
4강 |
7월 24일(목) |
네트워크 분석 ▪그래프 이론의 기본 개념 |
5강 |
7월 25일(금) |
웹 스크래핑 ▪웹 스크래핑의 기본 개념과 HTML 구조 이해 |