■ 담 당 : 최재성 교수 (성균관대학교 글로벌경제학과)
■ 일 시 : 2024년 7월 8일 - 7월 12일 (월-금, 14:00~18:00) [5회 과정]
■ 수업방식 : ZOOM 실시간 온라인 강의
■ 수강신청 : [2차] 2024년 6월 21일(금) 오전 10시부터
1. 과정 개요
워크숍 목표 및 개요 |
이 워크숍은 R을 사용해서 웹에서 데이터를 수집하고, 이렇게 수집된 다양한 형태의 데이터를 전처리 후 분석하는 능력을 갖추도록 돕는 것을 목표로 합니다. 아울러 Markdown을 사용해서 수집한 데이터를 분석한 결과가 수록된 문서 및 대시보드를 만들고, 웹에서 수집한 데이터를 활용한 사회과학 분야 최근 연구를 소개합니다. |
참가 대상 |
웹에서 자료를 수집하고 이를 활용하여 학술연구를 수행하고자 하는 학부, 대학원생 및 일반 연구자 |
선수 과목 |
기본적인 R 프로그램에 대한 이해 - R을 사용해서 기초통계 분석이 가능하고, 조건문, 반복문, 함수를 다룰 수 있어야 합니다. R 기초 사용법부터 시작하는 수업이 아니라서 이 부분에 대한 준비가 부족한 수강생은 수업 내용을 소화하기 어렵습니다. |
워크숍 운영방식 |
관련 배경과 함수 소개 및 사례 실습 |
교재 및 참고문헌 |
강사의 강의노트가 제공됩니다.
<참고문헌> - 김영우. 2017. Do it! 쉽게 배우는 R 데이터 분석. 이지스퍼블리싱 - 이현열. 2021. R을 이용한 퀀트 투자 포트폴리오 만들기. 제이펍 - Rafael A. Irizarry. 2021. Introduction to Data Science (웹에 공개됨) - Hadley Wickham & Garrett Grolemund. 2021. R for Data Science (웹에 공개됨) |
실습자료 |
강사가 제공하는 실습용 자료 (추후 공지) |
사용될 프로그램 |
R & R Studio (Windows10 환경에서 진행) |
담당강사 정보 |
<학력/경력> - 성균관대학교 글로벌경제학과 부교수 (2013~현재) - 경제학 박사. University of Pennsylvania. 2013. - 학술지 <경제학연구>, <노동경제논집>, <한국인구학> 편집위원 (현) - 한국노동경제학회 이사 (현)
<주요 논문/저서> - “Gendered trends and patterns of attitudes toward remarriage among the divorced in South Korea”, Population Research and Policy Review (2023) - “The effect of delaying school start time on adolescents’ time use and health: Evidence from a policy change in South Korea” Asian Population Studies (2021) - “Temporal change in early labor market outcomes of young college graduates in South Korea” The Annals of the American Academy of Political and Social Science (2020) - “Polarized embrace: South Korean media coverage of human rights, 1990-2016” Journal of Human Rights (2019) - “Do single-sex schools enhance students’ STEM (Science, Technology, Engineering, and Mathematics) outcomes?” Economics of Education Review (2018) - “Learning beyond the school walls: Trends and implications” Annual Review of Sociology (2016) - “학원정보 공공데이터를 활용한 서울시 사교육 공급에 관한 분석” <조사연구> (2016) |
유의사항 |
모든 강의는 실시간으로만 수강 가능하며, 다시보기는 제공되지 않습니다. |
2. 강의 계획
일시 | 강의 및 실습 내용 | |
1강 |
7월 8일 (월) |
▪빅데이터 시대의 사회과학 연구 – 웹데이터를 사용한 학술 연구 ▪웹스크래핑 기초 - 웹의 동작 방식 및 웹스크래핑을 위한 배경 지식 소개 - HTML 문법과 인코딩의 이해 |
2강 |
7월 9일 (화) |
▪웹에서 파일 반복 수집하기 ▪텍스트 자료 다루기 – 정규표현식(Regular expression) 기초 ▪웹스크래핑 사례 실습 : 논문 서지 정보, 신문 기사 |
3강 |
7월 10일 (수) |
▪XML과 JSON 데이터 다루기 ▪API를 이용한 데이터 수집과 분석 ▪분석 사례 : API를 이용한 지오코딩(위경도 좌표 변환)과 지도 시각화 |
4강 |
7월 11일 (목) |
▪Selenium을 활용한 웹스크래핑 ▪분석 사례 : Youtube 채널 최신 영상, Google Scholar 연구자 정보 |
5강 |
7월 12일 (금) |
▪R Markdown ▪분석 사례 : ‘맞춤형 레터’ 만들기 |
1. 웹데이터를 활용한 빅데이터 분석 1강 [7/8, 월] -
2. 웹데이터를 활용한 빅데이터 분석 2강 [7/9, 화] -
3. 웹데이터를 활용한 빅데이터 분석 3강 [7/10, 수] -
4. 웹데이터를 활용한 빅데이터 분석 4강 [7/11, 목] -
5. 웹데이터를 활용한 빅데이터 분석 5강 [7/12, 금] -