닫기
과정 구분
과정 카테고리
태그
검색어

데이터처리 및 분석방법

웹데이터를 활용한 빅데이터 분석 과정이미지
Zoom 온라인라벨
2024하계

웹데이터를 활용한 빅데이터 분석

교육기간
2024.07.08 - 2024.07.12
교육시간
20시간
담당강사
최재성 교수 (성균관대 글로벌경제학과)

수강료 210,000

수강료

학생할인 (증빙 후 적용)

총 결제금액

 

■ 담 당 : 최재성 교수 (성균관대학교 글로벌경제학과)

■ 일 시 : 2024년 7월 8일 - 7월 12일 (월-금, 14:00~18:00) [5회 과정]

■ 수업방식 : ZOOM 실시간 온라인 강의

■ 수강신청 : [2차] 2024년 6월 21일(금) 오전 10시부터

 

 

1. 과정 개요

워크숍 목표

및 개요

이 워크숍은 R을 사용해서 웹에서 데이터를 수집하고, 이렇게 수집된 다양한 형태의 데이터를 전처리 후 분석하는 능력을 갖추도록 돕는 것을 목표로 합니다. 아울러 Markdown을 사용해서 수집한 데이터를 분석한 결과가 수록된 문서 및 대시보드를 만들고, 웹에서 수집한 데이터를 활용한 사회과학 분야 최근 연구를 소개합니다.

참가 대상

웹에서 자료를 수집하고 이를 활용하여 학술연구를 수행하고자 하는 학부, 대학원생 및 일반 연구자

선수 과목

기본적인 R 프로그램에 대한 이해

- R을 사용해서 기초통계 분석이 가능하고, 조건문, 반복문, 함수를 다룰 수 있어야 합니다. R 기초 사용법부터 시작하는 수업이 아니라서 이 부분에 대한 준비가 부족한 수강생은 수업 내용을 소화하기 어렵습니다.

워크숍 운영방식

관련 배경과 함수 소개 및 사례 실습

교재

및 참고문헌

강사의 강의노트가 제공됩니다.

 

<참고문헌>

- 김영우. 2017. Do it! 쉽게 배우는 R 데이터 분석. 이지스퍼블리싱

- 이현열. 2021. R을 이용한 퀀트 투자 포트폴리오 만들기. 제이펍

- Rafael A. Irizarry. 2021. Introduction to Data Science (웹에 공개됨)

- Hadley Wickham & Garrett Grolemund. 2021. R for Data Science (웹에 공개됨)

실습자료

강사가 제공하는 실습용 자료 (추후 공지)

사용될 프로그램

R & R Studio (Windows10 환경에서 진행)

담당강사 정보

<학력/경력>

- 성균관대학교 글로벌경제학과 부교수 (2013~현재)

- 경제학 박사. University of Pennsylvania. 2013.

- 학술지 <경제학연구>, <노동경제논집>, <한국인구학> 편집위원 (현)

- 한국노동경제학회 이사 (현)

 

<주요 논문/저서>

- “Gendered trends and patterns of attitudes toward remarriage among the divorced in South Korea”, Population Research and Policy Review (2023)

- “The effect of delaying school start time on adolescents’ time use and health: Evidence from a policy change in South Korea” Asian Population Studies (2021)

- “Temporal change in early labor market outcomes of young college graduates in South Korea” The Annals of the American Academy of Political and Social Science (2020)

- “Polarized embrace: South Korean media coverage of human rights, 1990-2016” Journal of Human Rights (2019)

- “Do single-sex schools enhance students’ STEM (Science, Technology, Engineering, and Mathematics) outcomes?” Economics of Education Review (2018)

- “Learning beyond the school walls: Trends and implications” Annual Review of Sociology (2016)

- “학원정보 공공데이터를 활용한 서울시 사교육 공급에 관한 분석” <조사연구> (2016)

유의사항

모든 강의는 실시간으로만 수강 가능하며, 다시보기는 제공되지 않습니다.

 

2. 강의 계획

일시 강의 및 실습 내용

1강

7월 8일 (월)

▪빅데이터 시대의 사회과학 연구 – 웹데이터를 사용한 학술 연구

▪웹스크래핑 기초

   - 웹의 동작 방식 및 웹스크래핑을 위한 배경 지식 소개

   - HTML 문법과 인코딩의 이해
   - rvest 패키지를 사용한 간단한 사례 실습

2강

7월 9일 (화)

▪웹에서 파일 반복 수집하기

▪텍스트 자료 다루기 – 정규표현식(Regular expression) 기초

▪웹스크래핑 사례 실습 : 논문 서지 정보, 신문 기사

3강

7월 10일 (수)

▪XML과 JSON 데이터 다루기

▪API를 이용한 데이터 수집과 분석
   - Naver 검색 API (뉴스, 블로그 등)
   - 공공데이터 포털 API (부동산 실거래가, 대기질 정보 등)

▪분석 사례 : API를 이용한 지오코딩(위경도 좌표 변환)과 지도 시각화

4강

7월 11일 (목)

▪Selenium을 활용한 웹스크래핑

▪분석 사례 : Youtube 채널 최신 영상, Google Scholar 연구자 정보

5강

7월 12일 (금)

▪R Markdown
   - 분석 결과가 담긴 보고서 생성하기
   - Dashboard 만들기

▪분석 사례 : ‘맞춤형 레터’ 만들기

수강료 할인 안내

■ 수강료
- 일반 : 210,000원
- 학생 : 180,000원 [약 15% 할인]
- 서울대 대학원생 : 153,000원 [약 15% 추가할인]
※ 서울대 대학원생 추가할인은 서울대학교 "BK21 대학원 혁신사업"의 예산지원에 따른 것으로, 1인 1개 강좌만 적용가능합니다.

■ 할인 적용 방법 [학생 증빙 완료후 환급]
Step1. 일반 수강료를 납부하여 수강신청을 완료한다.
Step2. 학생 증빙서류(재학·재적·휴학·연구생 증명서)를 이메일로 제출한다. [kossda@snu.ac.kr]
Step3. 수강료 할인에 따른 차액을 환급받는다.

강의목차(총 5강)

1. 웹데이터를 활용한 빅데이터 분석 1강 [7/8, 월] -

2. 웹데이터를 활용한 빅데이터 분석 2강 [7/9, 화] -

3. 웹데이터를 활용한 빅데이터 분석 3강 [7/10, 수] -

4. 웹데이터를 활용한 빅데이터 분석 4강 [7/11, 목] -

5. 웹데이터를 활용한 빅데이터 분석 5강 [7/12, 금] -