닫기
과정 구분
과정 카테고리
태그
검색어

수강신청

사회과학자를 위한 빅데이터 및 머신러닝 기초 과정이미지
Zoom 온라인라벨
2025동계

사회과학자를 위한 빅데이터 및 머신러닝 기초

교육기간
2025.02.03 - 2025.02.14
교육시간
24시간
담당강사
김도형 교수 (Univ. of Texas at Dallas)

수강료 250,000

수강료

학생할인 (증빙 후 적용)

총 결제금액

 

■ 담 당 : 김도형 교수 (Public Policy and Geospatial Information Sciences, Univ. of Texas at Dallas)

■ 일 시 : 2025년 2월 3일-2월 14일 (월/수/금, 14:00~18:00) [6회 과정]

■ 수업방식 : ZOOM 실시간 온라인 강의

■ 수강신청 : [1차] 2024년 12월 19일(목) 오전 10시부터

 

 

1. 과정 개요

워크숍 목표

및 개요

사회과학 분야에서도 빅데이터의 구축 및 활용의 중요성은 점차 증가하고 있고, 이러한 데이터를 전통적인 통계적 추론방식에서 벗어나 보다 효과적이고 창의적으로 분석하려는 시도가 증가하고 있으나 그 활용 가능성 및 한계에 대한 논의는 부족한 게 사실입니다. 본 강좌에서는 최근 과학 및 공학 분야에서 활발하게 개발되고 활용되고 있는 머신러닝기법이 사회과학 분야에서 구축된 빅데이터를 분석하는데 어떤 식으로 활용될지 파악하기 위한 이론적 기초를 다지고, 대표적인 지도학습, 비지도학습의 기본구조를 이해한 후, 간단한 실례를 R패키지를 이용하여 실습하는 데 주요 목표를 두고 있습니다.

참가 대상

빅데이터 및 머신러닝기법을 이용한 자료분석이나 연구수행에 관심이 있는 사회과학 분야 학생 및 연구자

선수 과목

기초통계학

워크숍 운영방식

강사의 이론 강의와 조교의 실습 세션을 병행합니다.

교재

및 참고문헌

강사의 강의노트가 제공됩니다.

 

<참고문헌>

- James et al., An Introduction to Statistical Learning: with Applications in R, Springer, 2017.

실습자료

추후 공지

사용될 프로그램

R, R Studio

담당강사 정보

<학력/경력>

- 연세대학교 행정학과 학사, 석사

- University of North Carolina at Chapel Hill 도시계획학 박사

- Duke University 박사후연구원 (2005-2008)

- North Carolina Central University 행정학과 교수 (2008-2013)

- University of Texas at Dallas 정책학/지리정보학 교수 (2013-현재)

 

<주요 논문/저서>

- “Real-time counting of wheezing events from lung sounds using deep learning algorithms: implications for disease prediction and early intervention,” PLOS ONE, 18(11): e0294447, 2023.

- "Ambient PM concentrations as a precursor of emergency visits for respiratory complaints: roles of deep learning and multi-point real-time monitoring", Sustainability, 14:2703, 2022.

- “Exploring the roles of social media data to identify the locations and severity of road traffic accidents,” IEEE Artificial Intelligence & Knowledge Engineering 2021.

- “Machine learning-based asthma risk prediction using IoT”, IEEE Access, 9:118708-118715. 2021.

- “Demand-based emergency dispatch system: role of spatiotemporal machine learning” In Geospatial Technologies for Urban Health, edited by Lu Y. and Delmelle E., Basel, Switzerland: Springer International Publishing, pp.113-129. 2020.

- “Food deserts reconsidered: using crowdsourced geographic information to measure healthy food accessibility”, Frontiers in Public Health, 8(71):1-6, 2020.

- “Predicting asthma attacks: effects of indoor PM concentrations on peak expiratory flow rates of asthmatic children”, IEEE Access, 8:8791-8797, 2019.

유의사항

모든 강의는 실시간으로만 수강 가능하며, 다시보기는 제공되지 않습니다.

 

2. 강의 계획

일시 강의 및 실습 내용

1강

2월 3일(월)

▪ 강의 및 강사/조교 소개

▪ 수강생들의 필요와 수준에 맞게 강의 내용 조정

▪ 빅데이터의 구조 및 특성 이해

▪ 왜 사회과학에서도 빅데이터가 중요한가?

▪ 머신러닝 개념 잡기: 통계분석과 머신러닝의 차이

▪ 사회과학에서의 빅데이터 및 머신러닝 활용 사례 소개

▪ R, R Studio 기초 및 데이터 세팅 실습

2강

2월 5일(수)

▪ 머신러닝의 이론적 기반

▪ 지도학습 vs. 비지도학습

▪ 피쳐선택, 정규화, 과적합, 교차평가법, 성능평가 등

▪ 지도학습 (1): K-근접이웃(KNN)을 이용한 분류학습

▪ R을 이용한 머신러닝 세팅, KNN 분류 알고리즘 실습

3강

2월 7일(금)

▪ 지도학습 (2): 결정트리, 랜덤포레스트, XGBoost를 이용한 분류학습

▪ R을 이용한 결정트리, 랜덤포레스트, XGBoost 앙상블 알고리즘 실습

4강

2월 10일(월)

▪ 지도학습 (3): 나이브베이즈를 이용한 분류학습

▪ 지도학습 (4): 인공신경망(ANN)을 이용한 분류학습

▪ R을 이용한 나이브베이즈, 인공신경망 분류 알고리즘 실습

5강

2월 12일(수)

▪ 지도학습 (5): 서포트 벡터 머신(SVM)을 이용한 분류학습

▪ 지도학습 (6): 로지스틱 회귀를 이용한 분류학습

▪ R을 이용한 SVM 및 로지스틱 회귀 분류 알고리즘 실습

6강

2월 14일(금)

▪ 지도학습 (7): 선형회귀 이용한 예측학습

▪ 비지도학습 (1): K평균 군집 알고리즘을 이용한 군집학습

▪ 비지도학습 (2): 주성분 분석(PCA)을 이용한 차원축소기법

▪ R을 이용한 선형회귀 예측 알고리즘 및 K평균 군집 알고리즘 실습

▪ 종합정리 및 평가

수강료 할인 안내

■ 수강료
- 일반 : 250,000원
- 학생 : 210,000원 [약 15% 할인]
- 서울대 대학원생 : 179,000원 [약 15% 추가할인]
※ 서울대 대학원생 추가할인은 서울대학교 "BK21 대학원 혁신사업"의 예산지원에 따른 것으로, 1인 1개 강좌만 적용가능합니다.

■ 할인 적용 방법 [학생 증빙 완료후 환급]
Step1. 일반 수강료를 납부하여 수강신청을 완료한다.
Step2. 학생 증빙서류(재학·재적·휴학·연구생 증명서)를 이메일로 제출한다. [kossda@snu.ac.kr]
Step3. 수강료 할인에 따른 차액을 환급받는다.