■ 담 당 : 김도형 교수 (Public Policy and Geospatial Information Sciences, Univ. of Texas at Dallas)
■ 일 시 : 2025년 2월 3일-2월 14일 (월/수/금, 14:00~18:00) [6회 과정]
■ 수업방식 : ZOOM 실시간 온라인 강의
■ 수강신청 : [1차] 2024년 12월 19일(목) 오전 10시부터
1. 과정 개요
워크숍 목표 및 개요 |
사회과학 분야에서도 빅데이터의 구축 및 활용의 중요성은 점차 증가하고 있고, 이러한 데이터를 전통적인 통계적 추론방식에서 벗어나 보다 효과적이고 창의적으로 분석하려는 시도가 증가하고 있으나 그 활용 가능성 및 한계에 대한 논의는 부족한 게 사실입니다. 본 강좌에서는 최근 과학 및 공학 분야에서 활발하게 개발되고 활용되고 있는 머신러닝기법이 사회과학 분야에서 구축된 빅데이터를 분석하는데 어떤 식으로 활용될지 파악하기 위한 이론적 기초를 다지고, 대표적인 지도학습, 비지도학습의 기본구조를 이해한 후, 간단한 실례를 R패키지를 이용하여 실습하는 데 주요 목표를 두고 있습니다. |
참가 대상 |
빅데이터 및 머신러닝기법을 이용한 자료분석이나 연구수행에 관심이 있는 사회과학 분야 학생 및 연구자 |
선수 과목 |
기초통계학 |
워크숍 운영방식 |
강사의 이론 강의와 조교의 실습 세션을 병행합니다. |
교재 및 참고문헌 |
강사의 강의노트가 제공됩니다.
<참고문헌> - James et al., An Introduction to Statistical Learning: with Applications in R, Springer, 2017. |
실습자료 |
추후 공지 |
사용될 프로그램 |
R, R Studio |
담당강사 정보 |
<학력/경력> - 연세대학교 행정학과 학사, 석사 - University of North Carolina at Chapel Hill 도시계획학 박사 - Duke University 박사후연구원 (2005-2008) - North Carolina Central University 행정학과 교수 (2008-2013) - University of Texas at Dallas 정책학/지리정보학 교수 (2013-현재)
<주요 논문/저서> - “Real-time counting of wheezing events from lung sounds using deep learning algorithms: implications for disease prediction and early intervention,” PLOS ONE, 18(11): e0294447, 2023. - "Ambient PM concentrations as a precursor of emergency visits for respiratory complaints: roles of deep learning and multi-point real-time monitoring", Sustainability, 14:2703, 2022. - “Exploring the roles of social media data to identify the locations and severity of road traffic accidents,” IEEE Artificial Intelligence & Knowledge Engineering 2021. - “Machine learning-based asthma risk prediction using IoT”, IEEE Access, 9:118708-118715. 2021. - “Demand-based emergency dispatch system: role of spatiotemporal machine learning” In Geospatial Technologies for Urban Health, edited by Lu Y. and Delmelle E., Basel, Switzerland: Springer International Publishing, pp.113-129. 2020. - “Food deserts reconsidered: using crowdsourced geographic information to measure healthy food accessibility”, Frontiers in Public Health, 8(71):1-6, 2020. - “Predicting asthma attacks: effects of indoor PM concentrations on peak expiratory flow rates of asthmatic children”, IEEE Access, 8:8791-8797, 2019. |
유의사항 |
모든 강의는 실시간으로만 수강 가능하며, 다시보기는 제공되지 않습니다. |
2. 강의 계획
일시 | 강의 및 실습 내용 | |
1강 |
2월 3일(월) |
▪ 강의 및 강사/조교 소개 ▪ 수강생들의 필요와 수준에 맞게 강의 내용 조정 ▪ 빅데이터의 구조 및 특성 이해 ▪ 왜 사회과학에서도 빅데이터가 중요한가? ▪ 머신러닝 개념 잡기: 통계분석과 머신러닝의 차이 ▪ 사회과학에서의 빅데이터 및 머신러닝 활용 사례 소개 ▪ R, R Studio 기초 및 데이터 세팅 실습 |
2강 |
2월 5일(수) |
▪ 머신러닝의 이론적 기반 ▪ 지도학습 vs. 비지도학습 ▪ 피쳐선택, 정규화, 과적합, 교차평가법, 성능평가 등 ▪ 지도학습 (1): K-근접이웃(KNN)을 이용한 분류학습 ▪ R을 이용한 머신러닝 세팅, KNN 분류 알고리즘 실습 |
3강 |
2월 7일(금) |
▪ 지도학습 (2): 결정트리, 랜덤포레스트, XGBoost를 이용한 분류학습 ▪ R을 이용한 결정트리, 랜덤포레스트, XGBoost 앙상블 알고리즘 실습 |
4강 |
2월 10일(월) |
▪ 지도학습 (3): 나이브베이즈를 이용한 분류학습 ▪ 지도학습 (4): 인공신경망(ANN)을 이용한 분류학습 ▪ R을 이용한 나이브베이즈, 인공신경망 분류 알고리즘 실습 |
5강 |
2월 12일(수) |
▪ 지도학습 (5): 서포트 벡터 머신(SVM)을 이용한 분류학습 ▪ 지도학습 (6): 로지스틱 회귀를 이용한 분류학습 ▪ R을 이용한 SVM 및 로지스틱 회귀 분류 알고리즘 실습 |
6강 |
2월 14일(금) |
▪ 지도학습 (7): 선형회귀 이용한 예측학습 ▪ 비지도학습 (1): K평균 군집 알고리즘을 이용한 군집학습 ▪ 비지도학습 (2): 주성분 분석(PCA)을 이용한 차원축소기법 ▪ R을 이용한 선형회귀 예측 알고리즘 및 K평균 군집 알고리즘 실습 ▪ 종합정리 및 평가 |