데이터과학
데이터과학Data Science은 형식과학의 한 갈래로써 데이터를 수집하고 가공하며 저장하고 분석하고 표현하는 기법의 일체를 말한다. 이 카테고리에서는 학부 1~2학년 개론 수준의 기초통계학과 시각화에 대해 다룬다.
통계학 개론
- 통계학의 정의
- 모수와 통계량
- 🔒(24/07/05) 초모수, 하이퍼 파라미터란?
- 통계학에서 자유도란?
데이터
- 데이터의 정의와 어원
- 질적변수와 양적변수
- 🔒(24/03/15) 독립변수와 종속변수
중심성과 산포도
- 평균 $\overline{x}$
- 중앙값 $m$
- 최빈값
- 분산 $s^{2}$
- z-스코어와 표준화
- 🔒(24/07/21) 정규화
- 백분위수와 이상치
평가
- 🔒(24/03/19) 분류문제와 회귀문제의 정의
- 교차검증
- 적합치, 예측치, 잔차, 오차
분류문제
- 오류행렬과 민감도, 특이도
- 🔒(24/03/25) 정확도가 과대평가 되는 상황
- ROC 곡선
- 🔒(24/04/06) $F_{1}$ 스코어
시각화
엑셀
주요 참고문헌
- Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition)
- 경북대학교 통계학과. (2008). 엑셀을 이용한 통계학
전체 포스트
- 상자 그림이란?
- 데이터과학에서 차원축소란?
- 히트맵이란?
- 덴드로그램이란?
- 엑셀에서 히스토그램 그리는 방법
- 데이터의 정의와 어원
- 질적변수와 연속변수
- 통계학에서의 척도: 명목, 순서, 구간, 비율
- 통계학의 정의
- 질적자료의 도수
- 양적자료의 계급
- 질적 데이터의 막대 그래프
- 양적 데이터의 히스토그램
- 시계열 데이터의 꺾은 선 그래프
- 다변량 데이터의 점도표
- 기초통계학에서 평균의 정의
- 기초통계학에서의 모수와 통계량
- 기초통계학에서 중앙값의 정의
- 기초통계학에서 최빈값의 정의
- 기초통계학에서 분산의 정의
- z-스코어와 표준화
- 백분위수와 이상치
- 엑셀에서 지도 모양으로 그림 그리는 방법
- 통계학에서의 자유도
댓글