1. 통계학의 정의
1) 통계학의 유용성
(1) 수량화된 자료를 이용한 대상의 특성 파악 ex) 그래프
(2) 자료에 근거한 추론
(3) 미래에 대한 합리적 의사결정
(4) 종류: 일기예보, 특정후보의 지역별지지도, 물가지수, 소득분포, 주가지수, 수요만족도 등
2) 모집단과 표본
(1) 모집단: 관심의 대상이 되는 모든 개체의 관측값이나 측정값의 집합
(2) 표본: 모집단의 부분집합
2. 통계학 구분
|
기술통계학 |
추측통계학 |
정의 |
자료 수집하고 그래프나 표를 사용해 정리하는 방법 연구 |
모집단에서 추출한 표본자료를 분석해 이를 기초로 모집단의 특성을 추론하는 절차와 관련 |
종류 |
합계, 평균, 분산, 표준편차, 상관계수, 자동차 매월 판매량, 수능점수분포 |
추정, 가설검정, 국민의 특정후보 지지율, 위암 발생률 |
3. 통계자료 분류
1) 숫자 표현 구분
|
질적 자료 (범주형 자료) |
양적 자료 |
숫자 표현 여부 |
X |
O |
예시 |
혈액형, 성별 |
몸무게 |
표현 방법 | 도수분포표, 막대그래프, 원형그래프 등 | 도수분포표, 히스토그램 |
* 도수분포표를 통한 양적 자료 정리방법
- 먼저 최대값과 최소값 찾기
- 계급수 설정 (일반적으로 6~10개)
- 계급수에 따른 계급구간 설정
- 계급간 중복 X & 명확
- 계급구간의 도수 세기
- 각 계급의 상대 도수 계산
2) 관찰 시점 구분
|
시계열 자료 |
횡단면 자료 |
정의 |
시간의 흐름에 따라 표현한 자료 |
특정 시점에서 공통의 성질을 볼 수 있는 자료 |
예시 |
일별 주가지수, 월별 소득자료 |
1988년 차종별 판매량 |
4. 기술통계: 평균 구하기(중심위치의 측정)
|
산술평균 |
가중평균 |
중앙값 |
최빈값 |
정의 |
(∑자료)/자료개수 |
∑(자료x가중치) /∑가중치 |
자료의 크기 순으로 나열할 때 가운데 자료의 값 |
가장 자주 나온 값 |
특성 |
- 단점: 상이점(극단치) - 두개 이상의 모집단 비교시 유용 - 각 자료의 편차의 합 = 0 |
- 상대적 중요도로 가중치 고려 |
- 자료가 홀수: (n+1)/2번째 값 - 자료가 짝수: n/2번째와 (n+1)/2번째 값의 평균값 - 극단치에 영향받지 않음 - 수학적 연산 불가 |
- 양적 자료, 질적 자료에 모두 적합 - 극단치에 영향받지 앟음 - 한 개 이상 존재할 수도 있고, 존재하지 않을 수도 있다. |
* 휴넷에서 경영학 학점인정제도를 통해 수강중인 강의 내용을 바탕으로 작성했습니다.