그룹화 된 데이터의 중앙 경향 측정
그 그룹화 된 데이터의 중심 경향 측정 그것들은 통계 자료에서 그들이 제공하는 데이터 그룹의 특정 행동을 묘사하는데 사용됩니다. 예를 들면, 그들이 가까이있는 것, 수집 된 데이터의 평균은 무엇입니까?.
대용량의 데이터를 가져올 때 더 나은 순서로 그룹화하여 중앙 경향의 특정 척도를 계산할 수 있습니다..
중심 경향의 척도 중 가장 많이 사용되는 것은 산술 평균, 중앙값 및 모드입니다. 이 숫자는 특정 실험에서 수집 된 데이터에 대한 특정 특성을 나타냅니다..
이러한 측정을 사용하려면 먼저 데이터 집합을 그룹화하는 방법을 알아야합니다..
그룹화 된 데이터
데이터를 먼저 그룹화하려면 가장 높은 값에서 가장 낮은 값을 뺀 데이터 범위를 계산해야합니다.
그런 다음 데이터를 그룹화 할 클래스 수인 "k"숫자를 선택하십시오.
그룹화 할 클래스의 진폭을 얻기 위해 "k"사이의 범위를 나누기 시작합니다. 이 숫자는 C = R / k입니다..
마지막으로 그룹화가 시작됩니다. 그룹화는 획득 된 데이터의 최소값보다 작은 수가 선택됩니다..
이 숫자는 첫 번째 클래스의 하한값입니다. 이것에 C를 더한다. 얻은 값은 첫 번째 클래스의 상한이 될 것이다..
그런 다음이 값에 C를 더하고 두 번째 클래스의 상한을 구합니다. 이 방법으로 마지막 클래스의 상한을 얻을 때까지 계속 진행합니다..
데이터가 그룹화 된 후에는 평균, 중앙값 및 패션을 계산할 수 있습니다.
산술 평균, 중앙값 및 모드를 계산하는 방법을 설명하기 위해 예제를 진행합니다.
예제
따라서 데이터를 그룹화 할 때 다음과 같은 표가 생성됩니다.
3 대 중심 경향 측정
이제 산술 평균, 중앙값 및 모드를 계산합니다. 위의 예는이 절차를 설명하기 위해 사용됩니다..
1- 산술 평균
산술 평균은 각 주파수에 간격의 평균을 곱하는 것으로 구성됩니다. 그런 다음이 모든 결과가 추가되고 마지막으로 전체 데이터로 나뉩니다.
앞의 예제를 사용하면 산술 평균이 다음과 같습니다.
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111
이것은 테이블에있는 데이터의 평균값이 5.11111임을 나타냅니다..
2- 중
데이터 세트의 중앙값을 계산하려면 먼저 모든 데이터가 최소에서 최대로 정렬됩니다. 두 가지 경우를 제시 할 수 있습니다.
- 데이터 번호가 홀수 인 경우 중앙값은 중앙에있는 데이터입니다.
- 데이터 번호가 짝수이면 중앙값은 센터에 남아있는 두 데이터의 평균입니다.
그룹화 된 데이터의 경우 중앙값 계산은 다음과 같은 방식으로 수행됩니다.
- N / 2가 계산됩니다. 여기서 N은 총 데이터입니다..
- 누적 된 주파수 (주파수의 합)가 N / 2보다 큰 첫 번째 간격이 검색되고이 간격의 하한 인 Li가 선택됩니다..
중앙값은 다음 공식으로 표시됩니다.
Me = Li + (Ls-Li) * (N / 2 - Li 전의 누적 주파수) / [Li, Ls의 주파수]
Ls는 상기 범위의 상한값.
위의 데이터 표를 사용하면 N / 2 = 18 / 2 = 9가됩니다. 누적 된 빈도는 4, 8, 14 및 18입니다 (표의 각 행마다 하나씩).
따라서 누적 주파수가 N / 2 = 9보다 크기 때문에 제 3 간격을 선택해야합니다.
따라서 Li = 5 및 Ls = 7. 위에서 설명한 수식을 적용하면 다음을 수행해야합니다.
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- 패션
패션은 모든 그룹화 된 데이터 중에서 가장 빈도가 높은 값입니다. 즉, 초기 데이터 세트에서 대부분 반복되는 값입니다.
매우 많은 양의 데이터를 가지고있을 때 다음 공식을 사용하여 그룹화 된 데이터의 모드를 계산합니다.
(Li - L (i-1)의 주파수) + (Li - L (i-1)의 주파수) i + 1)))
간격 [Li, Ls]은 가장 높은 빈도가있는 간격입니다. 이 기사에서 작성된 예제의 경우 해당 패션은 다음과 같이 표시됩니다.
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
근사값을 구하는 데 사용되는 다른 수식은 다음과 같습니다.
Mo = Li + (Ls-Li) * (주파수 L (i + 1)) / (주파수 L (i-1) + 주파수 L (i + 1)).
이 수식을 사용하면 계정은 다음과 같습니다.
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
참고 문헌
- Bellhouse, D. R. (2011). 아브라함 드 모이 브레 (Abraham De Moivre) : 고전적 확률과 그 적용을위한 무대 설정. CRC 프레스.
- Cifuentes, J. F. (2002). 확률 이론 소개. 국립 콜롬비아 대학.
- Daston, L. (1995). 계몽주의의 고전적 확률. 프린스턴 대학 출판부.
- Larson, H.J. (1978). 확률 이론 및 통계적 추론 소개. 편집 리누사.
- Martel, P. J., & Vegas, F. J. (1996). 확률 및 수학 통계 : 임상 실습 및 건강 관리 응용. 에디 시옹 디아스 데 산토스.
- Vázquez, A. L., & Ortiz, F. J. (2005). 변동성을 측정, 기술 및 통제하기위한 통계적 방법. 칸타 브리아 대학.
- 바스케즈, S. G. (2009). 대학 입학을위한 수학 안내서. Ramon Areces SA 연구 센터 편집장.