그룹화 된 데이터의 중앙 경향 측정



그룹화 된 데이터의 중심 경향 측정 그것들은 통계 자료에서 그들이 제공하는 데이터 그룹의 특정 행동을 묘사하는데 사용됩니다. 예를 들면, 그들이 가까이있는 것, 수집 된 데이터의 평균은 무엇입니까?.

대용량의 데이터를 가져올 때 더 나은 순서로 그룹화하여 중앙 경향의 특정 척도를 계산할 수 있습니다..

중심 경향의 척도 중 가장 많이 사용되는 것은 산술 평균, 중앙값 및 모드입니다. 이 숫자는 특정 실험에서 수집 된 데이터에 대한 특정 특성을 나타냅니다..

이러한 측정을 사용하려면 먼저 데이터 집합을 그룹화하는 방법을 알아야합니다..

그룹화 된 데이터

데이터를 먼저 그룹화하려면 가장 높은 값에서 가장 낮은 값을 뺀 데이터 범위를 계산해야합니다.

그런 다음 데이터를 그룹화 할 클래스 수인 "k"숫자를 선택하십시오.

그룹화 할 클래스의 진폭을 얻기 위해 "k"사이의 범위를 나누기 시작합니다. 이 숫자는 C = R / k입니다..

마지막으로 그룹화가 시작됩니다. 그룹화는 획득 된 데이터의 최소값보다 작은 수가 선택됩니다..

이 숫자는 첫 번째 클래스의 하한값입니다. 이것에 C를 더한다. 얻은 값은 첫 번째 클래스의 상한이 될 것이다..

그런 다음이 값에 C를 더하고 두 번째 클래스의 상한을 구합니다. 이 방법으로 마지막 클래스의 상한을 얻을 때까지 계속 진행합니다..

데이터가 그룹화 된 후에는 평균, 중앙값 및 패션을 계산할 수 있습니다.

산술 평균, 중앙값 및 모드를 계산하는 방법을 설명하기 위해 예제를 진행합니다.

예제

따라서 데이터를 그룹화 할 때 다음과 같은 표가 생성됩니다.

3 대 중심 경향 측정

이제 산술 평균, 중앙값 및 모드를 계산합니다. 위의 예는이 절차를 설명하기 위해 사용됩니다..

1- 산술 평균

산술 평균은 각 주파수에 간격의 평균을 곱하는 것으로 구성됩니다. 그런 다음이 모든 결과가 추가되고 마지막으로 전체 데이터로 나뉩니다.

앞의 예제를 사용하면 산술 평균이 다음과 같습니다.

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111

이것은 테이블에있는 데이터의 평균값이 5.11111임을 나타냅니다..

2- 중

데이터 세트의 중앙값을 계산하려면 먼저 모든 데이터가 최소에서 최대로 정렬됩니다. 두 가지 경우를 제시 할 수 있습니다.

- 데이터 번호가 홀수 인 경우 중앙값은 중앙에있는 데이터입니다.

- 데이터 번호가 짝수이면 중앙값은 센터에 남아있는 두 데이터의 평균입니다.

그룹화 된 데이터의 경우 중앙값 계산은 다음과 같은 방식으로 수행됩니다.

- N / 2가 계산됩니다. 여기서 N은 총 데이터입니다..

- 누적 된 주파수 (주파수의 합)가 N / 2보다 큰 첫 번째 간격이 검색되고이 간격의 하한 인 Li가 선택됩니다..

중앙값은 다음 공식으로 표시됩니다.

Me = Li + (Ls-Li) * (N / 2 - Li 전의 누적 주파수) / [Li, Ls의 주파수]

Ls는 상기 범위의 상한값.

위의 데이터 표를 사용하면 N / 2 = 18 / 2 = 9가됩니다. 누적 된 빈도는 4, 8, 14 및 18입니다 (표의 각 행마다 하나씩).

따라서 누적 주파수가 N / 2 = 9보다 크기 때문에 제 3 간격을 선택해야합니다.

따라서 Li = 5 및 Ls = 7. 위에서 설명한 수식을 적용하면 다음을 수행해야합니다.

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.

3- 패션

패션은 모든 그룹화 된 데이터 중에서 가장 빈도가 높은 값입니다. 즉, 초기 데이터 세트에서 대부분 반복되는 값입니다.

매우 많은 양의 데이터를 가지고있을 때 다음 공식을 사용하여 그룹화 된 데이터의 모드를 계산합니다.

(Li - L (i-1)의 주파수) + (Li - L (i-1)의 주파수) i + 1)))

간격 [Li, Ls]은 가장 높은 빈도가있는 간격입니다. 이 기사에서 작성된 예제의 경우 해당 패션은 다음과 같이 표시됩니다.

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

근사값을 구하는 데 사용되는 다른 수식은 다음과 같습니다.

Mo = Li + (Ls-Li) * (주파수 L (i + 1)) / (주파수 L (i-1) + 주파수 L (i + 1)).

이 수식을 사용하면 계정은 다음과 같습니다.

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

참고 문헌

  1. Bellhouse, D. R. (2011). 아브라함 드 모이 브레 (Abraham De Moivre) : 고전적 확률과 그 적용을위한 무대 설정. CRC 프레스.
  2. Cifuentes, J. F. (2002). 확률 이론 소개. 국립 콜롬비아 대학.
  3. Daston, L. (1995). 계몽주의의 고전적 확률. 프린스턴 대학 출판부.
  4. Larson, H.J. (1978). 확률 이론 및 통계적 추론 소개. 편집 리누사.
  5. Martel, P. J., & Vegas, F. J. (1996). 확률 및 수학 통계 : 임상 실습 및 건강 관리 응용. 에디 시옹 디아스 데 산토스.
  6. Vázquez, A. L., & Ortiz, F. J. (2005). 변동성을 측정, 기술 및 통제하기위한 통계적 방법. 칸타 브리아 대학.
  7. 바스케즈, S. G. (2009). 대학 입학을위한 수학 안내서. Ramon Areces SA 연구 센터 편집장.