Sturges의 설명, 응용 및 예 규칙



스터지 룰 는 통계 데이터 집합을 그래픽으로 표현하는 데 필요한 클래스 또는 간격의 수를 결정하는 데 사용되는 기준입니다. 이 규칙은 1926 년에 독일의 수학자 Herbert Sturges.

Sturges는 클래스 수와 범위 진폭을 찾을 수있는 샘플 수 x에 기반한 간단한 방법을 제안했습니다. Sturges 규칙은 특히 통계 분야, 특히 빈도 막대 그래프를 만드는 데 광범위하게 사용됩니다.

색인

  • 1 설명
  • 2 신청
  • 3 예제
  • 4 참고

설명

스터지스 규칙 샘플 또는 인구를 나타내는 데이터 세트를 분류하도록, 광범위 주파수의 히스토그램에 있어야 클래스 수를 결정하기위한 기술 통계에 사용 된 실험 방법.

기본적으로이 규칙은 그래픽 컨테이너의 너비와 빈도 막대 그래프를 결정합니다..

그 규칙 허버트 스터지스는 i 번째 샘플 기간 (I = 0 ... K - 1)의 특정 숫자 포함 K 이루어진 도면 최적 주파수 범위로서 간주 확립을 표시 :

그 샘플 수는 집합의 부분 집합을 추출 할 수있는 방법의 수에 의해 주어집니다. 즉, 이항 계수에 의해 다음과 같이 표현된다.

표현을 단순화하기 위해 그는 방정식의 두 부분에 대수의 속성을 적용했습니다.

따라서, Sturges는 간격 k의 최적 수는 다음과 같은 식으로 주어진다는 것을 확립했다 :

또한 다음과 같이 표현할 수 있습니다.

이 표현식에서 :

- k는 클래스 수입니다..

- N은 표본의 총 관측 수입니다..

- 로그는 밑이 10 인 일반 로그입니다..

예를 들어, 142 명의 자녀가있는 무작위 표본을 표현하는 빈도 막대 그래프를 만들려면 배포본의 간격 또는 클래스 수는 다음과 같습니다.

k = 1 + 3,322 * 로그10 (N)

k = 1 + 3,322* 로그 (142)

k = 1 + 3,322* 2,1523

k = 8.14 ≈ 8

따라서 배포 간격은 8.

간격의 수는 항상 정수로 표시되어야합니다. 값이 십진수 인 경우 가장 가까운 정수로 근사값을 작성해야합니다.

응용 프로그램

이것은 클래스의 수 (K) 및 이들의 각각의 길이를 계산함으로써, 주파수 분포를 가능하게 때문에 스터지스 규칙 통계에 주로 적용되며, 또한 진폭라고도.

진폭은 클래스의 상한값과 하한값의 차이를 클래스 수로 나눈 값으로 표현됩니다.

빈도 분포를 허용하는 많은 경험적 규칙이 있습니다. 그러나 Sturges 규칙은 일반적으로 클래스 수를 대략적으로 계산하므로 일반적으로 사용되며 일반적으로 5에서 15.

이런 식으로 표본이나 모집단을 적절하게 나타내는 값을 고려하십시오. 즉, 근사값은 극단적 인 그룹화를 나타내지 않으며 샘플을 요약 할 수없는 과도한 수의 클래스에서 작동하지 않습니다..

예제

당신은 마을의 체육관에서 운동 남자의 설문 조사에서 얻어진 연령에 해당하는, 주어진 데이터에 따라 주파수 히스토그램을 만들 필요가.

간격을 결정하기 위해 샘플의 크기 또는 관측 수를 알아야합니다. 이 경우에는 30 명이 있습니다..

그런 다음 Sturges 규칙이 적용됩니다.

k = 1 + 3,322 * 로그10 (N)

k = 1 + 3,322* 로그 (30)

k = 1 + 3,322* 1,4771

k = 5.90 ≈ 6 인터벌.

간격의 수에서 이들이 가질 진폭을 계산할 수 있습니다. 즉, 주파수 막대 그래프에 표시된 각 막대의 너비 :

하한은 데이터의 최저 값으로 간주되며 상한은 최고 값입니다. 상한과 하한의 차이를 변수 (R)의 범위 또는 경로라고합니다..

테이블에서 상한값은 46이고 하한값은 13입니다. 그런 식으로 각 클래스의 진폭은 다음과 같습니다.

간격은 상한과 하한으로 구성됩니다. 이 간격을 결정하려면 아래의 한계에서 계산을 시작하여 다음과 같이 규칙 (6)에 의해 결정된 진폭을 추가하십시오.

그런 다음 절대 빈도가 계산되어 각 간격에 해당하는 남성의 수를 결정합니다. 이 경우에는 다음과 같습니다.

- 간격 1 : 13 - 18 = 9

- 간격 2 : 19-24 = 9

- 간격 3 : 25 - 30 = 5

- 간격 4 : 31 - 36 = 2

- 간격 5 : 37 - 42 = 2

- 간격 6 : 43 - 48 = 3

각 클래스의 절대 빈도를 추가 할 때이 값은 샘플의 총 수와 같아야합니다. 이 경우, 30.

이어서 각 간격의 상대 빈도를 계산하여이 간격의 절대 빈도를 총 관측 수로 나눕니다.

- 간격 1 : fi = 9 ÷ 30 = 0.30

- 간격 2 : fi = 9 ÷ 30 = 0.30

- 간격 3 : fi = 5 ÷ 30 = 0.1666

- 간격 4 : fi = 2 ÷ 30 = 0.0666

- 간격 5 : fi = 2 ÷ 30 = 0.0666

- 간격 4 : fi = 3 ÷ 30 = 0.10

그런 다음, 데이터를 나타내는 테이블을 수행 할 수 있으며, 도면의 다음 이미지에서 알 수있는 바와 같이, 얻어지는 간격에 대하여 상대로부터 :

따라서, 규칙 스터지스 차트의 개발을 통해 데이터 샘플을 요약하기 위해, 시료를 분리 할 수있는 클래스 또는 광범위의 수를 결정할 수.

참고 문헌

  1. Alfonso Urquía, M.V. (2013). 이산 사건의 모델링 및 시뮬레이션. 유엔,.
  2. Altman Naomi, M. K. (2015). "단순 선형 회귀."자연 법칙 .
  3. Antúnez, R.J. (2014). 교육 통계. 디지털 UNID.
  4. Fox, J. (1997). 응용 회귀 분석, 선형 모델 및 관련 방법. 현자 간행물.
  5. Humberto Llinás Solano, C. R. (2005). 설명 통계 및 확률 분포. 북한 대학.
  6. Panteleeva, O.V. (2005). 확률 및 통계의 기본.
  7. O.Kuehl, M.O. (2001). 실험 설계 : 설계 및 연구 분석의 통계 원리. Thomson 편집인.