Aturan Sturges: Penjelasan, Aplikasi dan Contoh

Aturan Sturges adalah kriteria yang digunakan untuk menentukan jumlah kelas atau interval yang diperlukan untuk secara grafis mewakili satu set data statistik. Aturan ini diucapkan pada tahun 1926 oleh ahli matematika Jerman Herbert Sturges.

Sturges mengusulkan metode sederhana, berdasarkan pada jumlah sampel x yang memungkinkan menemukan jumlah kelas dan amplitudo jangkauan mereka. Aturan Sturges banyak digunakan terutama di bidang statistik, khususnya untuk membangun histogram frekuensi.

Penjelasan

Aturan Sturges adalah metode empiris yang banyak digunakan dalam statistik deskriptif untuk menentukan jumlah kelas yang harus ada dalam histogram frekuensi, untuk mengklasifikasikan seperangkat data yang mewakili sampel atau populasi.

Pada dasarnya, aturan ini menentukan lebar wadah grafik, dari histogram frekuensi.

Untuk menetapkan aturannya Herbert Sturges dianggap sebagai diagram frekuensi ideal, yang terdiri dari interval K, di mana interval ke-i berisi sejumlah sampel tertentu (i = 0, ... k - 1), direpresentasikan sebagai:

Jumlah sampel tersebut diberikan dengan jumlah cara di mana subset dari suatu set dapat diekstraksi; yaitu, dengan koefisien binomial, dinyatakan sebagai berikut:

Untuk menyederhanakan ekspresi, ia menerapkan sifat-sifat logaritma di kedua bagian persamaan:

Dengan demikian, Sturges menetapkan bahwa jumlah interval optimal k diberikan oleh ungkapan:

Itu juga dapat dinyatakan sebagai:

Dalam ungkapan ini:

- k adalah jumlah kelas.

- N adalah jumlah total pengamatan dalam sampel.

- Log adalah basis 10 logaritma umum.

Misalnya, untuk membuat histogram frekuensi yang mengekspresikan sampel acak dengan tinggi 142 anak, jumlah interval atau kelas yang akan dimiliki oleh distribusi adalah:

k = 1 + 3.322 * log 10 (N)

k = 1 + 3, 322 * log (142)

k = 1 + 3.322 * 2.1523

k = 8, 14 ≈ 8

Dengan demikian, distribusi akan dilakukan dalam 8 interval.

Jumlah interval harus selalu diwakili oleh bilangan bulat. Dalam kasus di mana nilainya adalah desimal, pendekatan ke seluruh angka terdekat harus dibuat.

Aplikasi

Aturan Sturges diterapkan terutama dalam statistik, karena memungkinkan untuk melakukan distribusi frekuensi melalui perhitungan jumlah kelas (k), serta panjang masing-masing, juga dikenal sebagai amplitudo.

Amplitudo adalah perbedaan batas atas dan bawah kelas, dibagi dengan jumlah kelas, dan dinyatakan:

Ada banyak aturan empiris yang memungkinkan distribusi frekuensi dibuat. Namun, aturan Sturges biasanya digunakan karena mendekati jumlah kelas, yang umumnya berkisar dari 5 hingga 15.

Dengan cara ini, pertimbangkan nilai yang cukup mewakili sampel atau populasi; yaitu, perkiraan tidak mewakili pengelompokan yang ekstrem, juga tidak bekerja dengan jumlah kelas yang berlebihan yang tidak memungkinkan meringkas sampel.

Contoh

Hal ini diperlukan untuk melakukan histogram frekuensi sesuai dengan data yang diberikan, yang sesuai dengan usia yang diperoleh dalam survei terhadap pria yang melakukan latihan di gym lokal.

Untuk menentukan interval Anda harus tahu berapa ukuran sampel atau jumlah pengamatan; dalam hal ini, Anda memiliki 30.

Kemudian aturan Sturges berlaku:

k = 1 + 3.322 * log 10 (N)

k = 1 + 3, 322 * log (30)

k = 1 + 3.322 * 1.4771

k = 5, 90 ≈ 6 interval.

Dari jumlah interval, amplitudo yang dimiliki ini dapat dihitung; yaitu, lebar setiap bilah yang direpresentasikan dalam histogram frekuensi:

Batas bawah dianggap nilai terendah dari data, dan batas atas adalah nilai tertinggi. Perbedaan antara batas atas dan bawah disebut rentang atau jalur variabel (R).

Dari tabel kami menemukan bahwa batas atas adalah 46 dan batas bawah 13; dengan cara itu, amplitudo setiap kelas akan menjadi:

Interval akan terdiri dari batas atas dan bawah. Untuk menentukan interval ini, mulailah menghitung dari batas bawah, tambahkan padanya amplitudo yang ditentukan oleh aturan (6), sebagai berikut:

Kemudian frekuensi absolut dihitung untuk menentukan jumlah pria yang sesuai dengan setiap interval; dalam hal ini adalah:

- Interval 1: 13 - 18 = 9

- Interval 2: 19 - 24 = 9

- Interval 3: 25 - 30 = 5

- Interval 4: 31 - 36 = 2

- Interval 5: 37 - 42 = 2

- Interval 6: 43 - 48 = 3

Ketika menambahkan frekuensi absolut dari masing-masing kelas, itu harus sama dengan jumlah total sampel; dalam hal ini, 30.

Selanjutnya, frekuensi relatif dari setiap interval dihitung, membagi frekuensi absolut dari interval ini dengan jumlah total pengamatan:

- Interval 1: fi = 9 ÷ 30 = 0.30

- Interval 2: fi = 9 ÷ 30 = 0.30

- Interval 3: fi = 5 ÷ 30 = 0.1666

- Interval 4: fi = 2 ÷ 30 = 0, 0666

- Interval 5: fi = 2 ÷ 30 = 0, 0666

- Interval 4: fi = 3 ÷ 30 = 0.10

Kemudian Anda bisa membuat tabel yang mencerminkan data, dan juga diagram dari frekuensi relatif dalam kaitannya dengan interval yang diperoleh, seperti yang dapat dilihat pada gambar berikut:

Dengan cara ini, aturan Sturges memungkinkan menentukan jumlah kelas atau interval di mana sampel dapat dibagi, untuk merangkum sampel data melalui persiapan tabel dan grafik.