Pengertian Distribusi Sampling, Sifat, Jenis, Fungsi, dan Contohnya

Diposting pada

Pengertian Distribusi Sampling, Sifat, Jenis, Fungsi, dan Contohnya

Dalam statistik dan statistika kerapkali kita mengenal dengan distribusi sampling atau dipahami juga dengan distribusi sampel. Istilah mengindikasikan pada proses distribusi pada teknik pengambilan sampel yang artinya distribusi probabilitas dari statistik berbasis sampel acak tertentu. Atau secara singkat bisa dikatakan bahwa, distribusi sampling adalah tempat kita mengambil populasi (N), dan menemukan statistik dari populasi.

Hal ini terjadi jika sejumlah besar sampel secara sewenang-wenang melibatkan beberapa pengamatan (titik data), sehingga dapat dipergunakan secara terpisah untuk menghitung satu nilai statistik (seperti, misalnya, mean sampel atau varians sampel) untuk setiap sampel, maka pengambilan distribusi sampling adalah distribusi probabilitas dari nilai-nilai yang diambil oleh statistik. Adapun untuk contoh adanya distribusi sampel misal seorang peneliti medis membandingkan berat rata-rata bayi yang lahir di Amerika Utara dan selatan pada waktu yang sama.

Distribusi Sampling

Statistik sampel hanya memperkirakan parameter populasi, seperti mean atau deviasi standar. Hal ini karena dalam penelitian dunia nyata hanya sampel kasus yang dipilih dari populasi, karena keterbatasan waktu dan masalah praktis peneliti tidak dapat menguji total populasi.

Oleh karena itu, kemungkinan mean sampel akan berbeda dengan mean populasi (tidak diketahui). Bagaimanapun, seorang peneliti tidak akan pernah mengetahui jumlah pasti dari kesalahan pengambilan sampel, tetapi dengan menggunakan distribusi pengambilan sampel mereka dapat memperkirakan kesalahan pengambilan sampel.

Jumlah observasi dalam suatu populasi, jumlah observasi dalam sampel dan prosedur yang digunakan untuk menggambar set sampel menentukan variabilitas distribusi sampling. Simpangan baku dari distribusi sampling disebut kesalahan standar. Meskipun rata-rata distribusi sampel sama dengan rata-rata populasi, kesalahan standar bergantung pada deviasi standar populasi dari ukuran berbagai jenis populasi dan sampel.

Mengetahui seberapa jauh sebaran mean dari setiap set sampel satu sama lain dan dari mean populasi akan memberikan indikasi seberapa dekat mean sampel dengan mean populasi. Kesalahan standar dari distribusi pengambilan sampel menurun dengan bertambahnya ukuran sampel.

Pengertian Distribusi Sampling

Distribusi sampling adalah serangkaian bentuuk distribusi probabilitas statistik yang diperoleh dari sejumlah besar sampel yang diambil dari populasi tertentu. Distribusi sampling dari suatu populasi merupakan distribusi frekuensi dari beragam hasil berbeda yang mungkin terjadi untuk statistik populasi.

Dalam statistik, populasi adalah keseluruhan kumpulan dari mana sampel statistik diambil. Populasi dapat merujuk pada seluruh kelompok orang, objek, peristiwa, kunjungan rumah sakit, atau pengukuran. Dengan demikian, populasi dapat dikatakan sebagai observasi agregat dari subjek yang dikelompokkan bersama oleh fitur umum.

Pengertian Distribusi Sampling Menurut Para Ahli

Adapun definisi disribusi sampling menurut para ahli, antara lain:

  1. Sudjana (2001), Distribusi sampling rata-rata dapat didefinisikan sebagai kumpulan dari bilangan-bilangan yang masing-masing merupakan rata-rata hitung dari samplenya.
  2. Teorema batas pusat, Arti distribusi sampling yang menunjukkan mean dari setiap variabel, independen dan acak, akan normal atau mendekati jika sampel yang digunakan cukup besar.

Sifat Distribusi Sampling

Pengetahuan tentang sifat distribusi sampling bisa sangat berguna dalam membuat kesimpulan tentang populasi secara keseluruhan. Yaitu;

  1. Distribusi Sampling dan Statistik Inferensial

Distribusi sampel penting untuk statistik inferensial. Dalam praktiknya, seseorang akan mengumpulkan data sampel dan, dari data ini, memperkirakan parameter distribusi populasi. Dengan demikian, pengetahuan tentang distribusi sampling bisa sangat berguna dalam membuat kesimpulan tentang populasi secara keseluruhan.

Misalnya, mengetahui sejauh mana mean dari sampel yang berbeda berbeda satu sama lain dan dari mean populasi akan memberi kita gambaran tentang seberapa dekat mean sampel tertentu dengan mean populasi.

Untungnya, informasi ini tersedia langsung dari distribusi pengambilan sampel. Ukuran paling umum tentang seberapa banyak mean sampel berbeda satu sama lain adalah deviasi standar distribusi sampling mean. Deviasi standar ini disebut kesalahan standar mean.

  1. Kesalahan Standar (Standard Error)

Simpangan baku dari distribusi sampling dari suatu statistik disebut sebagai kesalahan standar dari kuantitas itu. Untuk kasus di mana statistik adalah mean sampel, dan sampel tidak berkorelasi, kesalahan standarnya adalah:

SEx=s√n

Dimana, S adalah deviasi standar sampel dan n adalah ukuran (jumlah item) dalam sampel. Implikasi penting dari rumus ini adalah bahwa ukuran pemusatan data sampel harus empat kali lipat (dikalikan dengan 4) untuk mencapai setengah dari kesalahan pengukuran. Saat merancang studi statistik di mana biaya merupakan faktor, ini mungkin memiliki peran dalam memahami pengorbanan biaya-manfaat.

Jika semua mean sampel sangat dekat dengan mean populasi, maka standar error mean akan kecil. Di sisi lain, jika mean sampel sangat bervariasi, maka standar error mean akan menjadi besar. Untuk lebih spesifiknya, asumsikan rata-rata sampel kita adalah 125 dan kita memperkirakan bahwa kesalahan standar mean adalah 5.

Jika itu berdistribusi normal, kemungkinan besar mean sampel kita berada dalam 10 unit mean populasi karena sebagian besar distribusi normal berada dalam dua deviasi standar rata-rata.

Sifat lainnya dari distribusi sampling

Yaitu;

  1. Bentuk distribusi secara keseluruhan adalah simetris dan mendekati normal.
  2. Tidak ada pencilan atau penyimpangan penting lainnya dari pola keseluruhan.
  3. Pusat distribusi sangat dekat dengan rata-rata populasi sebenarnya.

Jenis Distribusi Sampling

Ada beberapa tipe standar distribusi sampling dengan masing-masing cara penerapannya, diantaranya yaitu:

  1. Distribusi-T

Distribusi-T adalah distribusi sampling yang membantu profesional data menentukan ukuran populasi atau varians populasi. Distribusi-T menggunakan skor-t untuk mengevaluasi data yang tidak sesuai untuk distribusi normal. Misalnya, saat menganalisis sampel yang sangat kecil. Rumus t-score terlihat seperti ini:

t = [x – μ] / [s / sqrt (n)]

Dalam rumus di atas, “x” adalah mean sampel, “μ” adalah mean populasi dan menandakan deviasi standar.

  1. Distribusi Normal

Distribusi normal juga disebut “kurva lonceng“. Distribusi normal ialah distribusi dengan fitur seperti kurva berbentuk lonceng yang simetris dan mean (rata-rata) serta median (nilai tengah) merupakan angka yang sama dan diposisikan di tengah kurva.

Jika kita memiliki banyak data dan kita membuat distribusi pengambilan sampel, kemungkinan besar model distribusi normal dari mana kita dapat menyimpulkan nilai statistik, kecuali model seperti t-scoring diterapkan.

Fungsi Distribusi Sampling

Distribusi sampling merupakan faktor penting dalam analisis statistik, karena memberikan penyederhanaan utama dalam perjalanan ke inferensi statistik. Lebih khusus lagi, distribusi sampling memungkinkan pertimbangan analitis didasarkan pada distribusi probabilitas statistik, bukan pada distribusi probabilitas gabungan dari semua nilai sampel individu.

Atau dengan kata lain, distibusi sampling berfungsi untuk menentukan probabilitas kemunculan, atau “distribusi probabilitas”, dalam sampel tertentu.

Cara Menentukan Distribusi Sampling

Untuk menentukan apakah sampel kita cukup besar, kita harus mempertimbangkan hal berikut:

  1. Persyaratan akurasi: Distribusi pengambilan sampel yang paling akurat memiliki pengambilan sampel data rata-rata yang cukup untuk membuat kurva lonceng. Semakin dekat ke distribusi normal tampilan visualisasi saat diplot, semakin akurat. Lebih banyak data lebih baik untuk akurasi distribusi sampling.
  2. Bentuk populasi awal: Jika populasi awal sangat mirip dengan kurva lonceng distribusi normal, maka pengambilan sampel yang lebih sedikit akan diperlukan untuk memplot bentuk dalam distribusi pengambilan sampel.

Para ilmuwan data umumnya menyatakan bahwa antara 30 sampai dengan 50 titik data cukup untuk membuat distribusi normal yang indah. Namun, jika populasinya tidak normal, misalnya, miring satu atau lain cara, lebih banyak sampel akan dibutuhkan untuk mendapatkan hasil yang diinginkan dari distribusi sampling.

Contoh Distribusi Sampling

Banyak jenis data penelitian yang diambil dan digunakan oleh akademisi, ahli statistik, peneliti, pemasar, analis, dan lain-lain, sebenarnya adalah sampel, bukan populasi. Sampel adalah bagian dari populasi. Adapun untuk contohnya, misalnya saja;

  1. Penelitian Kesehatan

Misalnya, seorang peneliti medis yang ingin membandingkan berat rata-rata semua bayi yang lahir di Amerika Utara dari tahun 1995 hingga 2005 dengan bayi yang lahir di Amerika Selatan dalam periode waktu yang sama tidak dapat menarik data untuk seluruh populasi dalam jangka waktu yang wajar.

Dia malah hanya akan menggunakan berat, katakanlah, 100 bayi, di setiap benua untuk membuat kesimpulan. Berat 200 bayi yang digunakan sebagai sampel dan bobot rata-rata yang dihitung adalah mean sampel.

Sekarang anggaplah bahwa alih-alih hanya mengambil satu sampel dari 100 bobot bayi baru lahir dari setiap benua, peneliti medis mengambil sampel acak berulang dari populasi umum, dan menghitung mean sampel untuk setiap kelompok sampel.

Jadi, untuk Amerika Utara, dia menarik data untuk 100 anak baru lahir yang tercatat di AS, Kanada dan Meksiko sebagai berikut: empat 100 sampel dari rumah sakit terpilih di AS, lima 70 sampel dari Kanada dan tiga 150 catatan dari Meksiko, dengan total dari 1200 bobot bayi baru lahir dikelompokkan dalam 12 set. Ia juga mengumpulkan data sampel 100 bayi berat lahir dari masing-masing 12 negara di Amerika Selatan.

Bobot rata-rata yang dihitung untuk setiap set sampel adalah distribusi sampling dari mean. Tidak hanya mean yang dapat dihitung dari sampel. Statistik lain, seperti deviasi standar, varians, proporsi, dan kisaran dapat dihitung dari data sampel.

  1. Penelitian Survai

Contoh lain misalnya seseorang mengadakan survei tentang skor GRE mahasiswa dan menghitung bahwa standar deviasi adalah 1. Sangat kecil kemungkinannya dia akan mendapatkan hasil yang sama jika mengulang survei (Dia mungkin mendapatkan 1,1, 1,2, atau 0,9).

Oleh karena itu, dia perlu mengulangi jajak pendapat sebanyak mungkin (yaitu dia menarik semua sampel yang mungkin berukuran n dari populasi). Dia akan memiliki rentang deviasi standar satu untuk setiap sampel. Distribusi probabilitas semua deviasi standar adalah distribusi sampling dari deviasi standar.

Kesimpulan

Dari penjelasan yang dikemukakan, dapatlah dikatakan bawha dalam membuat distribusi sampling dalam arti penelitian harus mampu memilih sampel acak dengan ukuran tertentu (N) dari populasi, menghitung statistik yang dipilih untuk sampel ini (misalnya mean), memetakan statistik ini pada distribusi frekuensi, serta ulangi langkah-langkah ini berkali-kali.

Disisi lainnya, penting untuk dicatat bahwa distribusi sampling bersifat teoritis, dan peneliti tidak memilih jumlah sampel yang tidak terbatas. Sebaliknya, mereka melakukan pengambilan sampel berulang dari populasi yang lebih besar, dan menggunakan teorema batas pusat untuk membangun distribusi sampling.

Nah, demikinlah artikel yang bisa kami kemukakan pada semua pembaca berkaitan dengan pengertian distribusi sampling menurut para ahli, sifat, macam, fungsi, cara menentukan, dan contohnya yang ada di dalam penelitian. Semoga memberikan wawasan.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *