Definisi & Contoh Pelepasan Data |
Perincikan data mangsa atasi banjir
Isi kandungan:
Apa itu:
Perataan data adalah teknik statistik yang melibatkan membuang outlier dari set data untuk membuat corak yang lebih jelas.
Bagaimana ia berfungsi (Contoh):
Sebagai contoh, katakan bahawa sebuah universiti menganalisis data jenayahnya sejak 10 tahun yang lalu. Bilangan jenayah ganas kelihatan seperti ini:
Seperti yang dapat anda lihat, kebanyakan masa universiti mengalami kurang daripada 15 jenayah setahun. Walau bagaimanapun, pada tahun 2006 dan 2007, ia mengalami 44 disebabkan oleh keperluan laporan percubaan oleh pasukan keselamatan awam universiti. Percubaan pelaporan itu mengubah definisi jenayah kekerasan untuk menyertakan sebarang jenis kecurian sepanjang tahun-tahun itu, yang mencipta lompat besar dalam jumlah jenayah "ganas" di kampus. Sekiranya kita memasukkan tahun-tahun ini secara purata - iaitu, jika kita melakukan beberapa smoothing data - universiti mengalami purata kira-kira 19 jenayah ganas setahun. Tetapi jika kita meninggalkan tahun-tahun itu, kita dapat melihat bahawa purata yang lebih realistik ialah 13 jenayah kekerasan setahun - perbezaan 32%.
Mengapa Matters:
Terdapat banyak cara untuk melicinkan data, termasuk menggunakan bergerak purata dan algoritma. Idea ini adalah bahawa perataan data membuat corak lebih nyata dan dengan itu membantu dalam meramalkan perubahan dalam harga saham, trend pelanggan atau sebarang maklumat perniagaan yang lain. Walau bagaimanapun, perataan data boleh mengabaikan maklumat penting atau membuat fakta penting kurang dapat dilihat; dengan kata lain, "pembulatan tepi" data boleh mengutamakan data tertentu dan mengabaikan data lain.