Skip to content Skip to sidebar Skip to footer

Contoh Dataset dan Pengertian Dataset


Data Rantai Blok
Assalamualaikum Wr. Wb - Salam Sejahtera dan Salam Budaya

Dalam kasus ini artikel yang akan tertuliskan adalah apa itu dataset dan macam-macam contohnya. Dan perlu diketahui juga dataset yang dimaksud adalah data yang digunakan untuk klasifikasi dengan metode data mining dalam pembelajaran supervised learning.


Dataset sendiri terdiri dari 5 kategori yang terbagi menjadi 2 bagian data, 2 jenis dari dataset dan 1 tujuan dataset. 

Tujuan dari dataset adalah untuk menguji suatu metode penelitian yang dikembangkan oleh para pakar peneliti dengan public dataset maupun private dataset. Untuk lebih jelasnya kamu bisa membaca artikel tentang jenis dataset dan bagian dari dataset.

Dataset adalah sebuah kumpulan data yang bersifat sebagai himpunan data yang berasal dari informasi-informasi pada masa sebelumnya dan siap untuk dikelola menjadi sebuah informasi baru dengan menggunakan teknik pembelajaran superised learning. Dimana digunakan untuk sistem prediksi sebagai acuan pendukung keputusan.

Dataset sendiri tidak serta merta didapatkan dengan mudah, karena harus mempunyai tujuan yang bersifat Comparable, repetable dan veriviable. Jenis dataset sendiri harus bisa pilah agar bisa memilih sebuah metode apa yang nantinya akan digunakan untuk penelitian dengan menggunakan pembelajaran supervised learning. Namun, pada artikel ini juga akan tertuliskan contoh-contoh dari dataset.

Contoh Dataset Sederhana.

1. Data Golf

Yang pertama adalah data golf. Data ini mungkin sudah familiar dengan data yang sering dipakai sebagai contoh dalam buku-buku yang membahas tentang mengolah data menjadi sebuah informasi dengan ilmu data mining.

Pada data golf ini akan mempresentasikan layak bermain golf ya atau tidak dengan mengambil 4 jenis atribut dari dua atribut kategorikal atau diskrit dan dua atribut beripe numerik. Pada dataset ini dengan melihat jenis datanya dan seperti yang juga tertulis pada buku karya Eko Prasetyo mampu digunakan dengan menggunakan Algoritma klasifikasi seperti Naive Bayes dan C4.5 dari keluarga Decision Tree

Apa saja isi datanya ?, Kamu juga bisa melihat dan mengunduh Data Golf pada link dibawah ini.

Unduh Disini

2. Data Customer

Yang kedua adalah data customer. Data ini spesifiknya digunakan untuk memprediksi setiap pelanggan apakah masih setia ya tetap bertahan atau tidak. Dataset ini terdiri dari 3 atribut dari 2 atribut kategorikal dan 1 atribut numerik. Pada dataset ini akan sangat cocok bagi kamu yang masih pemula untuk belajara ilmu data mining.

Dengan melihat jenis datanya. Maka algoritma yang mampu untuk mengklasifikasikan dataset ini adalah Naive Bayes, dan Decision Tree, Namun jika menurut saya adalah yang akuasinya akurat adalah dengan metode Naive Bayes dengan menggunakan fungsi gaussian.

Nah, kamu juga bisa melihat dan mengunduh file data tersebut pada tombol dibawah ini

Unduh Disini

3. Data Iris

Yang ketiga adalah data iris, Data ini merupakan data yang digunakan untuk mempridiksi spesies bunga yang terdiri dari iris-setosa, iris-versicolour dan iris verginica. Dengan mengukur empat elemen yaitu Petal Lenght, Petal Width, Sepal Lenght dan Sepat Widht. Data ini hanya terdiri dari atribut data yang bertipe numerik.

Nah, dengan melihat jenis datanya, ada beberapa algoritma atau metode yang bisa gunakan, yaitu Decision Tree, k-NN (Nearest Neighbor) dan Neural Network. 

Unduh Disini

Terimakasih, semoga informasi ini bisa bermanfaat, apabila kamu berkenan bisa bantu donasi untuk pengembangan blog yang saya bangun melalui link ini https://saweria.co/muiz27 .

Nah, itulah sedikit contoh dari dataset dan sedikit juga pengertian tentang dataset. Semoga bermanfaat dan kamu bisa menemukan apa yang dicari. Terimakasih dan satu kata "Jangan Lupa Bernafas dan Tetaplah Bersyukur".

Wassalamualaikum Wr. Wb - See You Later.