Saturday, March 31, 2012

Contoh aplikasi penggunaan decision tree di industri


Contoh aplikasi penggunaan decision tree di industri

Beberapa contoh pemakaian Decision Tree adalah antara lain:
·         Dapat membantu untuk mendiagnosa penyakit tertentu, seperti hipertensi, kanker, stroke, dan lain-lain, sehingga dapat mempermudah dalam industri rumah sakit
·         Untuk membantu kita dalam memilih barang yang akan dibeli sesuai dengan kriteria dari kebutuhan barang tersebut.
·         Untuk memilih pegawai teladan dalam suatu perusahaan dengan kriteria tertentu.
·         Dapat membantu mendeteksi gangguan pada jaringan komputer perusahaan seperti untuk mendeteksi virus di computer.

Contoh Kasus:
1.       Sebuah perusahaan sedang mempertimbangkan apakah harus tender untuk dua kontrak (MS1 dan MS2) yang ditawarkan dari sebuah departemen pemerintah untuk penyediaan komponen-komponen tertentu. Perusahaan ini memiliki tiga pilihan:
·         tender MS1 saja; atau
·         tender untuk MS2 saja; atau
·         tender baik MS1 dan MS2.
Jika tender yang disampaikan perusahaan akan dikenakan biaya tambahan. Biaya ini harus sepenuhnya diperoleh kembali dari harga kontrak. Risikonya, tentu saja, adalah bahwa jika tender tidak berhasil perusahaan akan telah membuat kerugian.
Biaya tender untuk kontrak hanya MS1 adalah £ 50.000. Biaya pasokan komponen jika tender berhasil akan £ 18.000. Biaya tender untuk kontrak hanya MS2 adalah £ 14.000. Biaya pasokan komponen jika tender berhasil akan £ 12.000. Biaya tender untuk kedua MS1 kontrak dan kontrak MS2 adalah £ 55.000. Pasokan komponen biaya jika tender berhasil akan menjadi £ 24.000.
Untuk setiap kontrak, harga tender mungkin telah ditentukan. Selain itu, penilaian subyektif telah dibuat dari probabilitas mendapatkan kontrak dengan harga tender tertentu seperti yang ditunjukkan di bawah ini. Catatan di sini bahwa perusahaan hanya bisa mengirimkan satu tender dan tidak bisa, misalnya, menyerahkan dua tender (dengan harga yang berbeda) untuk kontrak yang sama.
Pohon keputusan untuk masalah ditampilkan di bawah.
2.       Metal Penemuan Group (MDG) adalah perusahaan yang dibentuk untuk melakukan eksplorasi geologi tanah dalam rangka untuk memastikan apakah deposit logam signifikan (layak eksploitasi komersial lebih lanjut) hadir atau tidak. MDG saat ini memiliki opsi untuk membeli langsung sebidang tanah untuk 3m £.
Jika MDG melakukan pembelian sebidang tanah ini maka akan melakukan eksplorasi geologi tanah. Pengalaman masa lalu menunjukkan bahwa untuk jenis bidang tanah yang dipertimbangkan eksplorasi geologi biaya sekitar £ 1 juta dan hasil deposito logam yang signifikan dengan probabilitas sebagai berikut:
·         mangan 1%
·         emas 0,05%
·         perak 0,2%
Jika mangan ditemukan maka sebidang tanah dapat dijual untuk £ 30 juta, jika emas ditemukan maka sebidang tanah dapat dijual untuk 250 m £ dan jika perak menemukan sebidang tanah dapat dijual untuk £ 150m. jika mereka ingin, membayar £ 750.000 untuk hak untuk melakukan eksplorasi tes tiga hari sebelum memutuskan apakah akan membeli sebidang tanah atau tidak. Seperti tiga hari tes eksplorasi hanya dapat memberikan indikasi awal apakah deposit logam signifikan hadir atau tidak dan pengalaman masa lalu menunjukkan bahwa tiga hari tes eksplorasi biaya £ 250.000 dan menunjukkan bahwa deposit logam signifikan yang hadir 50% dari waktu.Jika eksplorasi tes tiga hari menunjukkan deposit logam signifikan maka kemungkinan menemukan peningkatan mangan, emas dan perak untuk 3%, 2% dan 1% masing-masing. Jika eksplorasi tes tiga hari gagal untuk menunjukkan deposit logam signifikan maka kemungkinan menemukan penurunan mangan, emas dan perak menjadi 0,75%, 0,04% dan 0,175% masing-masing.

Analisis Penentuan Kategori untuk Variabel Prediktor


Analisis Penentuan Kategori untuk Variabel Prediktor

Pada pembuatan decision tree dalam sistem pendukung keputusan, dari variabel prediktor yang ada, kami membuat kategori-kategori di dalam variabel tersebut. Variabel keputusan yang belum memiliki pembagian yang jelas harus dikategorikan, karena agar dapat digunakan untuk membuat decision tree data-data tersebut harus dikelompokkan terlebih dahulu supaya pembagiannya jelas dan decision tree menjadi lebih efisien. Makin banyak kategori yang ada dalam suatu variabel prediktor maka makin akurat juga keputusan yang akan dihasilkan. Ada dua variabel prediktor yang kami kategorikan yaitu antara lain:

·            Gaji
          Variabel gaji ini kami bagi menjadi tiga kategori yaitu:
-Rendah, dengan range 900.000-2.000.000 rupiah
-Sedang, dengan range 2.000.000-3.500.000 rupiah
-Tinggi, dengan range 3.500.000-6.500.000 rupiah
- 
·            Usia
          Variabel usia ini kami bagi menjadi tiga kategori yaitu:
-Muda, dengan range 19-25 tahun
-Sedang, dengan range 26-35 tahun
-Tua, dengan range 36-46 tahun
Batas atas dan batas bawah dari pembagian kategori gaji dan usia ini kami dapatkan dari nilai terkecil dan terbesar dari data variabel prediktor yang telah ada, kemudian pengelompokkan berdasarkan range tersebut kami asumsikan berdasarkan logika yang sesuai dengan keadaan nyata. Seperti range usia muda yaitu 19-25 tahun masih dikatakan muda untuk usia seseorang.

Analisis Variabel Prediktor

Analisis Variabel Prediktor

Pada pembuatan decision tree dalam proses pengambilan keputusan, terdapat variable-variabel yang digunakan untuk membantu kita untuk mengambil keputusan yang disebut variable predictor. Variabel predictor dijadikan sebagai pertimbangan dari suatu data dalam pengambilan keputusan, variabel ini dapat menggambarkan karakteristik data.
Dari suatu variable prediktor, kategori yang dimiliki dapat berjumlah lebih dari satu dan bersifat kualitatif serta kuantitatif, makin banyak kategori yang ada maka makin akurat juga hasil pengambilan keputusan yang didapatkan. Adapun variable-variabel yang kami gunakan dalam membuat decision tree untuk menentukan bonus pegawai pada Divisi Sumber Daya Manusia ini adalah:
·         Marital Status (Status Pernikahan)
Variabel ini menggambarkan status pernikahan dari para pegawai yang bekerja pada PT. PTI. Status pernikahan dibagi menjadi Single  (S) dan Married(M), hal ini dapat menentukan dalam pembuatan keputusan untuk memberikan bonus atau tidak kepada pegawai. Berdasarkan decision tree yang telah kami buat, didapatkan kecenderungan bahwa pegawai yang sudah menikah lebih banyak yang mendapatkan bonus dibandingkan dengan pegawai yang belum menikah.
Hasil tersebut dapat disebabkan oleh beberapa pertimbangan yang dilakukan oleh divisi SDM, yaitu antara lain: pegawai yang berstatus telah menikah pasti membutuhkan penghasilan yang lebih banyak dibandingkan dengan yang belum menikah, karena pegawai yang telah menikah memiliki tanggung jawab yang lebih besar untuk menghidupi anggota keluarganya (anak dan suami/istri mereka), sedangkan pegawai yang belum menikah, tanggung jawabnya masih kepada diri dia sendiri saja, dan dirasa belum membutuhkan untuk mendapatkan bonus , maka dari itu divisi SDM cenderung untuk memberikan bonus kepada pegawai yang telah menikah.

·            Jenis Kelamin
Variable ini menunjukkan jenis kelamin dari para pegawai PT. PTI ini. Jenis kelamin dibagi menjadi Female (F) dan Male (M). variable ini berpengaruh terhadap keputusan pemberian bonus atau tidak kepada pegawai. Pegawai yang berjenis kelamin wanita memiliki kecenderungan lebih tinggi untuk dipilih dalam menerima bonus dari perusahaan. Hal ini dapat disebabkan oleh kebutuhan pribadi wanita yang lebih banyak daripada laki-laki, pegawai wanita dapat bekerja lebih rajin dan rapi daripada pegawai laki-laki, bagi wanita yang telah mempunyai anak dan tetap bekerja dengan baik berarti komitmen yang di punya terhadap pekerjaannya bcukup besar, dari alasan-alasan tersebut yang membuat wanita dirasa lebih membutuhkan pendapatan yang lebih berupa bonus.

·            Gaji
Variabel ini menunjukkan besar gaji yang didapatkan oleh para pegawai dari PT. PTI. Besar gaji kami bagi menjadi tiga kategori yaitu Rendah dengan range900.000-2.000.000 rupiah, Sedang dengan rangegaji 2.000.000-3.500.000 rupiah dan Besar dengan range 3.500.000-6.500.000. Besar gaji yang didapatkan oleh para pegawai mempengarui keputusan untuk pemberian bonus. Pegawai dengan gaji rendah cenderung dipilih sebagai penerima bonus dibandingkan dengan pegawai dengan gaji yang tinggi, karena pegawai dengan gaji yang rendah dinilai lebih membutuhkan tambahan penghasilan karena gajinya yang rendah tersebut, sedangkan pegawai yang gajinya lebih besar dirasa lebih tercukupi untuk memenuhi kebutuhannya.

·            Usia
Variabel ini menunjukkan usia dari para pekerja di PT. PTI. Usia dari para pegawai ini kami bagi menjadi tiga kategori yaitu usia muda dengan range 19-25 tahun, usia sedang dengan range 26-35 tahun, dan usia tua dengan range26-46 tahun. Usia pegawai merupakan salah satu faktor untuk membuat keputusan mengenai pemberian bonus. Pegawai dengan usia yang tua memiliki probabilitas yang lebih besar untuk mendapatkan bonus dibandingkan pegawai dengan usia sedang atau muda. Pegawai yang berusia tua biasanya telah memiliki keluarga sehingga mereka memiliki tanggung jawab yang lebih besar untuk menghidupi anggota keluarganya, selain itu makin tua seseorang maka dibutuhkan perawatan kesehatan yang lebih daripada orang yang lebih muda, seperti kebutuhan obat-obatan dan lainnya, maka dari itu pegawai yang berusia tua lebih cenderung mendapatkan bonus dari perusahaan.

Analisis Penentuan jumlah Cluster - K-Means Clustering


Analisis Penentuan jumlah Cluster

Jumlah cluster yang kami gunakan pada praktikum kali ini ialah 3 dan 4 yang kemudian diperoleh cluster yang baik untuk mengelompokan pegawai ialah cluster . Efek dari penentuan jumlah cluster ini akan terlihat setelah dilakukan perhitungan melalui metode K-Means Clustering. Begitupun alasan pemilihan jumlah cluster yang diambil dapat terlihat setelah melakukan perhitungan ini. Setelah dilakukan perhitungan dapat dilihat kekurangan dan kelebihan secara teknis dari banyaknya cluster yang digunakan. Berkut adalah beberapa alasanpemilihan jumlah cluster :
1.       Sum Squared Error (SSE) lebih kecil
Jumlah Cluster 3
SSE
14.38905984
Jumlah Cluster 4
SSE
12.51748067

SSE (Sum Squared Error) dari setiap cluster dapat menjadi ukuran performansi baik/tidaknya cluster tersebut. Dari dua jumlah cluster yang telah dicoba, dapat diketahui bahwa SSE dari jumlah cluster 4 lebih kecil dibandingkan dengan jumlah cluster 3. Ini menunjukan entitas yang masuk pada jumlah cluster 4 memiliki kesamaan yang lebih seragam dari pada entitas yang ada pada jumlah cluster 3.

2.       Nilai BCV/WCV lebih besar
Selain itu, performansi suatu cluster juga dilihat dari nilai rasio BCV/WCV. Dari dua jumlah cluster yang telah dicoba, dapat diketahui bahwa nilai BCV/WCV untuk jumlah cluster 4 lebih besar dari BCV/WCV untuk jumlah cluster 3. Berikut ini adalah perbandingan nilai BCV dan WCV untuk kedua jumlah clustertersebut.
Jumlah Cluster 3
BCV/WCV
0.159610427
Jumlah Cluster 4
BCV/WCV
0.399295681

Rasio ini menunjukan error within antar data pada masing-masing cluster. Jika SSE kecil menunjukan kemiripan didalam entitas cluster semakin mirip dan seragam dan jika BCV besar menunjukan variansi keberbedaan antar cluster yang satu dengan yang lainnya semakin besar dan jauh berbeda.

3.       Efektifitas dan Efisiensi Penentuan Treatment
Pemilihan jumlah cluster akan sangat berkaitan dengan pemberian treatment yang ditentukan oleh perusahaan. Pemberian treatment yang berbeda dalam jumlah cluster yang banyak akan membuat biaya semakin besar, tetapi jika clustersedikit dan treatment yang diberikan sedikit maka efektivitas treatmentmenjadi kurang signifikan. Untuk itu pemilihan jumlah cluster harus benar-benar disesuaikan dengan kebutuhan perusahaan. Jumlah cluster sebanyak 4dianggap sudah cukup dapat mewakili jumlah treatmentyang lebih memadai dan lebih efektif dibanding jumlah cluster 3. Namun, apabila jumlah cluster lebih banyak dari 4 dianggap tidak efisien oleh perusahaan sedangkan alokasi dana untuk pelaksanaan treatment sangat terbatas.