1. Apa hubungan antara OLAP dan OLTP?
Jawaban ::
Sebelum kita membahas tentang hubungan antara OLAP dan
OLTP, kita harus mengetahui terlebih dahulu definisi atau pengertian
dari OLAP dan OLPT.
a) OLAP
Suatu jenis perangkat lunak yang melakukan pemrosesan
untuk menganalisa data bervolume besar dari berbagai perspektif
(multidimensi). OLAP seringkali disebut analisis data multidimensi yang
berfungsi sebagai data analasis (select) (Ardi, 2010). Data multidimensi
adalah data yang dapat dimodelkan sebagai atribut dimensi dan atribut
ukuran. Contoh atribut dimensi adalah nama barang dan warna barang,
sedangkan contoh atribut ukuran adalah jumlah barang.
b) OLTP (Online Transaction Processing Systems)
adalah suatu sistem yang memproses suatu transaksi
secara langsung (insert, update, delete) melalui komputer yang terhubung
dalam jaringan. OLTP berorientasi pada proses yang memproses suatu
transaksi secara langsung melalui komputer yang terhubung dalam jaringan
(Ardi, 2010). Seperti misalanya kasir pada sebuah super market yang
menggunakan mesin dalam proses transaksinya. OLTP mempunyai
karakteristik beberapa user dapat creating, updating, retrieving untuk
setiap record data, lagi pula OLTP sangat optimal untuk updating data.
Jadi, hubungan antara OLAP dan OLTP adalah pemrosesan
dalam suatu sistem yang saling berkaitan. OLTP digunakan untuk
memprosesan suatu transaksi yang menginput atau memasukkan data
menggunakan OLAP yang berfungsi untuk menganalisis. Sehingga dengan
menggunakan OLPT user dapat creating, updating, retrieving untuk setiap
data record dari OLAP.
2. Jelaskan tahapan-tahapan utama pengumpulan data pada Data Warehouse.
Jawaban ::
- Integrasi data adalah penggabungan datadari berbagai sumber penyimpanan datauntuk menjadi satu kesatuan data yangkoheren.
- Reduksi data. Teknik reduksi data diterapkan untuk memperoleh
representasi tereduksi dari sejumlah data yang berimplikasi pada volume
yang jauh lebih kecil.
- Pembersihan Data. Proses ini merupakan tahapan pembersihan data, yaitu
mengisi data yang hilang, mengatasi data yang kotor dan rusak,
mengidentifikasi atau membuang data pencilan*, *memperbaiki data yang
tidak konsisten.
- Transformasi data yaitu prosespengubahan data menjadi bentuk yang
tepat.Proses ini dilakukan agar kondisi data tetapkonsisten dan dapat
digunakan untuk proses.
3. Apa kaitan antara Data Warehouse, Data Mining dan Data Mart?
Jawaban ::
Sebelum membahas kaitan antara Data Warehouse, Data
Mining, Data Mining kita lihat dahulu pengertian masing-masing Data
tersebut :
- Data Warehouse : merupakan metode dalam perancangan database, yang
menunjang DSS(Decission Support System) dan EIS (Executive Information
System). Secara fisik data warehouse adalah database, tapi
perancangan data warehouse dan database sangat berbeda. Dalam
perancangan database tradisional menggunakan normalisasi, sedangkan pada
data warehouse normalisasi bukanlah cara yang terbaik.
- Data Mining : Perangkat Lunak yang digunakan untuk menemukan
pola-polater sembunyi maupun hubungan-hubungan yang terdapat dalam basis
data yang besar dan menghasilkan aturan-aturan yang digunakan untuk
memperkirakan perilaku di masa yang akan datang.
- Data Mart : Merupakan bagian dari data warehouse yang mendukung
kebutuhan pada tingkat departemen atau fungsi bisnis tertentu dalam
perusahaan.
Jadi, kaitan Data Warehouse, Data Mining, Data Mart adalah ketiganya
merupakan perangkat lunak yang saling menunjang. Data Warehouse yang
merancang database, Data Mining digunakan untuk basis data yang besar
dalam perangkat lunak tersebut, sedangkan Data Mart untuk mendukung
kebutuhan fungsi bisnis dalam suatu perusahaan.
4. Sebutkan model-model
Data Mining
Jawaban ::
a. Association Rules
· Sering disebut juga dengan Link Analysis atau
Market-basket Analysis
· Merupakan pendekatan diskriptif yang mengekplorasi
data untuk mencari hubungan antar data yang ada
· Banyak digunakan untuk melakukan penganalisaan
terhadap transaksi pemesanan/retail
b. Clustering
· Sering disebut dengan unsupervised classification
· Telah banyak diimplementasikan di berbagai bidang
mulai dari ekonomi sampai biologi
· Ada beberapa jenis: hierarchical, partitional dan
density estimation-based clustering
c. Decision Trees
· Sering disebut juga Regression Tree
· Merupakan metode yang terkelompok ke dalam
supervised classification
· Fungsinya sama dengan Neural Networks dalam hal
klasifikasi
· Sudah banyak diterapkan di dalam berbagai macam
pemodelan terapan
d. Neural Networks
· Merupakan metode yang terkelompok dalam supervised
classification
· Bisa digunakan untuk klasifikasi dan bias juga
digunakan untuk melakukan prediksi
· Merupakan pemodelan yang mencontoh otak manusia
(hewan)
e. Bayesian Networks
· Merupakan pemodelan dengan menggambarkan variable
sebagai bagian dari suatu jaringan
· Bisa dikatakan sebagai gabungan dari neural
networks dan decision trees
· Berguna untuk melakukan pemodelan yang kompleks,
dimana variables yang dianalisa mempunyai hubungan kompleks dan tidak hanya
hubungan satu arah