RSS

Pertanyaan Tentang DATA WAREHOUSE

1.  Apa hubungan antara OLAP dan OLTP?

Jawaban ::
Sebelum kita membahas tentang hubungan antara OLAP dan OLTP, kita harus mengetahui terlebih dahulu definisi atau pengertian dari OLAP dan OLPT.
a)    OLAP
Suatu jenis perangkat lunak yang melakukan pemrosesan untuk menganalisa data bervolume besar dari berbagai perspektif (multidimensi). OLAP seringkali disebut analisis data multidimensi yang berfungsi sebagai data analasis (select) (Ardi, 2010). Data multidimensi adalah data yang dapat dimodelkan sebagai atribut dimensi dan atribut ukuran. Contoh atribut dimensi adalah nama barang dan warna barang, sedangkan contoh atribut ukuran adalah jumlah barang.
b)    OLTP (Online Transaction Processing Systems)
adalah suatu sistem yang memproses suatu transaksi secara langsung (insert, update, delete) melalui komputer yang terhubung dalam jaringan. OLTP berorientasi pada proses yang memproses suatu transaksi secara langsung melalui komputer yang terhubung dalam jaringan (Ardi, 2010). Seperti misalanya kasir pada sebuah super market yang menggunakan mesin dalam proses transaksinya. OLTP mempunyai karakteristik beberapa user dapat creating, updating, retrieving untuk setiap record data, lagi pula OLTP sangat optimal untuk updating data.
Jadi, hubungan antara OLAP dan OLTP adalah pemrosesan dalam suatu sistem yang saling berkaitan. OLTP digunakan untuk memprosesan suatu transaksi yang menginput atau memasukkan data  menggunakan OLAP yang berfungsi untuk menganalisis. Sehingga dengan menggunakan OLPT user dapat creating, updating, retrieving untuk setiap data record dari OLAP.


2.  Jelaskan tahapan-tahapan utama pengumpulan data pada Data Warehouse.

 Jawaban ::
  • Integrasi data adalah penggabungan datadari berbagai sumber penyimpanan datauntuk menjadi satu kesatuan data yangkoheren.
  • Reduksi data. Teknik reduksi data diterapkan untuk memperoleh representasi tereduksi dari sejumlah data yang berimplikasi pada volume yang jauh lebih kecil.
  • Pembersihan Data. Proses ini merupakan tahapan pembersihan data, yaitu
    mengisi data yang hilang, mengatasi data yang kotor dan rusak, mengidentifikasi atau membuang data pencilan*, *memperbaiki data yang tidak konsisten.
  • Transformasi data yaitu prosespengubahan data menjadi bentuk yang tepat.Proses ini dilakukan agar kondisi data tetapkonsisten dan dapat digunakan untuk proses.

3.  Apa kaitan antara Data Warehouse, Data Mining dan Data Mart?

Jawaban ::
Sebelum membahas kaitan antara Data Warehouse, Data Mining, Data Mining kita lihat dahulu pengertian masing-masing Data tersebut :
  1. Data Warehouse : merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.
  2. Data Mining : Perangkat Lunak yang digunakan untuk menemukan pola-polater sembunyi maupun hubungan-hubungan yang terdapat dalam basis data yang besar dan menghasilkan aturan-aturan yang digunakan untuk memperkirakan perilaku di masa yang akan datang.
  3. Data Mart : Merupakan bagian dari data warehouse yang mendukung kebutuhan pada tingkat departemen atau fungsi bisnis tertentu dalam perusahaan.
Jadi, kaitan Data Warehouse, Data Mining, Data Mart adalah ketiganya merupakan perangkat lunak yang saling menunjang. Data Warehouse yang merancang database, Data Mining digunakan untuk basis data yang besar dalam perangkat lunak tersebut, sedangkan Data Mart untuk mendukung kebutuhan fungsi bisnis dalam suatu perusahaan.


4. Sebutkan model-model Data Mining

Jawaban :: 
a.    Association Rules
·      Sering disebut juga dengan Link Analysis atau Market-basket Analysis
·      Merupakan pendekatan diskriptif yang mengekplorasi data untuk mencari hubungan antar data yang ada
·      Banyak digunakan untuk melakukan penganalisaan terhadap transaksi pemesanan/retail
b.    Clustering
·      Sering disebut dengan unsupervised classification
·      Telah banyak diimplementasikan di berbagai bidang mulai dari ekonomi sampai biologi
·      Ada beberapa jenis: hierarchical, partitional dan density estimation-based clustering
c.    Decision Trees
·      Sering disebut juga Regression Tree
·      Merupakan metode yang terkelompok ke dalam supervised classification
·      Fungsinya sama dengan Neural Networks dalam hal klasifikasi
·      Sudah banyak diterapkan di dalam berbagai macam pemodelan terapan
d.    Neural Networks
·      Merupakan metode yang terkelompok dalam supervised classification
·      Bisa digunakan untuk klasifikasi dan bias juga digunakan untuk melakukan prediksi
·      Merupakan pemodelan yang mencontoh otak manusia (hewan)
e.    Bayesian Networks
·      Merupakan pemodelan dengan menggambarkan variable sebagai bagian dari suatu jaringan
·      Bisa dikatakan sebagai gabungan dari neural networks dan decision trees
·      Berguna untuk melakukan pemodelan yang kompleks, dimana variables yang dianalisa mempunyai hubungan kompleks dan tidak hanya hubungan satu arah

1 komentar:

Unknown mengatakan...

Sebutkan aplikasi yang mendukung data warehouse (minimal 3)

Posting Komentar