RSS

Pertanyaan Tentang DATA WAREHOUSE

1.  Apa hubungan antara OLAP dan OLTP?

Jawaban ::
Sebelum kita membahas tentang hubungan antara OLAP dan OLTP, kita harus mengetahui terlebih dahulu definisi atau pengertian dari OLAP dan OLPT.
a)    OLAP
Suatu jenis perangkat lunak yang melakukan pemrosesan untuk menganalisa data bervolume besar dari berbagai perspektif (multidimensi). OLAP seringkali disebut analisis data multidimensi yang berfungsi sebagai data analasis (select) (Ardi, 2010). Data multidimensi adalah data yang dapat dimodelkan sebagai atribut dimensi dan atribut ukuran. Contoh atribut dimensi adalah nama barang dan warna barang, sedangkan contoh atribut ukuran adalah jumlah barang.
b)    OLTP (Online Transaction Processing Systems)
adalah suatu sistem yang memproses suatu transaksi secara langsung (insert, update, delete) melalui komputer yang terhubung dalam jaringan. OLTP berorientasi pada proses yang memproses suatu transaksi secara langsung melalui komputer yang terhubung dalam jaringan (Ardi, 2010). Seperti misalanya kasir pada sebuah super market yang menggunakan mesin dalam proses transaksinya. OLTP mempunyai karakteristik beberapa user dapat creating, updating, retrieving untuk setiap record data, lagi pula OLTP sangat optimal untuk updating data.
Jadi, hubungan antara OLAP dan OLTP adalah pemrosesan dalam suatu sistem yang saling berkaitan. OLTP digunakan untuk memprosesan suatu transaksi yang menginput atau memasukkan data  menggunakan OLAP yang berfungsi untuk menganalisis. Sehingga dengan menggunakan OLPT user dapat creating, updating, retrieving untuk setiap data record dari OLAP.


2.  Jelaskan tahapan-tahapan utama pengumpulan data pada Data Warehouse.

 Jawaban ::
  • Integrasi data adalah penggabungan datadari berbagai sumber penyimpanan datauntuk menjadi satu kesatuan data yangkoheren.
  • Reduksi data. Teknik reduksi data diterapkan untuk memperoleh representasi tereduksi dari sejumlah data yang berimplikasi pada volume yang jauh lebih kecil.
  • Pembersihan Data. Proses ini merupakan tahapan pembersihan data, yaitu
    mengisi data yang hilang, mengatasi data yang kotor dan rusak, mengidentifikasi atau membuang data pencilan*, *memperbaiki data yang tidak konsisten.
  • Transformasi data yaitu prosespengubahan data menjadi bentuk yang tepat.Proses ini dilakukan agar kondisi data tetapkonsisten dan dapat digunakan untuk proses.

3.  Apa kaitan antara Data Warehouse, Data Mining dan Data Mart?

Jawaban ::
Sebelum membahas kaitan antara Data Warehouse, Data Mining, Data Mining kita lihat dahulu pengertian masing-masing Data tersebut :
  1. Data Warehouse : merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.
  2. Data Mining : Perangkat Lunak yang digunakan untuk menemukan pola-polater sembunyi maupun hubungan-hubungan yang terdapat dalam basis data yang besar dan menghasilkan aturan-aturan yang digunakan untuk memperkirakan perilaku di masa yang akan datang.
  3. Data Mart : Merupakan bagian dari data warehouse yang mendukung kebutuhan pada tingkat departemen atau fungsi bisnis tertentu dalam perusahaan.
Jadi, kaitan Data Warehouse, Data Mining, Data Mart adalah ketiganya merupakan perangkat lunak yang saling menunjang. Data Warehouse yang merancang database, Data Mining digunakan untuk basis data yang besar dalam perangkat lunak tersebut, sedangkan Data Mart untuk mendukung kebutuhan fungsi bisnis dalam suatu perusahaan.


4. Sebutkan model-model Data Mining

Jawaban :: 
a.    Association Rules
·      Sering disebut juga dengan Link Analysis atau Market-basket Analysis
·      Merupakan pendekatan diskriptif yang mengekplorasi data untuk mencari hubungan antar data yang ada
·      Banyak digunakan untuk melakukan penganalisaan terhadap transaksi pemesanan/retail
b.    Clustering
·      Sering disebut dengan unsupervised classification
·      Telah banyak diimplementasikan di berbagai bidang mulai dari ekonomi sampai biologi
·      Ada beberapa jenis: hierarchical, partitional dan density estimation-based clustering
c.    Decision Trees
·      Sering disebut juga Regression Tree
·      Merupakan metode yang terkelompok ke dalam supervised classification
·      Fungsinya sama dengan Neural Networks dalam hal klasifikasi
·      Sudah banyak diterapkan di dalam berbagai macam pemodelan terapan
d.    Neural Networks
·      Merupakan metode yang terkelompok dalam supervised classification
·      Bisa digunakan untuk klasifikasi dan bias juga digunakan untuk melakukan prediksi
·      Merupakan pemodelan yang mencontoh otak manusia (hewan)
e.    Bayesian Networks
·      Merupakan pemodelan dengan menggambarkan variable sebagai bagian dari suatu jaringan
·      Bisa dikatakan sebagai gabungan dari neural networks dan decision trees
·      Berguna untuk melakukan pemodelan yang kompleks, dimana variables yang dianalisa mempunyai hubungan kompleks dan tidak hanya hubungan satu arah

Broker Siap Jalankan Sistem Straight Through Processing

JAKARTA - Perusahaan efek anggota bursa (AB) menyatakan kesiapannya untuk mengimplementasikan sistem transaksi perdagangan terintegrasi dari mulai order, eksekusi transaksi, konfirmasi/afirmasi hingga settlement (Straight Through Processing/STP) di Bursa Efek Indonesia (BEI).

Adanya otomatisasi sistem perdagangan tersebut, diyakini akan membuat industri pasar modal Indonesia berkembang lebih baik.

"Saya lihat AB sudah siap mengimplementasikannya. Ini kan hanya tinggal menunggu live-nya saja. Sejauh ini, mereka (AB) memang telah mempersiapkan infrastruktur serta sistem pendukung di back office-nya," ujar Ketua Asosiasi Perusahaan Efek Indonesia (APEI), Lily Widjaja, di Jakarta, Senin.

Dia mengatakan, keberadaan STP sangat diperlukan untuk mendukung industri pasar modal yang lebih baik. Selain membuat keseluruhan proses transaksi menjadi lebih efisien, sistem ini juga akan meminimalisir human error serta memberikan perlindungan lebih kepada investor.

Proses ini, mampu mengurangi resiko terjadinya penyimpangan, terutama dengan sistem kontrol yang bisa dilakukan nasabah melalui kartu AKSes (acuan kepemilikan sekuritas), single investor Id serta pemisahan Rekening Dana Nasabah (RDN).

Menurut Lily, pemahaman AB terhadap sistem baru tersebut cukup baik. Mereka pun sudah mempersiapkan infrastruktur serta sistem pendukungnya.

STP direncanakan mulai bisa dilaksanakan pada pekan ini. Ketua Bapepam-LK Nurhaida mengatakan, program ini merupakan salah satu fokus regulator, guna menciptakan industri pasar modal yang lebih kuat. STP, menurut dia, merupakan
Bagian dari master plan perkembangan industri pasar modal dalam beberapa tahun ke depan, terutama dalam peningkatan infrastruktur serta persiapan menghadapi rencana integrasi pasar modal ASEAN pada 2015.

"Memang ada yang kami fokuskan. Diantaranya masa transisi penggunaan infrastruktur yang ada. Diantaranya data warehouse, SID, STP dan kartu akses. Pada semester II/2012 program itu selesai," tutur Nurhaida.

Nurhaida mengatakan saat ini sistem untuk implementasi STP sudah dimiliki dan saling terintegrasi antar ketiga lembaga penyelenggara pasar modal (self regulatory organizations). Regulator bersama ketiga SRO saat ini tengah memastikan bahwa sistem perdagangan tersebut dapat terintegrasi dengan sistem back office dari masing-masing anggota bursa.“Saat ini sistem yang terhubung dengan back office dari anggota bursa tengah dibenahi hingga seluruh sistem perdagangan di pasar modal sudah terhubung semua," kata Nurhaida.


:: Sumber http://finance.detik.com/read/2012/06/18/103145/1943692/6/broker-siap-jalankan-sistem-straight-through-processing ::

Data Warehouse

Pemanfaatan data-data historis untuk suatu organisasi menjadi sangat penting untuk pengambilan keputusan di masa mendatang.
Organisasi besar terkadang mempunyai banyak sumber data dalam berbagai sistem operasional. Adanya sistem operasional yang banyak tersebut adalah untuk menjaga performa kecepatan transaksi. Namun untuk kebutuhan pelaporan dan analisis data, akan sangat menyulitkan jika harus menelusuri satu persatu sistem operasional tersebut. Untuk mengatasi masalah tersebut, harus dirancang suatu sistem yang mempunyai kemampuan untuk mengambil data dari semua sistem operasional yang ada dan didesain khusus untuk kebutuhan pelaporan dan analisis. Untuk itulah data warehouse dibuat. Data warehouse merupakan suatu lingkungan yang terancang sebagaimana “the data warehouse is the heart of the architected environment, and is the foundation of all DSS processing “ (Inmon, 2002: 31), juga merupakan landasan untuk setiap sistem pendukung keputusan. Inmon juga mengemukakan bahwa “the data warehouse is a subject-oriented, integrated, time variant and non-volatile collection of data used in strategic decision making” (Imhoff et al., 2003: 13). Dengan demikian data warehouse sangat terkait erat dengan sistem pendukung keputusan, sebagaimana yang dikemukakan oleh Power (2005, 1) bahwa :

A data warehouse is a database designed to support a broad range of decision tasks in a specific organization. It is usually batch updated and structured for rapid online queries and managerial summaries. Data warehouses contain large amounts of historical data. The term data warehousing is often used to describe the process of creating, managing and using a data warehouse

Dengan demikian dapat disimpulkan bahwa Data Warehouse merupakan sebuah database yang didesain khusus untuk pelaporan dan analisis masa mendatang yang akan digunakan untuk proses pendukung pengambilan keputusan. Data di data warehouse diambil dari data di berbagai macam sistem operasional dengan terlebih dahulu diselaraskan sesuai kebutuhan. Setelah data masuk ke data warehouse, maka data tidak dapat diupdate dan dihapus (non-volatile) sehingga disini terlihat manfaat dari data warehouse sebagai penyimpan data historis.


Karakteristik Data Warehouse
Berdasarkan definisi yang dikemukakan Inmon tentang data warehouse, maka data warehouse mempunyai empat buah karakteristik yaitu :

1. Subject Oriented
Sebagaimana telah dijelaskan, data di dalam data warehouse didapat dari data yang ada di sistem operasional. Pada sistem operasional tersebut data diambil berdaskan aplikasi kejadian-kejadian yang ada. Sedangkan pada data warehouse data-data yang berdasarkan aplikasi kejadian tersebut dirubah menjadi data yang berdasarkan pada subjek yang terlibat pada kejadia-kejadian tersebut. Misalnya, sebuah super market pada sistem operasionalnya mencatat transaksi penjualan yang ada di setiap kasir, pembelian barang, dan penggajian karyawan. Maka data warehouse mengelompokkan data hasil kejadian-kejadian tersebut ke dalam berbagai subjek misalnya barang, karyawan, pemasukan, penggajian, dan pemasok.

2. Integrated
Data yang tersebar di banyak sistem operasional terkadang tidak beragam, baik itu penamaan field, nilai dari sebuah field, atau tipe data yang berbeda-beda untuk suatu hal yang sama. Sebagai contoh, suatu sistem operasional mendefinisikan isi dari field jenis kelamin adalah “pria” atau “wanita”, sedangkan pada sistem operasional lain field tersebut diisi dengan “laki-laki” atau “perempuan”. Hal seperti itulah yang harus diselaraskan agar data di data warehouse seragam sehingga proses analisis dapat dilakukan

3. Non-volatile
Dikarenakan data yang ada di data warehouse adalah data historis untuk kebutuhan masa mendatang, maka data yang ada tersebut bersifat non-volatile atau dengan kata lain, sekali data di-commit untuk masuk, maka data yang telah masuk tersebut tidak dapat diupdate dan dihapus.

4. Time variant
Setiap data yang masuk ke data warehouse dicatat berbagai waktunya, dimulai dari kapan data itu masuk, kapan sebuah transaksi terjadi, kapan terjadinya perubahan. Selain itu terkadang untuk menjaga performa, tabel-tabel fisik yang ada di data warehouse dapat dikelompokkan berdasarkan waktu sesuai kebutuhan analisis. Dengan adanya pencatatan dan pengelompokan waktu tersebut akan sangat membantu dalam kegiatan analisis data historis.


Manfaat Data Warehouse
Berdasarkan pada penjelasan-penjelasan tersebut di atas, dapat disebutkan bahwa penggunaan data warehouse akan memberikan berbagai manfaat, diantaranya :
  • Walaupun mahal dalam pembuatannya, namun untuk kebutuhan pelaporan dan analisis dapat lebih menghemat biaya dan waktu.
  • Dikarenakan terlebih dahulu mengisi data ke data warehouse, ketidakkonsistenan yang ada dapat diketahui dan diatasi sehingga akan mempermudah pelaporan dan analisis.
  • Data yang ada di dalam data warehouse dapat digunakan untuk sistem pendukung keputusan.
  • Data yang ada di dalam data warehouse akan tetap ada walaupun data di sistem operasional telah berubah atau dihapus



:: Referensi ::
[1] Inmon, W.H. (2002). Building the Data Warehouse third edition. Toronto : John Wiley & Sons.
[2] Imhoff, Claudia., Galemmmo, Nicholas. and Geiger, Jonathan G. (2003). Mastering Data Warehouse Design Relational and Dimensional Techniques. Indianapolis : Wiley Publishing
[3] Power, Daniel. (2005). Data-driven DSS: What do I need to know about Data Warehousing/OLAP?