Pemanfaatan data-data historis untuk suatu organisasi menjadi sangat
penting untuk pengambilan keputusan di masa mendatang.
Organisasi besar
terkadang mempunyai banyak sumber data dalam berbagai sistem
operasional. Adanya sistem operasional yang banyak tersebut adalah untuk
menjaga performa kecepatan transaksi. Namun untuk kebutuhan pelaporan
dan analisis data, akan sangat menyulitkan jika harus menelusuri satu
persatu sistem operasional tersebut. Untuk mengatasi masalah tersebut,
harus dirancang suatu sistem yang mempunyai kemampuan untuk mengambil
data dari semua sistem operasional yang ada dan didesain khusus untuk
kebutuhan pelaporan dan analisis. Untuk itulah data warehouse dibuat.
Data warehouse merupakan suatu lingkungan yang terancang sebagaimana “the data warehouse is the heart of the architected environment, and is the foundation of all DSS processing “ (Inmon, 2002: 31), juga merupakan landasan untuk setiap sistem pendukung keputusan. Inmon juga mengemukakan bahwa “the
data warehouse is a subject-oriented, integrated, time variant and
non-volatile collection of data used in strategic decision making”
(Imhoff et al., 2003: 13). Dengan demikian data warehouse sangat terkait
erat dengan sistem pendukung keputusan, sebagaimana yang dikemukakan
oleh Power (2005, 1) bahwa :
A data warehouse is a database designed to support a broad range of
decision tasks in a specific organization. It is usually batch updated
and structured for rapid online queries and managerial summaries. Data
warehouses contain large amounts of historical data. The term data
warehousing is often used to describe the process of creating, managing
and using a data warehouse
Dengan demikian dapat disimpulkan bahwa Data Warehouse merupakan
sebuah database yang didesain khusus untuk pelaporan dan analisis masa
mendatang yang akan digunakan untuk proses pendukung pengambilan
keputusan. Data di data warehouse diambil dari data di berbagai macam
sistem operasional dengan terlebih dahulu diselaraskan sesuai kebutuhan.
Setelah data masuk ke data warehouse, maka data tidak dapat diupdate
dan dihapus (non-volatile) sehingga disini terlihat manfaat dari data
warehouse sebagai penyimpan data historis.
Karakteristik Data Warehouse
Berdasarkan definisi yang dikemukakan Inmon tentang data warehouse,
maka data warehouse mempunyai empat buah karakteristik yaitu :
1. Subject Oriented
Sebagaimana telah dijelaskan, data di dalam data warehouse didapat
dari data yang ada di sistem operasional. Pada sistem operasional
tersebut data diambil berdaskan aplikasi kejadian-kejadian yang ada.
Sedangkan pada data warehouse data-data yang berdasarkan aplikasi
kejadian tersebut dirubah menjadi data yang berdasarkan pada subjek yang
terlibat pada kejadia-kejadian tersebut. Misalnya, sebuah super market
pada sistem operasionalnya mencatat transaksi penjualan yang ada di
setiap kasir, pembelian barang, dan penggajian karyawan. Maka data
warehouse mengelompokkan data hasil kejadian-kejadian tersebut ke dalam
berbagai subjek misalnya barang, karyawan, pemasukan, penggajian, dan
pemasok.
2. Integrated
Data yang tersebar di banyak sistem operasional terkadang tidak
beragam, baik itu penamaan field, nilai dari sebuah field, atau tipe
data yang berbeda-beda untuk suatu hal yang sama. Sebagai contoh, suatu
sistem operasional mendefinisikan isi dari field jenis kelamin adalah
“pria” atau “wanita”, sedangkan pada sistem operasional lain field
tersebut diisi dengan “laki-laki” atau “perempuan”. Hal seperti itulah
yang harus diselaraskan agar data di data warehouse seragam sehingga
proses analisis dapat dilakukan
3. Non-volatile
Dikarenakan data yang ada di data warehouse adalah data historis
untuk kebutuhan masa mendatang, maka data yang ada tersebut bersifat
non-volatile atau dengan kata lain, sekali data di-commit untuk masuk,
maka data yang telah masuk tersebut tidak dapat diupdate dan dihapus.
4. Time variant
Setiap data yang masuk ke data warehouse dicatat berbagai waktunya,
dimulai dari kapan data itu masuk, kapan sebuah transaksi terjadi, kapan
terjadinya perubahan. Selain itu terkadang untuk menjaga performa,
tabel-tabel fisik yang ada di data warehouse dapat dikelompokkan
berdasarkan waktu sesuai kebutuhan analisis. Dengan adanya pencatatan
dan pengelompokan waktu tersebut akan sangat membantu dalam kegiatan
analisis data historis.
Manfaat Data Warehouse
Berdasarkan pada penjelasan-penjelasan tersebut di atas, dapat
disebutkan bahwa penggunaan data warehouse akan memberikan berbagai
manfaat, diantaranya :
- Walaupun mahal dalam pembuatannya, namun untuk kebutuhan pelaporan dan analisis dapat lebih menghemat biaya dan waktu.
- Dikarenakan terlebih dahulu mengisi data ke data warehouse,
ketidakkonsistenan yang ada dapat diketahui dan diatasi sehingga akan
mempermudah pelaporan dan analisis.
- Data yang ada di dalam data warehouse dapat digunakan untuk sistem pendukung keputusan.
- Data yang ada di dalam data warehouse akan tetap ada walaupun data di sistem operasional telah berubah atau dihapus
:: Referensi ::
[1] Inmon, W.H. (2002). Building the Data Warehouse third edition. Toronto : John Wiley & Sons.
[2] Imhoff, Claudia., Galemmmo, Nicholas. and Geiger, Jonathan G.
(2003). Mastering Data Warehouse Design Relational and Dimensional
Techniques. Indianapolis : Wiley Publishing
[3] Power, Daniel. (2005). Data-driven DSS: What do I need to know about Data Warehousing/OLAP?