data warehouse kelompok 1

25
Data Warehouse Nama : ~ Andrie Dwi Cahyo (1A111435) ~ Cita Patsiana C (1A111524) ~ Fadli Akbar (1A111437) ~ Rian Wibowo (1A111381) ~ Tika Desti W (1A111376) Kelas : 4KA27

Upload: rian-wibowo

Post on 27-Oct-2015

255 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Data Warehouse Kelompok 1

Data Warehouse

Nama : ~ Andrie Dwi Cahyo (1A111435) ~ Cita Patsiana C (1A111524) ~ Fadli Akbar (1A111437) ~ Rian Wibowo (1A111381) ~ Tika Desti W (1A111376)

Kelas : 4KA27

Universitas Gunadarma

Page 2: Data Warehouse Kelompok 1

Daftar Isi

Daftar Isi.......................................................................................................................2

1. Konsep dan Arsitektur Data Warehouse.................................................................31.1 Pengertian Data

Warehouse………………………………………………………………………………31.2 Istilah-istilah yang Berhubungan dengan Data

Warehouse……………………………………31.3 Karakteristik Data

Warehouse……………………………………………………………………………41.4 Perlunya Data

Warehouse…………………………………………………………………………………61.5 Tugas-tugas Data

Warehouse……………………………………………………………………………61.6 Keuntungan Data

Warehouse…………………………………………………………………………….71.7 Arsitektur Data

Warehouse………………………………………………………………………………..81.8 Arsitektur Dua

Peringkat……………………………………………………………………………………81.9 Arsitektur Data Warehouse yang

Diperluas………………………………………………………….91.10 Arsitektur Data Tiga

Lapis……………………………………………………………………………….101.11 Aturan Model Data

Organisasi………………………………………………………………………….111.12 Aturan

Metadata…………………………………………………………………………………………….11

2. Alur Data Warehouse............................................................................................11

3. Teknologi dan Peralatan Data Warehouse………………………………………………..12

4. Metodelogi Perancangan Basis Data Warehouse……………………………………….13

5. Perancangan Data Warehouse……………………………………………………………….14

6. Bahasa Query pada Data Warehouse………………………………………………………15

2

Page 3: Data Warehouse Kelompok 1

7. Penggunaan Oracle untuk Data Warehouse……………………………………………..16

Kesimpulan…………………………………………………………………………………………….19

Daftar Pustaka………………………………………………………………………………………...20

1. Konsep dan Arsitektur Data Warehouse

1.1 Pengertian Data Warehouse

Pengertian Data Warehouse dapat bermacam-macam namun mempunyai inti yang sama, seperti pendapat beberapa ahli berikut ini :

Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management.

Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.

Menurut Paul Lane, data warehouse merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi menggabung/konsolidasi data dari berbagai macam sumber.

Jadi, data warehouse merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah

3

Page 4: Data Warehouse Kelompok 1

database, tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.

Dari definisi-definisi yang dijelaskan tadi, dapat disimpulkan data warehouse adalah database yang saling bereaksi yang dapat digunakan untuk query dan analisisis, bersifat orientasi subjek, terintegrasi, time-variant,tidak berubah yang digunakan untuk membantu para pengambil keputusan.

1.2 Istilah-istilah yang berhubungan dengan data warehouse

Istilah-istilah yang berkaitan dengan data warehouse : 1. Data Mart

Adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan.

2. On-Line Analytical Processing (OLAP) Merupakan suatu pemrosesan database yang menggunakan tabel

fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan, analisis, query dari data yang berukuran besar.

3. On-Line Transaction Processing(OLTP)Merupakan suatu pemrosesan yang menyimpan data mengenai

kegiatan operasional transaksi sehari-hari.

4. Dimension TableTabel yang berisikan kategori dengan ringkasan data detail yang

dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi waktu(yang berupa perbulan, perkwartal dan pertahun).

5. Fact TableMerupakan tabel yang umumnya mengandung angka dan data

history dimana key (kunci) yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign key (kunci asing) yang merupakan primary key (kunci utama) dari beberapa dimension table yang berhubungan.

6. DSSMerupkan sistem yang menyediakan informasi kepada pengguna

yang menjelaskan bagaimana sistem ini dapat menganalisa situasi dan mendukung suatu keputusan yang baik.

1.3 Karakteristik Data Warehouse

Karakteristik data warehouse menurut Inmon, yaitu :1. Subject Oriented (Berorientasi subject)

4

Page 5: Data Warehouse Kelompok 1

Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu.

Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers,products dan sales) dan tidak diorganisasikan pada area-area aplikasi utama(customer invoicing,stock control dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data.

Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses. Secara garis besar perbedaan antara data operasional dan data warehouse yaitu :

Data Operasional Data Warehouse

Dirancang berorientasi hanya pada aplikasi dan fungsi tertentu

Dirancang berdasar pada subjek-subjek tertentu(utama)

Focusnya pada desain database dan proses

Focusnya pada pemodelan data dan desain data

Berisi rincian atau detail data Berisi data-data history yang akan dipakai dalam proses analisis

Relasi antar table berdasar aturan terkini(selalu mengikuti rule(aturan) terbaru)

Banyak aturan bisnis dapat tersaji antara tabel-tabel

2. Integrated (Terintegrasi)

Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri.

Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable, konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data.

Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.

5

Page 6: Data Warehouse Kelompok 1

3. Time-variant (Rentang Waktu)

Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain :

Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.

Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.

Cara yang ketiga,variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.

4. Non-Volatile

Karakteristik keempat dari data warehouse adalah non-volatile,maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.

Berbeda dengan database operasional yang dapat melakukan update,insert dan delete terhadap data yang mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).

1.4 Perlunya Data Warehouse

Seperti pengertian-pengertian yang kita sebutkan sebelumnya, data warehouse diperlukan bagi para pengambil keputusan manajemen dari suatu organisasi/perusahaan.

Dengan adanya data warehouse, akan mempermudah pembuatan aplikasi-aplikasi DSS dan EIS karena memang kegunaan dari data warehouse adalah khusus untuk membuat suatu database yang dapat digunakan untuk mendukung proses analisa bagi para pengambil keputusan.

6

Page 7: Data Warehouse Kelompok 1

1.5 Tugas-tugas Data warehouse

Ada empat tugas yang bisa dilakukan dengan adanya data warehouse. Menurut Williams, keempat tugas tersebut yaitu:

a. Pembuatan laporanPembuatan laporan merupakan salah satu kegunaan data

warehouse yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari,perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.

b. On-Line Analytical Processing (OLAP)Dengan adanya data warehouse,semua informasi baik detail

maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat.

OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL. Hal ini dimungkinkan karena pada konsep multi dimensi, maka data yang berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain yang ada pada sofware OLAP adalah fasilitas rool-up dan drill-down. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah kebalikannya.

c. Data miningData mining merupakan proses untuk menggali(mining)

pengetahuan dan informasi baru dari data yang berjumlah banyak pada data warehouse, dengan menggunakan kecerdasan buatan (Artificial Intelegence), statistik dan matematika. Data mining merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data dan pemakainya.

d. Proses informasi executiveData warehouse dapat membuat ringkasan informasi yang penting

dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan menggunakan data warehouse segala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga mempermudah proses pengambilan keputusan. Informasi dan data pada laporan data warehouse menjadi target informative bagi user.

1.6 Keuntungan Data Warehouse

Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk penyimpanan data yang

7

Page 8: Data Warehouse Kelompok 1

homogen dan terpisah. Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini :

Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.

Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.

Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.

Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.

Membangun data warehouse tentu saja memberikan keuntungan lebih bagi suatu perusahaan, karena data warehouse dapat memberikan keuntungan strategis pada perusahaan tersebut melebihi pesaing-pesaing mereka. Keuntungan tersebut diperoleh dari beberapa sumber (Sean Nolan,Tom Huguelet):

Kemampuan untuk mengakses data yang besar Kemampuan untuk memiliki data yang konsistent Kemampuan kinerja analisa yang cepat Mengetahui adanya hasil yang berulang-ulang Menemukan adanya celah pada business knowledge atau business

process. Mengurangi biaya administrasi Memberi wewenang pada semua anggota dari perusaahan dengan

menyediakan kepada mereka informasi yang dibutuhkan agar kinerja bisa lebih efektif.

1.7 Arsitektur Data Warehouse

Arsitektur dasar yang sering digunakan bersama data warehouse adalah, yang pertama: arsitektur fisik 2 peringkat untuk pemasukan data; kedua,arsitektur 3 peringkat yang penggunaanya semakin popular pada lingkungan yang lebih kompleks; terakhir, arsitektur data 3 peringkat yang berasosiasi dengan arsitektur fisik 3 peringkat.

8

Page 9: Data Warehouse Kelompok 1

Gambar arsitektur dasar data warehouse

1.8 Arsitektur Dua Peringkat

Arsitektur dasar untuk data warehouse diperlihatkan dalam di atas. Mengembangkan arsitektur data warehouse dasar ini membutuhkan 4 langkah yang utama, yaitu :

1. Data di ekstrasi dari berbagai sumber daya berkas system dan dari berbagai basis data. Pada organisasi besar hal ini mungkin melibatkan lusinan atau bahkan ratusan berkas dan basis data.

2. Data dari berbagai sumber ditransformasikan dan diintegrasikan sebelum dimuat ke data warehouse.

3. Data warehouse merupakan basis data yang hanya bisa dibaca (read-only), yang terorganisasi dengan baik untuk mendukung aplikasi-aplikasi pengambilan keputusan. Ia memuat baik data rinci maupun data yang sudah diikhtisarkan.

4. Pengguna mengakses data warehouse dengan berbagai bahasa query dan kakas analitis.

1.9 Arsitektur Data Warehouse Yang Diperluas

Arsitektur yang diperlihatkan dalam Gambar di atas menampilkan aplikasi data warehouse dalam bentuknya yang paling awal dan paling sederhana, namun masih banyak digunakan saat ini di organisasi-organisasi yang berskala relative kecil. Ia bekerja dengan baik pada perusahaan berskala kecil hingga menengah dengan jumlah perangkat keras dan perangkat lunak yang relative sedikit dalam lingkungan komputasi yang relative homogen. Bagaimanapun juga, untuk perusahaan yang lebih besar

9

Page 10: Data Warehouse Kelompok 1

dengan sumberdaya data yang banyak dan dalam lingkungan komputasi yang heterogen,pendekatan ini menimbulkan banyak masalah dalam hal pemeliharaan kualitas data dan pengelolaan proses ekstrasi data. Masalah-masalah ini, bersama dengan kecenderungan komputasi tersebar, memicu perkembangan lebih lanjut arsitektur data warehouse seperti yang diperlihatkan dalam gambar 12.4 di bawah. Arsitektur yang diperlihatkan pada Gambar di bawah dirujuk sebagai arsitektur 3 peringkat, dimana ketiga peringkat itu adalah:

1. Sistem operasional dan data.2. Data warehouse tingkat perusahaan.3. Data mart.

Gambar arsitektur 3 peringkat

EDW (Enterprise Data Warehouse) adalah data warehouse terpusat dan terintegrasi yang mengendalikan sumberdaya data tunggal yang tersedia bagi para pengguna untuk digunakan sebagai sarana bagi aplikasi-aplikasi pendukung keputusa. Dua fungsi utma EDW adalah: EDW bertindak sebagai titik kendali untuk memastikan kualitas dan

integritas data sebelum menjadikannya tersedia bagi para pengguna. Ia menyediakan rekaman data bisnis bersejarah, untuk data yang peka

terhadap waktu (time sensitive).

10

Page 11: Data Warehouse Kelompok 1

Meskipun data warehouse adalah sumberdaya tunggal yang digunakan sebagi data untuk aplikasi-aplikasi pengambilan keputusan, biasanya ia tidak secara langsung diakses oleh pengguna. Secara sederhana, data warehouse terlalu besar dan terlalu rumit untuk aplikasi-aplikasi pengambilan keputusan. Alih-alihnya, pengguna mengakses data mart yang merupakan data-data yang diturunkan/diikhtisarkan dari data warehouse.

1.10 Arsitektur Data Tiga Lapis

Gambar di bawah memperlihatkan arsitektur 3 lapis, yang masing-masing dapat dijelaskan sebagai berikut :

Data operasional disimpan dalam berbagai platform sistem operasi di seluruh bagian organisasi (dan kadang di system eksternal).

Data rekonsiliasi adalah tipe data yang tersimpan di data warehouse milik perusahaan.

Data turunan adalah tipe data yang tersimpan di setiap data mart.

Gambar Arsitektur data 3 Lapis

Data rekonsiliasi bersifat rinci, merupakan data menurut waktu yang didedikasikan sebagai data tunggal untuk semua aplikasi pendukung keputusan. Data rekonsiliasi secara umum bukan ditujukan untuk diakses secara langsung oleh pengguna. Data turunan adalah data yang telah dipilih, diformat, dan diagresi untuk aplikasi pendukung pengambilan keputusan. Dua komponen yang diperlihatkan dalam Gambar di atas memainkan peran kritis pada arsitektur data; mereka adalah model data perusahaan dan metadata-metadata yang digambarkan pada bagian kanan Gambar berurutan dari atas ke bawah.

1.11 Aturan Model Data Organisasi

Pada Gambar di atas kita melihat lapisan data rekonsiliasi dikaitkan dengan model data perusahaan. Model data perusahaan, seperti mencakup gambaran utuh tentang data-data yang dibutuhkan oleh perusahaan. Jika lapisan data rekonsiliasi adalah tunggal, merupakan sumber yang sah untuk semua data yang dibutuhkan untuk aplikasi-aplikasi pendukung pengambilan keputusan. Ia harus menyesuaikan diri pada model perancangan yang

11

Page 12: Data Warehouse Kelompok 1

dispesifikasikan dalam model data perusahaan. Maka organisasi-organisasi perlu mengembangkan model data perusahaan mereka sebelum mereka merancang data warehouse yang akan dikonstruksi gagal dalam memenuhi kebutuhan-kebutuhan pengguna.

1.12 Aturan Metadata

Gambar diatas juga memperlihatkan lapisan meta data yang terkait pada 3 lapisan data yang lain. Metadata adalah data yang menjelaskan properti-properti atau karakteristik-karakteristik dari data yang lain. Berikut ini adalah deskripsi dari 3 jenis metadata yang diperlihatkan pada Gambar di atas.

1. Metadata Operasional. Metadata operasional mendeskripsikan data pada berbagai system operasional (juga data eksternal) yang dibutuhkan data warehouse milik perusahaan. Metadata operasional umumnya ada dalam beberapa format yang berbeda dan sayangnya sering sekali berkualitas rendah.

2. Metadata Data Warehouse Perusahaan (EDW – Enterprise Data Warehouse). EDW diturunkan dari (paling tidak konsisten dengan) model data perusahaan. Metadata EDW mendeskripsikan lapisan data rekonsiliasi sebagai aturan untuk mentransformasikan data operasional ke data rekonsiliasi.

3. Metadat Data Mart. Meta data ini mendeskripsikan lapisan data rekonsiliasi ke data turunan.Update

2. Alur Data Warehouse

Data Warehouse memiliki 2 sumber data, yaitu Data Operasional dalam organisasi misalnya basis data pelanggan dan produk. Kemudian sumber kedua berasal dari sumber eksternal yang diperoleh misalnya melalui internet, basis data komersial, basis data pemasok atau pelanggan.

Berbagai data dari berbagai sumber yang ada kemudian digabungkan dan diproses lebih lanjut oleh manajer data warehouse dan disimpan dalam basis data tersendiri. Dan data yang ada dalam data warehouse memiliki beberapa alur data, yaitu:

a. InflowMerupakan proses pengektrasian, pembersihan dan juga pemuatan sumber

data.

b. UpflowYaitu Menambahkan nilai data ke dalam warehouse melalui ringkasan, pemaketan data, dan juga pendistribusian data.

c. DownflowYaitu pengarsipan dan backup data ke dalam data warehouse.

d. Outflow

12

Page 13: Data Warehouse Kelompok 1

Yaitu membuat data agar dapat tersedia bagi pemakai akhir atau dapat disebut End User.

e. Meta-flowYaitu untuk pengaturan meta-data.

Langkah selanjutnya Data yang berada dalam data warehouse akan digali untuk mencari pola yang menarik dari data warehouse tersebut oleh Data Mining.

Kemudian hasil olahan dari data mining akan kembali dimasukkan ke dalam data warehouse, untuk dapat digunakan kembali oleh pihak lain.

Setelah mendapatkan pola yang menarik di dalam data warehouse, maka akan dianalisa dengan bantuan OLAP. Dan data akan dikembalikan ke dalam data warehouse untuk digunakan kembali.

Setelah melalui proses OLAP maka data yang ada dalam data warehouse oleh manager data warehouse akan dilaksanakan proses Outflow sehingga data tersebut telah siap digunakan.

Data yang telah siap digunakan tersebut akan dipakai Oleh EIS dengan dukungan berbagai perangkat , seperti: perangkat EIS, perangkat pelaporan, dan juga perangkat pengembangan aplikasi. Dan melalui EIS juga data telah siap digunakan bagi pihak Eksekutif (End User).

3. Teknologi dan Peralatan Data Warehouse

Peralatan dan teknologi Data Warehouse

1. Ekstraksi, pembersihan, dan alat-alat transformasi  2. Data warehouse DBMS3. Data warehouse Meta-data4. Administrasi dan Manajemen Peralatan

Peralatan untuk pengekstrasian, pembersihan, dan transformasi :

Code generatorMembuat program transformasi 3GL/4GL yang dapat disesuaikan

berdasarkan sumber dan target pendefinisian data. Data Warehouse 13/20 Sistem Basis Data Lanjut.

Database data replication toolsMenggunakan database trigger dan recovery log untuk mereka perubahan

terhadap sumber data tunggal pada satu sistem dan mengunakan perubahan tsb kesuatu salinan sumber data yang dialokasikan pada sebuah sistem yang berbeda.

Dynamic transformation engines

13

Page 14: Data Warehouse Kelompok 1

Merekam data dari sumber sistem pada interval yang telah definisikan pemakai, mentransformasikan data kemudian mengirim dan memuat hasilnya kedalam target lingkungan

4. Metodelogi Perancangan Basis Data Warehouse

Menurut Kimball ada sembilan tahap metodologi dalam perancangan database untuk data warehouse, yaitu :

Langkah 1 : Pemilihan proses

Data mart yang pertama kali dibangun haruslah data mart yang dapat dikirim tepat waktu dan dapat menjawab semua pertanyaan bisnis yang penting.

Pilihan terbaik untuk data mart yang pertama adalah yang berhubungan dengan sales, misal property sales, property leasing,property advertising.

Langkah 2 : Pemilihan sumber

Untuk memutuskan secara pasti apa yang diwakili atau direpresentasikan oleh sebuah tabel fakta.

Misal, jika sumber dari sebuah tabel fakta properti sale adalah properti sale individual maka sumber dari sebuah dimensi pelanggan berisi rincian pelanggan yang membeli properti utama

Langkah 3 : Mengidentifikasi dimensi

Set dimensi yang dibangun dengan baik, memberikan kemudahan untuk memahami dan menggunakan data mart

Dimensi ini penting untuk menggambarkan fakta-fakta yang terdapat pada tabel fakta

Misal, setiap data pelanggan pada tabel dimensi pembeli dilengkapi dengan id_pelanggan,no_pelanggan,tipe_pelanggan,tempat_tinggal, dan lain sebagainya.

Jika ada dimensi yang muncul pada dua data mart,kedua data mart tersebut harus berdimensi sama,atau paling tidak salah satunya berupa subset matematis dari yang lainnya.

Jika sebuah dimensi digunakan pada dua data mart atau lebih,dan dimensi ini tidak disinkronisasi,maka keseluruhan data warehouse akan gagal, karena dua data mart tidak bisa digunakan secara bersama-sama

Langkah 4 : Pemilihan fakta

Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa digunakan dalam data mart.

Semua fakta harus diekspresikan pada tingkat yang telah ditentukan oleh sumber

Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta

Hal ini terjadi apabila fakta kehilangan statement

14

Page 15: Data Warehouse Kelompok 1

Langkah 6 : Melengkapi tabel dimensi

Pada tahap ini kita menambahkan keterangan selengkap-lengkapnya pada tabel dimensi

Keterangannya harus bersifat intuitif dan mudah dipahami oleh pengguna

Langkah 7 : Pemilihan durasi database

Misalnya pada suatu perusahaan asuransi, mengharuskan data disimpan selama 10 tahun atau lebih

Langkah 8 : Menelusuri perubahan dimensi yang perlahan

Ada tiga tipe perubahan dimensi yang perlahan, yaitu : o Tipe 1. Atribut dimensi yang telah berubah tertulis ulango Tipe 2. Atribut dimensi yang telah berubah menimbulkan sebuah

dimensi baruo Tipe 3. Atribut dimensi yang telah berubah menimbulkan alternatif

sehingga nilai atribut lama dan yang baru dapat diakses secara bersama pada dimensi yang sama.

Langkah 9 : Menentukan prioritas dan mode query

Pada tahap ini kita menggunakan perancangan fisik.

Dengan langkah-langkah tadi, seharusnya kita bisa membangun sebuah data warehouse yang baik.

5. Perancangan Data Warehouse

Petunjuk membangun data warehouse :

• Menentukan misi dan sasa-ran bisnis bagi pembentukan data warehouse.

• Mengidentifikasi data dari basis data operasional dan sumber lain yang diperlukan bagi data warehouse.

• Menentukan item-item data dalam perusahaan dengan melakukan standarisasi pena maan data dan artinya

• Merancang basis data untuk data warehouse • Membangun kebijakan dalam mengarsipkan data lama sehingga ruang

penyimpanan tak menjadi terlalu besar dan agar pengambilan keputusan tidak menjadi terlalu lamban.

• Menarik data produksi (operasional) dan meletakkan ke basis data milik data warehouse

15

Page 16: Data Warehouse Kelompok 1

6. Bahasa Query pada Data Warehouse

Bahasa Query Formal SQL (Structure Query Language) merupakan Bahasa pemrograman basis

data relasional. SQL merupakan bahasa query yang paling banyak dipilih oleh DBMS dan Development Tools. Contoh : Visual Basic, Delphi, PowerBuilder, Java dll. Ekspresi dasar SQL terdiri dari 3 klausa , yaitu :

1. Klausa Select , digunakan untuk menetapkan daftar atribut (field) yang diinginkan sebagai hasil query.

2. Klausa From, digunakan untuk menetapkan relasi atau tabel (atau gabungan tabel) yang akan ditelusuri selama query data dilakukan.

3. Klausa Where, sifatnya opsional yang digunakan sebagai predikat (kriteria) yang harus dipenuhi dalam memperoleh hasil query

a. KLAUSA SELECT

Sintaksnya adalah : Select A1 [A2, A3….An] From T1 [T2….Tm] [where P]

Dimana : 

A1, A2…An merupakan daftar atribut T1, T2…Tm merupakan daftar tabel atau relasi.

P merupakan predikat Query. n[ ] merupakan tanda opsional (boleh digunakan, boleh tidak digunakan), tergantung kebutuhan.

Klausa Select berorientasi pada operasi projection dalam bahasa query Formal. Contohnya adalah Tampilkan nim, nama dari tabel mahasiswa. Dalam ekspresi aljabar : project nim, nama (mahasiswa) 

Dimana dalam perintah query adalah : SELECT nim, nama FROM mahasiswa 

b. KLAUSA WHERE

Klausa Where digunakan untuk menetapkan predikat kriteria yang harus dipenuhi dalam memperoleh hasil query. Contohnya adalah : Tampilkan mahasiswa dengan nim, nama dari tabel mahasiswa dengan nim = 098010024Dalam Ekspresi aljabar : project nim, nama (select nim = ‘0980100024’ ( mahasiswa ) ) 

Dimana dalam perintah Query adalah : SELECT nim, nama 

16

Page 17: Data Warehouse Kelompok 1

FROM mahasiswa WHERE nim = ‘0980100024 

c. KLAUSA FROM

Klausa From digunakan untuk menetapkan tabel yang kita jadikan sebagai sumber (lokasi) pencarian. ContohNYA ADALAH : Select * From kuliah, dosen Where kuliah.kode_dos = dosen.kode_dos 

Pengurutan Hasil QueryDengan menggunakan ekspresi dasar SQL maka hasil query ditampilkan dengan urutan yang sesuai dengan struktur penyimpanan yang kita terapkan pada tabel query. Dimana Contohnya adalah : 

Select * from mahasiswa order by nama_mhs 

Fungsi AgregatDisamping menampilkan nilai-nilai atribut yang ada di dalam tabel, sering pula ada kebutuhan untuk menampilkan data-data agresi seperti :  banyaknya record, total nilai suatu atribut, rata-rata nilai atribut, nilai atribut terbesar ataupu nilai atribut terkecil.Data Agregat dapat di peroleh dengan menggunakan fungsi-fungsi sbb : 1. Count 2. Sum 3. Avg 4. Max 5. Min

7. Penggunaan Oracle untuk Data Warehouse

Oracle Warehouse Builder atau OWB ialah seperangkat alat komperhensif bagi praktisi yang memindahkan dan men-transformasikan data, mengembangkan dan melakukan implementasi terhadap sistem BI, melakukan manajemen terhadap metadata, dan membuat dan mengatur database Oracle beserta metadatanya [Ste04].

Oracle Warehouse Builder (OWB) membantu tahap pengembangan dari data transak- si ke data warehouse dengan melakukan simulasi terhadap bentuk dimensi dan cubes, sehingga pembuatan keduanya menjadi mudah untuk dilakukan. Selain itu, OWB juga memisahkan tahap perancangan dengan implementasi sehingga mempermudah proses perancangan terhadap data warehouse.

Oracle Warehouse Builder (OWB) juga membantu menjaga kerahasiaan data, karena OWB hanya menampilkan metadata dari tabel yang dirancang dan diimplementasikan. Sehingga kerahasiaan isi data dapat tetap terjaga. Untuk mendukung tahap pengembangan tersebut, OWB memiliki arsitektur yang terdiri dari design client, design repository, runtime instance, runtime access, runtime repository, dan target schema.

17

Page 18: Data Warehouse Kelompok 1

Design Client berfungsi untuk menyediakan antarmuka untuk mendefinisikan sumber dan desain dari target dan proses ETL. Bagian ini melakukan perancangan terhadap data warehouse secara terpisah dengan melakukan akses pada design repository. Jika proses perancangan telah selesai dilakukan, implementasi dapat dilakukan secara otomatis dengan melakukan deploy. Design Client dapat di-install tanpa Oracle database untuk client user.

Design Repository berisi Design Repository schema pada server yang dapat diakses oleh beberapa Design Clients. Design Repository menyimpan definisi metadata untuk seluruh sumber daya, target, dan proses ETL yang berhubungan dengan desain metadata. Metadata ini selanjutnya diimplementasi oleh Runtime Instance untuk diterapkan pada database. Isi dari Design Repository dapat diakses melalui Design Browser read only mode.

Runtime Instance dari Oracle Database ada pada server dengan tiga tipe pengguna pada target database, yaitu Runtime Access User, Runtime Repository Schema, dan Target Schema [Ste04]. Runtime Access User merupakan tipe pengguna terpisah yang tidak mempunyai privileges, namun dapat mengakses Runtime Repository Schema untuk men-deploy dan mengeksekusi proses ETL. Runtime Repository schema ialah tipe pengguna yang mengatur koneksi untuk target yang berbeda dalam Target Schema. Sedangkan Target Schema merupakan tipe pengguna yang mempunyai schema tempat data hasil proses ETL di-representasikan.

Dengan kata lain, Target Schema merupakan tempat sebenarnya untuk me-

18

Page 19: Data Warehouse Kelompok 1

load target data dan melakukan proses ETL yang mengakses paket pada Runtime Repository Schema.

Fasilitas yang disediakan Oracle untuk data warehouse :1. Summary management

Mekanisme untuk menyimpan data multi dimensi dan ringkasan perhitungan pada sebuah tabel.2. Analytical functions

Penggunaan fungsi analitikal SQL (ranking, moving aggregate,dll) untuk keperluan business intelligence dan aplikasi data warehouse.

3. Bitmapped indexes Meningkatkan kinerja yang sangat baik terhadap aplikasi data warehouse.

4. Advanced join methods Dengan partition wise-join, secara dramatis meningkat kan kinerja join yang melibat kan tabel yang telah dipartisi pada join key.

5. Sophisticated SQL optimizer Optimizer secara dinamik menentukan path dan join yang paling efisien

untuk setiap query.

6. Resource management Menyediakan pengawasan sumber-sumber sistem yang telah ditentukan pemakai.

19

Page 20: Data Warehouse Kelompok 1

Kesimpulan

• Data warehouse merupakan kumpulan data yang berorientasi subjek, terintegrasi, time-variant, dan non volatile untuk mendukung proses pengambilan keputusan.

• Sumber data untuk data warehouse : data operasional dalam organisasi, dan sumber eksternal

• Alur data warehouse : inflow, upflow, downflow, outflow, meta flow.

• Peralatan data warehouse : code generator, database data replication tools, dynamic transformation engines

20

Page 21: Data Warehouse Kelompok 1

Daftar Pustaka

http://zakki.dosen.narotama.ac.id/files/2012/.../Definisi-Data-Warehouse.dochttp://journal.mercubuana.ac.id/data/Data%20Warehouse.ppthttp://pksm.mercubuana.ac.id/new/.../files.../18030-2-132677723244.dochttp://achmadyasid.files.wordpress.com/2009/03/datawarehouse.dochttp://IlmuKomputer.com

21