What :
Big Data adalah sebuah sistem teknologi yang diperkenalkan untuk
menanggulangi 'ledakan informasi' seiring dengan semakin bertumbuhnya ekosistem
pengguna perangkat mobile dan data internet. Pertumbuhan perangkat mobile dan
data internet ternyata sangat mempengaruhi perkembangan volume dan jenis data
yang terus meningkat secara signifikan di dunia maya.
Why :
Big data merupakan bagian dari persaingan yang sulit untuk pangsa
pasar. Ancaman utamanya adalah kemampuan pesaing untuk mengumpulkan dan
menganalisis sentimen konsumen dan menghasilkan rekomendasi di seluruh
jutaan pelanggan. Pentinguntuk dicatatbahwaancaman danpeluang yang
terkaitdengan datayang besarsering memilikiimplikasiorganisasidimana
hanyadenganperhatian senioreksekutifdapatmengatasinya. Pimpinan terlalu
sedikit memahami potensi data yang besar dalam bisnis mereka, aset data dan
kewajiban dari bisnisnya, atau pilihan strategis mereka adalah harus membuat
untuk memulai memanfaatkan data yang besar.
Where : Didalam perusahaan-perusahaan besar
dan didalam Sosial Media
When :
Setiap hari, kita menciptakan 2,5 triliun byte data - begitu
banyak bahwa 90% dari data di dunia saat ini telah dibuat dalam dua tahun
terakhir saja. Data ini berasal dari mana-mana, sensor digunakan untuk
mengumpulkan informasi iklim, posting ke situs media sosial, gambar digital dan
video, catatan transaksi pembelian, dan sinyal ponsel GPS untuk beberapa nama.
Data ini adalah big data.
Who :
Perusahaan-Perusahaan yang mempunyai data yang sangat besar
setiap hari nya misalnya seperti Sosial Media, Perusahaan Sinyal GPS atau
Jaringan Ponsel
How : Bagaimana cara kerja dan
penggunaan Big Data :
IT logs Analytics
Penyimpanan Log jangka panjang, digunakan untuk analisa proses
sistem yang sedang berjalan untuk mencegah dan menaggulangi kegagalan dalam
sistem, mengunakan hasil analisa log untuk menemukan dan mentukan secara pasti
kegagalan apa yang terjadi didalam sistem, menyiapkan langkah-langkah pasti
yang dapat digunakan sebagai solusi masalah sistem.
Fraud
Detection Pattern
Banyak digunakan dalam Bidang keuangan atau dimana saja
transaksi finasial terlibat, Memaksimalkan pengunaan data-data yang ada untuk
memberikan kemampuan unutk mendeteksi fraud ketika transaksi sedang berlangsung
The
Social Media Pattern
Pengunaan Big data untuk analisa media social dan sentiment
pelangan, memberikan kemampuan bagi perusahan untuk mengetahui keinginan
customer secara luas, mendapatkan feedback secara langsung, dan mengenali
langsung dampak sentimen terhadap penjualan, serta efektivitas dan penerimaan
pelangan terhadap pemasaran yang dilakukan.
The
Call centere Mantra
Penyimpanan hasil perbincangan atau laporan customer dalam
bentuk text yang kemudian digunakan sebagai data untuk analisa masalah yang
dihadapai customer, memberikan kemampuan bagi perusahaan untuk memberikan
tanggapan yang cepat maupun secara langsung terhadap masalah yang dihadapi
customer, serta kemampuan unutk mendeteksi penurunan loyalitas customer
dikarenakan masalah dan ketidakpuasaan.
Risk:
Patterns for Modeling and Management
Memberikan kempuaan pengunaan data secara penuh dan analisis
dalam pemodelan resiko dan menejemen resiko untuk memberikan pengetahuan akan
resiko dan penanggulangannya secara tepat dan langsung
Big
data and The Energy Sector
Memberikan kemampuan penyimpanan dan pemrosesan data secara
langsung dari berbagai sumber(sensor), analisa dan kemudahan dalam
pengenalan noise untuk memisahkannya dari signal.
Pengertian
Data
(R. Kelly Rainer, 2011) Data, menunjuk pada deskripsi dasar
akan benda, event, aktivitas, dan transaksi yang terdokumentasi,
terklasifikasi,dan tersimpan tetapi tidak terorganisasi untuk dapat memberikan
suatu arti yang spesifik.
Berdasarkan
pengertian di atas, data merupakan hal paling mendasar yang dibutuhkan perusahaan
yang dapat diperoleh dari proses-proses operasional sehari-hari maupun
sumber-sumber luar yang akan diolah menurut keinginan perusahaan.
Pengertian
Information
(R. Kelly Rainer, 2011) Information, merupakan data yang
telah terorganisir agar dapat memberikan arti dan nilai kepada penerima.
Berdasarkan
pengertian di atas, hasil penyusunan dan transformasi data yang dapat
memberikan makna baru kepada data tersebut.
Pengertian
Knowledge
(R. Kelly Rainer, 2011) Terdiri dari data atau informasi
yang telah terorganisasi dan proses untuk memberikan pemahaman, pengalaman, dan
pembelajaran, serta keahlian terhadap problema bisnis yang sedang dihadapi.
Berdasarkan
pengertian di atas, knowledge menjadi sarana bagi para manajer
untuk membuat keputusan - keputusan yang crucial dan
berdampak besar bagi perusahaan, dimana kesalahan atau kecacatan dalam knowledge dapat
memberikan dampak buruk bagi perusahaan.
Pengertian Extract,
Tranform, Load (ETL) (immon liad DWH)
(H.Inmon, 2005) ETL, proses memasukkan data,
mengintergrasikan dan menempatkannya dalam data warehouse.
Berdasarkan pengertian tersebut, ETL adalah proses mengubah raw
data sebelum masuk kedalam data warehouse.
Pengertian Data
Warehouse
(R. Kelly Rainer, 2011) Data Warehouse adalah repository dari
data-data yang bersifat historical yang terorganisir
berdasarkan subjek yang digunakan untuk mendukung pengambilan keputusan. Data
warehouse memiliki beberapa karakter dasar seperti. Diatur oleh
business dimension or subject dimana data disusun berdasarkan subjeknya dan
memiliki informasi yang relevan dengan pemgambilan keputusan dan analisis
data.consistent yaitu data memliki bentuk yang sama disetiap atau disemua
database. Historical, data yang ada merupakan data yang tersimpan
dan terkumupl dalam waktu yang lama yang digunakan untuk forecasting dan
perbandingan untuk meliat tingakt laju suatu perusahaan. Use only
analytical processing menggunakan analytical processing yang
berguna unutk mengakumulasi data-data yang ada. Multidimensional, data
warehouse menyimpan data dalam lebih dari dua dimensi seperti data cube.
Data
warehouse merupakan bagian penting dalam struktur / arsitektur suatu BI karena
posisinya sebagai tempat penyimpanan data- data yang telah terorganisasi dan
yang telah memiliki makna, maka harus memilki struktur data desain yang baik
yang dapat mensupport pengambilan data-data dan informasi secara akurat dan
cepat dari dalam data warehouse itu sendiri.
Pengertian Big Data
Menurut (Eaton,
Dirk, Tom, George, & Paul) Big Data merupakan istilah yang
berlaku untuk informasi yang tidak dapat diproses atau dianalisis menggunakan
alat tradisional.
Menurut (Dumbill,
2012) , Big Data adalah data yang melebihi proses kapasitas dari kovensi
sistem database yang ada. Data terlalu besar dan terlalu cepat atau tidak
sesuai dengan struktur arsitektur database yang ada. Untuk mendapatkan nilai
dari data, maka harus memilih jalan altenatif untuk memprosesnya.
Berdasarkan
pengertian para ahli di atas, dapat disimpulkan bahwa Big Data adalah data yang
memiliki volume besar sehingga tidak dapat diproses menggunakan alat
tradisional biasa dan harus menggunakan cara dan alat baru untuk mendapatkan
nilai dari data ini.
Bab 3
Pembahasan
3.1 Big Data
Setiap hari, kita menciptakan 2,5 triliun byte data - begitu
banyak bahwa 90% dari data di dunia saat ini telah dibuat dalam dua tahun
terakhir saja. Data ini berasal dari mana-mana, sensor digunakan untuk
mengumpulkan informasi iklim, posting ke situs media sosial, gambar digital dan
video, catatan transaksi pembelian, dan sinyal ponsel GPS untuk beberapa nama.
Data ini adalah big data.
Big Data mengacu pada dataset yang ukurannya diluar kemampuan dari
database software tools untuk meng-capture, menyimpan,me-manage dan
menganalisis. Definisi ini sengaja dibuat subjective agar mampu digabungkan
oleh definisi Big Data yang masi belum ada baku. Ukuran big data sekitar beberapa
lusin TeraByte sampai ke beberapa PetaByte tergantung jenis Industri
Isi dari Big Data adalah Transaksi+interaksi dan observasi atau
bisa di bilang segalanya yang berhubungan dengan jaringan internet, jaringan
komunikasi, dan jaringan satelit
Big Data dapat juga didefinisikan
sebagai sebuah masalah domain dimana teknologi tradisional seperti relasional database tidak mampu
lagi untuk melayani.
Big data lebih dari hanya masalah ukuran, itu adalah kesempatan untuk
menemukan wawasan dalam jenis baru dan muncul data dan konten, untuk membuat
bisnis Anda lebih gesit, dan menjawab pertanyaan yang sebelumnya dianggap di
luar jangkauan Anda.
Big data dapat di artikan kedalam 9
karakter (IBM) menurut responden sehingga disimpulkan oleh IBM, Big
data adalah data yang memiliki scope informasi yang sangat besar, model
informasi yang real-time, memiliki volume yang besar, dan berasalkan social
media data jadi dapat disimpulkan bahwa Big data adalah dataset yang memiliki
volume besar dan salah satu isinya berdasarkan social media data, dan informasi
dari Big data selalu yang terbaru (latestdata) sehingga model informasi nya
real-time, dan scope informasi nya tidak terfocus pada industri-indrustri kecil
saja atau industri-indrustri besar saja melainkan semuanya baik industry kecil
maupun besar.
3.2 Dimensi
-Dimensi Big Data
Ada 3 dimensi awal dalam Big Data yaitu 3V: Volume, Variety dan
Velocity
· Volume
perusahaan tertimbun dengan data yang terus tumbuh dari semua
jenis sektor, dengan mudah mengumpulkan terabyte bahkan petabyte-informasi.
Ø Mengubah 12 terabyte Tweet dibuat setiap hari ke
dalam peningkatan sentimen analisis produk.
Ø Mengkonvert 350 milliar pembacaan tahunan untuk
lebih baik dalam memprediksi kemampuan beli pasar.
Mungkin karakteristik ini yang paling mudah dimengerti karena
besarnya data. Volume juga mengacu pada jumlah massa data, bahwa organisasi
berusaha untuk memanfaatkan data untuk meningkatkan pengambilan keputusan yang
banyak perusahaan di banyak negara. Volume data juga terus meningkat dan belum
pernah terjadi sampai sethinggi ini sehingga tidak dapat diprediksi jumlah
pasti dan juga ukuran dari data sekitar lebih kecil dari petabyte sampai
zetabyte. Dataset big data sekitar 1 terabyte sampai 1 petabyte perperusahaan
jadi jika big data digabungkan dalam sebuah organisasi / group perusahaan
ukurannya mungkin bisa sampai zetabyte dan jika hari ini jumlah data sampai
1000 zetabyte, besok pasti akan lebih tinggi dari 1000 zetabyte.
· Variety :
Volume data yang banyak tersebut bertambah dengan
kecepatan yang begitu cepat sehingga sulit bagi kita untuk mengelola hal
tersebut. Kadang-kadang 2 menit sudah menjadi terlambat. Untuk proses dalam
waktu sensitif seperti penangkapan penipuan, data yang besar harus digunakan
sebagai aliran ke dalam perusahaan Anda untuk memaksimalkan nilainya.
Ø Meneliti 5 juta transaksi yang dibuat setiap hari
untuk mengidentifikasi potensi penipuan
Ø Menganalisis 500 juta detail catatan panggilan
setiap hari secara real-time untuk memprediksi gejolak pelanggan lebih cepat.
Berbagai jenis data dan sumber data. Variasi adalah tentang
mengelolah kompleksitas beberapa jenis data, termasuk structured data,
unstructured data dan semi-structured data. Organisasi perlu mengintegrasikan
dan menganalisis data dari array yang kompleks dari kedua sumber informasi
Traditional dan non traditional informasi, dari dalam dan luar perusahaan.
Dengan begitu banyaknya sensor, perangkat pintar (smart device) dan teknologi
kolaborasi sosial, data yang dihasilkan dalam bentuk yang tak terhitung
jumlahnya, termasuk text, web data, tweet, sensor data, audio,
video, click stream, log file dan banyak lagi.
· Velocity :
Big Data adalah setiap jenis data - data baik
yang terstruktur maupun tidak terstruktur seperti teks, data sensor, audio,
video, klik stream, file log dan banyak lagi. Wawasan baru ditemukan ketika
menganalisis kedua jenis data ini bersama-sama.
· Memantau 100 video masukan langsung
dari kamera pengintai untuk menargetkan tempat tujuan.
· Mengeksploitasi 80% perkembangan data
dalam gambar, video, dan dokumen untuk meningkatkan kepuasan pelanggan.
Data dalam
gerak. Kecepatan di mana data dibuat, diolah dan dianalisis terus menerus.
Berkontribusi untuk kecepatan yang lebih tinggi adalah sifat penciptaan data
secara real-time, serta kebutuhan untuk memasukkan streaming data ke dalam
proses bisnis dan dalam pengambilan keputusan. Dampak Velocity latency, jeda
waktu antara saat data dibuat atau data yang ditangkap, dan ketika
itu juga dapat diakses. Hari ini, data terus-menerus dihasilkan pada kecepatan
yang mustahil untuk sistem tradisional untuk menangkap, menyimpan dan
menganalisis. Jenis tertentu dari data harus dianalisis secara real time untuk
menjadi nilai bagi bisnis.
3.3 Dimensi
Ketidakpastian data
Dalam industri untuk meningkatan sebuah data lebih berkualitas
dibutuhkan dimensi ke empat yaitu Veracity, pencantuman Veracity dapat
menekankan pengelolahan dan penanganan untuk suatu ketidakpastian yang melekat
dalam beberapa jenis data.
Daftar Pustaka
Dumbill, E.
(2012). Big Data Now Current Perspective. O'Reilly Media.
Eaton, C., Dirk, D., Tom, D., George, L., & Paul, Z.
(n.d.). Understanding Big Data. Mc Graw Hill.
Global Pulse. (2012). Big Data for
Development:Challenges & Opportunities. Global Pulse.
H., I. (2006). METADATA – CENTRALIZED AND DISTRIBUTED IN DW2.0.
3-5.
H.Immon, W. (2005). Building the Data Warehouse, 4th
Edition. Indianapolis, Indiana: Wiley Publishing, Inc.
IBM. (n.d.). Analytics: The real-world use of big data.
Retrieved from How innovative enterprisesextractvalue from uncertain data:
http://www-935.ibm.com/services/us/gbs/thoughtleadership/ibv-big-data-at-work.html
R. Kelly Rainer, C. (2011). Introduction to Information
Systems. John Wiley & Sons (Asia) Pte Ltd.
Sun, H., & Heller, P. (2012). Oracle Information
Architecture. Oracle Information Architecture.
Referensi
http://www-01.ibm.com/common/ssi/cgi-bin/ssialias?subtype=BK&infotype=PM&appname=SWGE_IM_DD_USEN&htmlfid=IMM14100USEN&attachment=IMM14100USEN.PDF
http://www.mckinsey.com/~/media/McKinsey/dotcom/Insights%20and%20pubs/MGI/Research/Technology%20and%20Innovation/Big%20Data/MGI_big_data_full_report.ashx
http://www.mckinsey.com/~/media/McKinsey/dotcom/Insights%20and%20pubs/MGI/Research/Technology%20and%20Innovation/Big%20Data/MGI_big_data_full_report.ashx
http://www-935.ibm.com/services/us/gbs/thoughtleadership/ibv-big-data-at-work.html
Anggota Kelompok : Bayu Fajar Ramadhan (1402011007)
Rizky Saputra (1402012078)
Anggota Kelompok : Bayu Fajar Ramadhan (1402011007)
Rizky Saputra (1402012078)
0 comments:
Post a Comment