Trend Big Data dan Implikasinya
A
A
A
Hasanuddin Ali
CEO Alvara Research Center
MAJALAH Harvard Business Review (HBR) edisi Oktober 2012 pernah menulis “Data Scientist: The Sexiest Job of the 21st Century”. Are you ready? Apa itu profesi data scientist? Data scientist adalah profesi multidisipliner yang menggabungkan kemampuan statistik, matematik, programing, dan visual grafis. Seorang data scientist harus mampu merekonstruksi data yang sangat melimpah kemudian memformulasikan dan menganalisis data tersebut untuk pengambilan keputusan. Seorang data scientist juga dituntut mampu mengomunikasikan data tersebut secara baik sehingga pengambil keputusan mampu melakukan keputusan secara mudah dan cepat. Di sinilah kemampuan visual grafis berperan.
Kebutuhan akan kemampuan seorang data scientist saat ini sangat penting, bahkan LinkedIn menempatkan posisi data scientist adalah profesi paling banyak dicari sekarang, mengingat kita sekarang hidup dalam era ledakan data, era big data. Big data adalah sekumpulan data yang sangat banyak dan besar, jutaan record dan field, hingga alat-alat analisis tradisional sudah tidak relevan lagi untuk digunakan sebagai alat analisisnya.
Lalu, sebenarnya dari mana data yang banyak itu berasal? Ada dua sumber data; pertama, data internal perusahaan, misal data transaksi keuangan nasabah di perbankan dan asuransi, data pembeli mobil dan motor bagi perusahaan otomotif, atau data transaksi dan pola perilaku transportasi bagi perusahaan transportasi online, serta lainnya. Kedua, data yang berasal dari social media. Ketika kita mengetik status atau mengunggah foto di Facebook, Twitter, atau Path, kita sedang memproduksi data itu sendiri.
Karena sangat besarnya big data memerlukan seperangkat tools baru yang lebih canggih dan advance. Tools itu kemudian kita kenal sebagai data analytic. Berbeda dengan data analisis. Data analytic lebih menekankan pada bagaimana seorang peneliti mampu melakukan eksplorasi dan analisis data secara simultan dan kemudian mampu menemukan pola yang insightful dan melakukan prediksi berbasis dari modeling data yang sudah dibuat.
Terkait dengan tren big data ini, beberapa hari lalu saya mengikuti Big Data and Analytic Summit di Shanghai. Kegiatan yang berlangsung dua hari itu diikuti perusahaan-perusahaan di Asia Pasifik dengan menampilkan pembicara dan praktisi data scientist dari perusahaan ternama mulai dari Alibaba, Airbnb, Google DeepMind, Kraft Heinz, GAP, Adidas, dan beberapa perusahaan analytic dari China.
Dari sekian banyak pembicara yang menarik menurut saya ada tiga, yakni materi yang dibawakan Jia Kunyang, Senior Data Mining Expert Alibaba Group; Milan Shen, Data Science Manager Airbnb; dan Janusz Marecki, Senior Research Scientist DeepMind.
Materi yang disampaikan Jia Kunyang dari Alibaba adalah tentang implementasi Knowledge Graph di perusahaan. Dengan menggunakan algoritma Knowledge Graph ini mesin pencari Google mampu membaca dan memprediksi secara lebih akurat dan relevan informasi apa sebenarnya ingin dicari oleh masing-masing orang yang menggunakan mesin pencari Google.
Secara lebih detail dan teknik, Jia Kunyang menjelaskan penerapan algoritma Knowledge Graph di Alibaba. Menggunakan berbagai persamaan matematis dan statistik yang rumit, Jia Kunyang menyampaikan bahwa algoritma yang dimiliki Alibaba mampu “menebak” kira-kira yang akan dicari pengunjung website ecommerce Alibaba.
Pembicara kedua yang menarik adalah Milan Shen, Data Science Manager Airbnb. Airbnb adalah platform untuk menyewakan tempat tinggal bagi para pelancong. Airbnb mempelajari lebih rinci perilaku pelancong mulai dari bagaimana kebiasaan mereka memilih lokasi, tipe kamar, fasilitas, lama tinggal, dan harga. Untuk memudahkan para pelancong memesan kamar melalui websitenya, Airbnb banyak melakukan eksperimentasi untuk mendapatkan tampilan website dan aplikasi yang lebih user friendly bagi pengguna.
Berbeda dengan Jia Kunyang dan Milan Shen, Janusz Marecki dari DeepMind, lebih banyak berbicara mengenai masa depan Artificial Intelligence di dunia. Artificial Intelligence, menurut Janusz Marecki, sebenarnya saat ini sudah terjadi meski masih relatif sederhana. Ke depan tren Aritificial Intelligence tidak akan bisa dibendung dan akan mencapai puncaknya pada tahun 2040.
Akhirnya dari Big Data and Analytic Summit itu setidaknya kita bisa mengambil pelajaran tiga hal. Pertama, interconnected and multitasking method,untuk menganalisa big data diperlukan kontribusi berbagai disiplin ilmu, di sini peran ilmu statistika, ilmu pemrograman, dan data visualization saling terkait. Kedua, time pressure, fenomena perubahan yang terjadi semakin cepat menuntut pengguna data juga ingin mendapatkan informasi secepat mungkin, malah kadang klien ingin informasi secara real time.
Ketiga, predictive analytic, sebagus apa pun metode yang kita gunakan apabila output-nya hanya sekadar deskriptif, maka tidak akan ada gunanya. Dengan melimpahnya data, kemampuan seorang data scientist harus mampu meramalkan dan memprediksi kejadian-kejadian yang akan datang, tentu berdasarkan kaidah-kaidah dan teori yang bisa dipertanggungjawabkan keilmiahannya.
CEO Alvara Research Center
MAJALAH Harvard Business Review (HBR) edisi Oktober 2012 pernah menulis “Data Scientist: The Sexiest Job of the 21st Century”. Are you ready? Apa itu profesi data scientist? Data scientist adalah profesi multidisipliner yang menggabungkan kemampuan statistik, matematik, programing, dan visual grafis. Seorang data scientist harus mampu merekonstruksi data yang sangat melimpah kemudian memformulasikan dan menganalisis data tersebut untuk pengambilan keputusan. Seorang data scientist juga dituntut mampu mengomunikasikan data tersebut secara baik sehingga pengambil keputusan mampu melakukan keputusan secara mudah dan cepat. Di sinilah kemampuan visual grafis berperan.
Kebutuhan akan kemampuan seorang data scientist saat ini sangat penting, bahkan LinkedIn menempatkan posisi data scientist adalah profesi paling banyak dicari sekarang, mengingat kita sekarang hidup dalam era ledakan data, era big data. Big data adalah sekumpulan data yang sangat banyak dan besar, jutaan record dan field, hingga alat-alat analisis tradisional sudah tidak relevan lagi untuk digunakan sebagai alat analisisnya.
Lalu, sebenarnya dari mana data yang banyak itu berasal? Ada dua sumber data; pertama, data internal perusahaan, misal data transaksi keuangan nasabah di perbankan dan asuransi, data pembeli mobil dan motor bagi perusahaan otomotif, atau data transaksi dan pola perilaku transportasi bagi perusahaan transportasi online, serta lainnya. Kedua, data yang berasal dari social media. Ketika kita mengetik status atau mengunggah foto di Facebook, Twitter, atau Path, kita sedang memproduksi data itu sendiri.
Karena sangat besarnya big data memerlukan seperangkat tools baru yang lebih canggih dan advance. Tools itu kemudian kita kenal sebagai data analytic. Berbeda dengan data analisis. Data analytic lebih menekankan pada bagaimana seorang peneliti mampu melakukan eksplorasi dan analisis data secara simultan dan kemudian mampu menemukan pola yang insightful dan melakukan prediksi berbasis dari modeling data yang sudah dibuat.
Terkait dengan tren big data ini, beberapa hari lalu saya mengikuti Big Data and Analytic Summit di Shanghai. Kegiatan yang berlangsung dua hari itu diikuti perusahaan-perusahaan di Asia Pasifik dengan menampilkan pembicara dan praktisi data scientist dari perusahaan ternama mulai dari Alibaba, Airbnb, Google DeepMind, Kraft Heinz, GAP, Adidas, dan beberapa perusahaan analytic dari China.
Dari sekian banyak pembicara yang menarik menurut saya ada tiga, yakni materi yang dibawakan Jia Kunyang, Senior Data Mining Expert Alibaba Group; Milan Shen, Data Science Manager Airbnb; dan Janusz Marecki, Senior Research Scientist DeepMind.
Materi yang disampaikan Jia Kunyang dari Alibaba adalah tentang implementasi Knowledge Graph di perusahaan. Dengan menggunakan algoritma Knowledge Graph ini mesin pencari Google mampu membaca dan memprediksi secara lebih akurat dan relevan informasi apa sebenarnya ingin dicari oleh masing-masing orang yang menggunakan mesin pencari Google.
Secara lebih detail dan teknik, Jia Kunyang menjelaskan penerapan algoritma Knowledge Graph di Alibaba. Menggunakan berbagai persamaan matematis dan statistik yang rumit, Jia Kunyang menyampaikan bahwa algoritma yang dimiliki Alibaba mampu “menebak” kira-kira yang akan dicari pengunjung website ecommerce Alibaba.
Pembicara kedua yang menarik adalah Milan Shen, Data Science Manager Airbnb. Airbnb adalah platform untuk menyewakan tempat tinggal bagi para pelancong. Airbnb mempelajari lebih rinci perilaku pelancong mulai dari bagaimana kebiasaan mereka memilih lokasi, tipe kamar, fasilitas, lama tinggal, dan harga. Untuk memudahkan para pelancong memesan kamar melalui websitenya, Airbnb banyak melakukan eksperimentasi untuk mendapatkan tampilan website dan aplikasi yang lebih user friendly bagi pengguna.
Berbeda dengan Jia Kunyang dan Milan Shen, Janusz Marecki dari DeepMind, lebih banyak berbicara mengenai masa depan Artificial Intelligence di dunia. Artificial Intelligence, menurut Janusz Marecki, sebenarnya saat ini sudah terjadi meski masih relatif sederhana. Ke depan tren Aritificial Intelligence tidak akan bisa dibendung dan akan mencapai puncaknya pada tahun 2040.
Akhirnya dari Big Data and Analytic Summit itu setidaknya kita bisa mengambil pelajaran tiga hal. Pertama, interconnected and multitasking method,untuk menganalisa big data diperlukan kontribusi berbagai disiplin ilmu, di sini peran ilmu statistika, ilmu pemrograman, dan data visualization saling terkait. Kedua, time pressure, fenomena perubahan yang terjadi semakin cepat menuntut pengguna data juga ingin mendapatkan informasi secepat mungkin, malah kadang klien ingin informasi secara real time.
Ketiga, predictive analytic, sebagus apa pun metode yang kita gunakan apabila output-nya hanya sekadar deskriptif, maka tidak akan ada gunanya. Dengan melimpahnya data, kemampuan seorang data scientist harus mampu meramalkan dan memprediksi kejadian-kejadian yang akan datang, tentu berdasarkan kaidah-kaidah dan teori yang bisa dipertanggungjawabkan keilmiahannya.
(wib)