Mengintip Ekosistem Big Data di Gojek (Ojek Online)

TEMPAT NGOPREK :  Bagi pelanggan Go-Jek, setiap membuka aplikasi itu lalu memilih Go-Ride atau GoCar, di kolom lokasi penjemputan seringkali sudah terisi alamat. Sementara di kolom tujuan, ada tiga alamat yang salah satunya adalah tujuan si pelanggan. Isian pada kolom penjemputan dan tujuan itu biasanya tepat, meski sesekali keliru. Jika sudah tepat, si pelanggan tak perlu repot-repot memasukkan lagi secara manual. Ia cukup hanya menekan tombol pesan atau order. Dari pola perjalanan dan pesanan yang setiap hari dilakukan si pelanggan, Go-Jek menganalisis dan menebak di mana lokasi si pelanggan saat itu, dan akan ke mana ia pergi. Go-Jek punya tim khusus yang pekerjaannya menganalisis data hingga tebakan bisa benar. Tim tersebut bernama Business Intelligent Team.

Tim yang dikomandoi oleh Crystal Widjaja (SVP of BI ini mempunyai kekuatan 20 data scientist dan data engineer. Mereka memanfaatkan data sedemikian banyak yang mereka sebut big data. Ia berisi data pribadi, rekam jejak perjalanan, jenis makanan yang dibeli, daftar belanjaan, jenis obat yang digunakan, jadwal pijat, hingga jadwal mencuci kendaraan. Data itu tentu saja tidak dibuang, sebab ia sangat berharga. Ia disimpan dan dimanfaatkan. Bisa “menebak” adalah salah satu manfaat big data bagi Go-Jek. Lalu, apa manfaatnya secara bisnis? 

“Kalau kami bisa menebak, Anda enggak perlu banyak klik. Semakin sedikit klik, Anda makin senang dan semakin adiktif [dengan aplikasi Go-Jek],” jelas Nadiem. Menebak lokasi dan tujuan bukanlah hal yang rumit. Yang rumit adalah menebak pengguna aplikasi mau makan apa. Dengan memanfaatkan big data, Go-Jek bisa menebak penggunanya menyukai satu jenis makanan tertentu meskipun ia belum pernah mencoba makanan itu.

Nadiem menjelaskan dengan singkat cara kerjanya. Misalkan ada satu orang pengguna aktif Go-Food di Kemang yang sering sekali memesan ayam goreng KFC, Crepes, dan pisang goreng Bu Nani. Pelanggan lain yang tinggal di Kuningan juga sering sekali memesan tiga jenis makanan itu. Lalu suatu waktu, pelanggan di Kemang memesan jenis makanan baru dan dipesan cukup sering. Aktivitas satu jenis makanan yang cukup sering, menandakan seseorang menyukai makanan itu. Oleh karena pelanggan di Kemang itu suka jenis makanan baru itu, kemungkinan besar pelanggan di Kuningan juga menyukainya karena selama ini mereka menunjukkan pola selera yang serupa.

“Kalo saya bisa suggest makanan baru yang 90 persen Anda pasti suka, Anda akan anggap aplikasi saya teman yang merekomendasikan makanan kepada Anda, sehingga Anda enggan berpindah ke aplikasi lain,” ungkap Nadiem. Dengan memanfaatkan big data, Go-Jek menyasar loyalitas konsumen. Hal lain yang bisa dilakukan Go-Jek dengan big data yang berisi data behaviour konsumen adalah mengatur siapa mendapatkan pesanan apa. Nadiem menyadari, driver yang menjadi mitra Go-Jek kerap memilih-milih pesanan. Ada driver yang menghindari pesanan di restoran tertentu di jam-jam tertentu. Adapula yang kerap membatalkan pesanan jika mendapat pesanan ke arah tertentu.

Big data bisa digunakan untuk mengatur agar driver mendapatkan pesanan yang tidak akan dibatalkannya. Misal, driver A tidak pernah mau ambil pesanan di satu restoran pada jam 7-9 malam. Maka ke depan, driver itu tak akan diberikan lagi pesanan Go-Food di restoran itu. Selain tidak mengecewakan konsumen, dengan begitu, Go-Jek juga tak perlu terusmenerus mensubsidi driver untuk memotivasi mereka mengambil pesanan-pesanan yang mereka enggan. Ujung-ujungnya, efisiensi bagi keuangan Go-Jek.



Dalam ekosistem big pada Gojek, mereka menggunakan infrastruktur yang beragam. Yang terbaru, Gojek telah mengimplementasikan Google BigQuery dan Google Cloud Storage untuk proses warehousing mereka. Hal ini dianggap pas karena mereka hanya perlu membayar biaya bulanan saja dengan menyewa Virtual Private Server tanpa harus membangun infrastruktur sendiri.



Aplikasi dan backend Gojek menggunakan beberapa DBMS, yaitu MongoDB, PostgreSQL, dan MySQL (walaupun pada kabar terbaru mereka beralih menggunakan MariaDB). Seluruh DBMS ini memiliki fungsi yang berbeda-beda. Aplikasi Gojek sendiri menggunakan Postgre. RDBMS ini dipilih karena Postgre mendukung open connection yang lebih besar dibandingkan MySQL. Backend Gojek yang dibangun dalam bahasa Ruby memfasilitasi penggunaan basis data yang beragam, sehingga mereka menggunakan Apache Kafka sebagai agregator data source ke ETL.


Data tersebut diproses terlebih dahulu melalui ETL process (Extract, Transform, Load). Dalam proses ini, Gojek memanfaatkan Pentaho, Python, Logstash, dan Java. Tentu saja fungsi dari seluruh komponen ini berbeda-beda. Pentaho berfungsi untuk melakukan proses ETL multi-node lalu data di-passing ke BigQuery. Python berfungsi untuk proses machine learning, karena machine learning memiliki efisiensi tinggi dalam melakukan proses transform. Logstash merupakan bagian dari Elastic, bersama dengan Elastic Search dan Elastic Kibana. Kegunaan yang paling terlihat dari Logstash adalah log processing pada server Gojek.


Tahap selanjutnya adalah warehousing. Gojek telah mengimplementasikan Google BigQuery dan Google Cloud Storage. Google BigQuery memfasilitasi Gojek untuk me-request data menggunakan Google Query dengan waktu pemrosesan kurang dari 20 detik. Tentu saja proses ini akan menghemat waktu dan infrastruktur karena seluruh proses dijalankan di cloud. Google Cloude Storage sendiri mirip dengan Amazon Web Service S3 (digunakan oleh Traveloka dan Tiket.com). Fungsinya adalah menjadi data warehouse dari seluruh data Gojek. Tujuan dari implementasi ini adalah untuk membangun kekuatan backend yang besar sehingga tidak mengganggu proses bisnis yang ada.

Tahap terakhir adalah data presentation. Di tahap ini, Gojek melakukan data visualization untuk diarahkan menjadi informasi yang berguna bagi C-level. Gojek menggunakan Tableau sebagai data visualization platform. Tableau menghasilkan bagan dan grafik yang berisi informasi dari data yang diolah Gojek. Tableau memiliki fungsionalitas yang tinggi dan dapat beroperasi langsung dengan Google Cloud Storage
Labels: Big Data
Back To Top