Memiliki fokus mengenai data dan arsitektur pendukungnya, memaksa kami untuk melakukan perbandingan dari segala macam perangkat lunak yang tersedia di pasaran yang bekerja pada level tata kelola data. Dari semua yang ada pada tulisan ini kami mencoba mengenali salah satunya, Kylo.
Tentang Kylo
Kylo berasal dari kata Yunani yang berarti “mengalir”.
Apa Itu Kylo?
Dari dokumentasi pengembang, Kylo adalah platform data lake yang kaya fitur dibangun diatas Apache Hadoop dan Spark. Kylo menyediakan fitur lengkap, ramah terhadap kebutuhan bisnis, solusi data lake dengan layanan mandiri terhadap akuisisi data, pengolahan, dan eksplorasi data.
Kylo dikembangkan pada layer aplikasi web yang menawarkan fitur yang diorientasikan untuk pengguna level bisnis, termasuk analis data, pengelola data, ilmuwan data dan personil operasional IT. Kylo menggabungkan banyak fungsi dengan mengadopsi praktik terbaik dalam keamanan, kualitas data dan pengelolaan meta-data.
Pengembangan Kylo
Kylo dikembangkan oleh Think Big, grup Teradata. Think Big menyediakan konsultasi mengenai big data dan analisis yang mencakup entitas terbesar dunia dan berbagai macam industri. Dalam 7 (tujuh) tahun terakhir Think Big telah membangun 150 (seratus lima puluh) proyek Big Data.
Sebagai pengadopsi ekosistem Hadoop yang open source, Think Big melepas salah satu proyeknya, Kylo, sebagai kontribusi kepada komunitas dan untuk meningkatkan nilai. Kylo dirilis menggunakan lisensi Apache 2.0.
Peluang Adopsi
Dengan melihat gambaran awal, mari kita teliti peluang adopsi Kylo dalam bisnis.
Pengguna
Thing Big menyatakan bahwa Kylo sudah digunakan baik dalam pengembangan maupun level produksi di berbagai proyek perusahaan multi-nasional yang mencakup berbagai jenis industri, diantaranya manufaktur, bank/keuangan, ritel dan asuransi. Namun rilis daftar nama belum bisa didapatkan karena perihal legal.
Kebutuhan Dasar
Banyak organisasi yang menyatakan bahwa implementasi solusi big data menggunakan Hadoop sangat kompleks. Penerapan big data sangat fokus pada rekayasa perangkat lunak dan administrasi sistem. Bahkan pada level perusahaan dengan kapabilitas teknis cukup tinggi pun memerlukan usaha lebih dalam penerapannya.
Dan tentunya Think Big menjual jasa dukungan atas pengadopsian Kylo oleh organisasi dimana seringkali pengadopsian pengetahuan membutuhkan waktu yang tidak sebentar.
Arsitektur
Kylo dikembangkan sebagai aplikasi web modern pada sistem operasi GNU Linux dalam mode edge yang berisi kumpulan komputer terpasang Spark dan Hadoop. Banyak perintah rutin dalam pengembangan data-lake yang dikumpulkan sebagai pendukung Kylo utamanya berkaitan dengan Spark dan Apache Hive.
Selain pada cluster Kylo juga bisa dipasang pada cloud.
Komponen
- Kylo UI;
- Kylo Services;
- Kylo Spark Shell;
- Kylo Metadata Server;
- Apache NiFi;
- ActiveMQ;
- Apache Spark;
- ElasticSearch; dan
- Apache Hadoop, termasuk: YARN, HDFS, Hive.
Siklus Pengembangan
Sangat disarankan menggunakan sandbox dalam hal pengembangan dan percobaan pengelolaan data. Ketika alur yang dicoba sudah melewati tahap UAT dapat dilakukan penerapan pada skala produksi. Pengelolaan template dalam Kylo memudahkan dalam skalabilitas dan penerapan, karena dapat diimpor atau ekspor kedalam lingkungan yang berbeda.
Perangkat Sejenis
Komersial
Kylo memiliki kesamaan dengan Podium Data dan Zaloni Data Platform, dimana Kylo merupakan pilihan open-source-nya.
Perangkat ETL
Perangkat ETL (extract-transform-load) berfokus pada transformasi SQL pada teknologi masing-masing basis data. Pada pola pengelolaan data, perangkat basis Hadoop yang mengikuti ELT (extract-load raw data-transform). Dimana struktur data yang tidak berstruktur tidak membuat kebutuhan khusus dalam melakukan pemindahan data.
Dukungan Keamanan Kylo
Kylo sudah mendukung pendefinisian hak akses dan wewenang sesuai level pengguna. Dengan Spring Security, semua layanan otentikasi dapat diintegrasikan, misal AD, Kerberos, LDAP.