Apache Cassandra for Big Data

Tri Juhari
4 min readJul 27, 2021

--

Sebagai seorang Data Engineer, penting untuk memahami bagaimana cara bekerja Apache Cassandra. Sebelum kita mengenal lebih jauh terkait Apache Cassandra, ada baiknya kita mengetahui bagaimana cara melakukan instalisasi apache cassandra di operating system linux (ubuntu).

Tak kenal maka tak sayang. Apache Cassandra merupakan salah satu database NOSQL yang open source dan populer, karena banyak industri yang menggunakannya. Apache Cassandra memiliki kemampuan yang tinggi yang dapat menangani sejumlah data yang besar (big data). Relational database yang biasa dipakai tentunya tidak dapat menangani linear scaling (skalabel linier ) maksudnya relation database yang biasa sulit untuk meningkatkan kapasitas atau skalabilitas jika dan hanya jika menambahkan node baru, , atau bisa dikatakan relational database yang biasa tidak memiliki kemampuan melakukan pendistribusian data tanpa batas, dan data dengan volumer besar, yang mana hal tersebut dapat dilakukan seefisien mungkin jika kita menggunakan Cassandra ini.

Perusahaan teknologi besar diluar sana sudah banyak yang mengadopsi teknologi contohnya yaitu Netflix, Apple, Uber, eBay dan masih banyak lagi.

Selanjutnya kita akan melakukan secara step by step bagaimana melakukan instalisasi apache Cassandra.

Langkah 1: Install Packages yang dibutuhkan

Sebelum melakukan installing cassandra di system ubuntu. Pastikan sudah terinstal Java OpenJDK 8 dan api-transport-https package.

Install Java OpenJDK

Agar Apache Cassandra dapat berjalan didalam system kita, dibutuhkan OpenJDK 8 yang sudah terpasang di dalam sistem ubuntu kita tapi sebelumnya diperlukan melakukan updating repository

sudo apt-update

Jika proses updating berhasil dilakukan , kemudian kita install OpenJDK.

sudo apt install openjdk-8-jdk -y

Apabila proses instaliasi openJDK telah berhasil, kita dapat melakukan pengecekan dengan cara.

java -version

Digit yang kedua(8) merupakan versi dari java yang kita install.

Install the apt-transport-https Package

Selanjutnya kita menginstall package apt-transport. kita perlu menambahkan package ini ke sistem ubuntu kita agar dapat mengaktifkan akses ke repositori dengan menggunakan HTTPS.

Langkah 2: Menambahkan Apache Cassandra Repository dan MengImport GPG Key

Perlu untuk menambahkan Apache Cassandra repository dan GPG key sebelum kita menginstall databasenya.

sudo sh -c 'echo "deb http://www.apache.org/dist/cassandra/debian 40x main" > /etc/apt/sources.list.d/cassandra.list'

Versi terbaru Cassandra pada saat saya menulis artikel ini adalah 4.0. Itu sebabnya saya menggunakan 40 dalam perintah. Untuk menginstal versi yang lebih lama, misalnya 3.9, bisa menggantinya 40x dengan 39x.

wget -q -O - https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -

Langkah 3: Install Apache Cassandra

Setalah semua yang dibutuhkan terinstall semua, sekarang saatnya kita mengnstall apache cassandra.

Update repositori terlebih dahulu

sudo apt-update

kemudian install dengan mengikuti perintah dibawah

sudo apt install cassandra

Pengecekan Instalisasi Apache Cassandra

nodetool status

Jika ouput seperti diatas berarti apache cassandra telah berhasil terpasang di dalam sistem kita. Tanda UN menandakan bahwa cluster sedang berjalan (working).Kita juga dapat mengecek status Cassandra dengan perintah di bawah ini.

sudo systemctl status cassandra

Jika statusnya seperti diatas maka statusnya active dengan ditandai dengan warna hijau.

Perintah Start, Stop, dan Restart Cassandra

Start Cassandra :

# start Cassandra sudo systemctl start cassandra

Stop Cassandra :

# stop Cassandrasudo systemctl stop cassandra

Restart Cassandra

# restart Cassandrasudo systemctl restart cassandra

FYI : Apache Cassandra aktif secara otomatis setelah booting

Saat kita mematikan atau mem-boot ulang sistem, maka apache Cassandra statusnya menjadi inactive. Untuk menjalankan Cassandra secara otomatis setelah boot, bisa dilakukan dengan cara

sudo sytemctl enable cassandra

Langkah 4: Konfigurasi Apache Cassandra

Jika kita ingin mengubah pengaturan konfigurasi Cassandra berdasarkan pada kebutuhan perusahaan, namun dengan konfigurasi default sudah cukup apabila hanya menggunakan Cassandra dengan satu node. Jika ingin menggunakan Cassandra dalam sebuah cluster, dapat menyesuaikan pengaturan utama menggunakan file cassandra.yaml.

Sebagai catatan :

Disarankan untuk membuat backup file cassandra.yaml jika ingin mengeditnya. Untuk melakukannya, gunakan perintah ini:

sudo cp /etc/cassandra/cassandra.yaml /etc/cassandra/cassandra.yaml.backup

Di sini saya menggunakan direktori /etc/cassandra sebagai direktori file backupnya, namun dapa kita ubah sesuai keinginan kita.

Renaming Apache Cassandra Cluster (Mengubah Nama )

sudo nano /etc/cassandra/cassandra.yaml

Secara default cluster name adalah Test Cluster. jika kita ingin mengubahnya kita dapat menggantinya sesuai kebutuhan kita.

Add IP Addresses of Cassandra Nodes (Menambahkan)

Penting jika ingin menjalankan cluster adalah dengan menambahkan alamat IP setiap node. Hal lain yang harus ditambahkan ke cassandra.yaml.

Jika ingin menambahkan alamat IP setiap node di cluster dapat dipisahkan dengan menggunakan koma (,) untuk setiap IP address.

Langkah 5: Test Cassandra Command-Line Shell

Untuk mebuka shell baru, dapat mengikuti perintah

cqlsh

Shell berhasil dijalankan apabila seperti gambar diatas.

--

--

No responses yet