Problema Cloud Computing Terkini (2014) dalam Hal Ketahanan Sistem

Seiring dengan terus meningkatnya kepercayaan masyarakat global untuk menyimpan datanya di layanan-layanan internet, maka kebutuhan akan ketahanan sistem yang mumpuni di bidang cloud computing pun terus meningkat. Masyarakat masa kini semakin peka akan ketersediaan akses data mereka, kapan saja mereka membutuhkannya. Hal ini dapat kita lihat dari respon masyarakat terhadap berbagai kasus outage yang dialami oleh penyedia layanan internet ternama, seperti Gmail (Google) di tanggal 24 Januari 2014 yang hanya berlangsung selama kurang lebih 55 menit, Twitter di tanggal 12 Maret 2014 hanya berlangsung kurang lebih 40 menit, atau Dropbox di tanggal 11 Januari 2014. Kepanikan masyarakat global dapat langsung kita perhatikan di berbagai layanan sosial media. Oleh karena itu, penelitian dalam bidang ketahanan sistem di dunia cloud computing makin dibutuhkan.

 

Sebuah paper yang baru saja dipublikasikan dalam konferensi Symposium of Cloud Computing (SoCC) 2014, yang berjudul “The Case for Drill-Ready Cloud Computing”, mencoba membahas sebuah alternatif baru dalam pengujian ketahanan sistem cloud computing. Setelah penulis menjelaskan latar belakang akan dibutuhkannya kehandalan sistem cloud computing, penulis kemudian menjelaskan perjalanan riset pengujian ketahanan sistem yang ada hingga hari ini dan ke arah mana perkembangan riset pengujian ketahanan sistem seharusnya diarahkan.

Dimulai dari era Fault Tolerant Systems, di mana di masa ini, kesadaran bahwa dalam setiap sistem komputer pasti akan memiliki bug  dalam programnya, maka para peneliti dan programmer mulai menciptakan sistem komputer yang mampu mengatasi berbagai kendala software secara otomatis di dalam sistem yang mereka buat. Namun hambatannya adalah sulitnya membuat program dengan spesifikasi tersebut menggunakan bahasa pemrograman rendah, seperti C/C++ dan Java. Performa dari program yang dibuat pun akan mengalami penurunan.

Maka, masuklah dunia sistem komputer pada tahap Offline Testing, dimana para peneliti dan pembuat program melakukan uji coba secara offline terhadap sistem yang mereka buat, sebelum mereka benar-benar merilis program yang mereka buat. Banyak metode pengujian yang dihasilkan di masa ini, seperti fault injections, model checking, stress testingstatic analysis, failure modeling, dan menjalankan sistem awal pada “mini clusters” untuk mencoba sistem komputer pada berbagai skenario nyata. Namun metode-metode ini pun masih belum menjamin bahwa setiap software bug dalam sistem komputer dapat tersaring.

Seperti yang dapat diduga, Service Outages, tetap terjadi. Hal ini menunjukkan upaya untuk membuat sistem yang fault-tolerant dan offline testing, tidaklah cukup untuk menjamin sebuah sistem komputer terbebas dari software bug. Penulis menjelaskan bahwa banyak bug baru akan muncul di sistem yang telah dirilis, saat skalabilitas pengguna itu meningkat drastis jika dibandingkan dengan saat offline testing dilakukan.

Respon alamiah para peneliti adalah melakukan Diagnosa terhadap Service Outages yang ada. Berbagai paper mengenai ulasan outage sistem komputer pun ditulis dan dipelajari, sehingga diharapkan sistem-sistem komputer yang selanjutnya dibuat dapat menghindari kesalahan-kesalahan yang telah dibuat sebelumnya. Namun, jika tidak ada perubahan dalam arah penelitian ketahanan sistem cloud computing, maka kita masih akan terus mengalami berbagai kegagalan sistem sebelum mampu membuat sistem komputer yang handal yang tentunya akan membawa kerugian yang sangat besar.

Muncullah ide baru di benak para peneliti sistem komputer untuk mencoba melakukan Online Testing. Diharapkan dengan Online Testing ini, sistem benar-benar diuji dalam skala produksi nyata dan dari pengamatan yang ada dapat dilakukan berbagai pencegahan, sebelum sistem mengalami kegagalan. Namun kendala utama dari metode baru ini adalah, resiko tinggi terhadap layanan internet itu sendiri, jika seandainya online testing yang dilakukan mengalami kegagalan. Ide Online Testing ini sangat menarik bagi para peneliti, namun sangat beresiko untuk dilakukan.

Saat penulis paper mengamati hal ini, maka muncul ide baru di benak penulis untuk arah penelitian ketahanan sistem komputer, khususnya di bidang cloud computing. Terinspirasi dari uji coba kebakaran yang secara rutin dilakukan pada gedung-gedung publik, maka sistem komputer juga seharusnya melakukan uji coba kesalahan pada sistem online secara rutin dengan menyediakan berbagai teknologi pengaman, sehingga testing yang akan dilakukan tidak akan berdampak langsung pada sistem yang masih berjalan. Keuntungan metode ini adalah sistem komputer akan tetap diuji dalam skala nyata, namun tidak akan menyebabkan resiko apapun pada sistem yang masih berjalan. Berbagai faktor yang perlu diperhatikan sebelum mengimplementasikan metode ini adalah faktor keamanan, efisiensi dan kemudahan pemakaian sistem pengujian ini, dan sebaiknya bersifat umum. Penjelasan lebih detail mengenai ide penulis dapat dibaca dalam tautan ini.


Photo of Porfessor Haryadi Gunawi from University of Chicago
Professor Haryadi Gunawi

Tanakorn Leesatapornwongsa PhD Student at University of Chicago
Tanakorn Leesatapornwongsa

Catatan Tambahan : Penulis paper ini adalah Tanakorn Leesatapornwongsa (mahasiswa PhD Computer Science di University of Chicago) dan Haryadi S. Gunawi (Professor di University of Chicago yang berasal dari Indonesia).

Author Image

About Jeffrey Ferrari Lukman

Jeffrey Ferrari Lukman adalah seorang peneliti di SCORE Lab, Surya University yang mendalami bidang cloud computing dan system reliability. Seorang Indonesia yang bermimpi membuat inovasi yang berdampak global, khususnya di bidang teknologi.

Leave a Reply

Your email address will not be published. Required fields are marked *