Solusi Cepat untuk Insiden VDC Tak Terduga

Ketika seluruh sistem ERP offline di tengah malam dan tekanan tinggi menghantui, siapa sangka penyebabnya hanya satu baris rule firewall otomatis?

Situasi Tengah Malam: Sistem Alarm Menyala

Bertahun-tahun bekerja sebagai IT Engineer di perusahaan distribusi, Rizky sudah terbiasa dengan shift malam. Tapi malam itu berbeda, telepon dari warehouse supervisor datang dengan suara panik:

“Mas Rizky, ERP-nya ngga bisa diakses semua. Kayaknya down deh…”

Rizky membuka laptop, connect VPN masuk ke portal Virtual Datacenter (VDC) Zettagrid, dan langsung melihat alarm dari aplikasi monitoring. Semua service ERP yang biasa diakses via IP publik tidak merespons.

Langkah Pertama: Verifikasi Status VM

Ia langsung melakukan pengecekan status VM di portal Cloud Director:

  • Status VM: Running
  • CPU/RAM usage: Normal
  • Uptime: Aktif sejak 9 hari lalu

Rizky tahu, kalau VM aktif tapi aplikasi tidak dapat diakses, kendala kemungkinan besar ada pada sisi jaringan bukan compute. Maka ia mulai membuka tab NSX Edge Gateway dan melakukan pengecekan pada log akses masuk. 

Menemukan Sumber Masalah

Dalam kurun waktu 10 menit, Rizky menemukan sesuatu yang abnormal:

  • Log menunjukkan semua request HTTP ditolak dari IP eksternal
  • Rule firewall untuk port 443 ternyata berubah dari “Allow” ke “Deny”
  • Rule tersebut diubah otomatis 2 jam lalu oleh provisioning script dari pipeline CI/CD test environment

Saat itu Rizky tersenyum kecil. Ia tahu hal ini dapat diperbaiki dengan cepat.

“Kadang penyebab big impact hanya satu hal kecil yang luput—dan log Zettagrid bantu saya melihat itu jelas.”

Solusi: Rollback & Revert Rule

Rizky mengembalikan rule firewall ke versi sebelumnya. Lalu ia rollback config Edge Gateway ke versi stable dari 24 jam sebelumnya.

Dalam waktu 3 menit, semua sistem kembali online. Ia langsung broadcast status ke tim operasional:

ERP RESTORED – Root cause: firewall rule overwrite, already fixed.

Total downtime: 27 menit. Lebih cepat dari SLA internal 1 jam yang ditetapkan.

Apa yang Dipelajari dalam Situasi Ini

Dari satu insiden sederhana namun krusial, Rizky dan tim mengambil beberapa pelajaran:

  1. Selalu Audit Script Otomatis
    Pipeline provisioning perlu akses terbatas. Belum tentu semua automation boleh menyentuh konfigurasi firewall produksi.
  2. Manfaatkan VM Logging
    Gunakan Fitur VM Logging untuk Deteksi dan Audit.
  3. Dashboard Monitoring Bukan Pajangan
    Tools seperti Uptime Robot, Pingdom, dan Grafana yang terhubung ke VDC membantu deteksi dini terhadap insiden.
  4. Role-Based Access Penting
    Memisahkan role CI/CD dan role admin network supaya tidak saling tumpang tindih.

Respon Tim Support Sigap

Pada malam insiden terjadi, Rizky segera menghubungi tim support Zettagrid Indonesia melalui email untuk melakukan verifikasi. Hanya dalam 12 menit, tim support merespons dengan cepat dan menyertakan log tambahan dari sisi backend. Respons cepat ini memberikan keyakinan pada tim bahwa mereka tidak sendirian menghadapi gangguan sistem, meskipun insiden terjadi pada pukul 2 dini hari.

Langkah Pencegahan Selanjutnya

Usai penanganan insiden, tim IT langsung melakukan root cause analysis, validasi performa sistem, serta audit konfigurasi untuk memastikan stabilitas jangka panjang:

  • Audit ulang script dengan hak akses penuh
  • Penambahan Notifikasi untuk perubahan Firewall Rule
  • Dokumentasi Insiden sebagai Bagian dari Playbook

Insiden Bisa Kapan Saja Terjadi, Kuncinya Ada pada Kecepatan Recovery

Belum tentu semua insiden besar berasal dari kesalahan besar. Sering kali, satu baris konfigurasi yang terlewat bisa menyebabkan layanan utama terhenti total. Namun dengan sistem yang transparan, fitur monitoring yang lengkap, dan dukungan teknis yang selalu siaga, proses troubleshooting dapat dilakukan dengan cepat, akurat, dan tanpa kepanikan berlebih.

Punya workload penting di cloud tapi belum merasa benar-benar memegang kendali?
Saatnya pastikan Anda punya visibilitas penuh dan sistem yang bisa diandalkan kapan pun

Dengan portal manajemen yang intuitif, Zettagrid Virtual Datacenter memudahkan Anda mengelola jaringan, firewall, serta backup data. Fitur backup konfigurasi jaringan memberikan lapisan keamanan tambahan yang krusial saat terjadi perubahan mendadak atau insiden teknis.

Pelajari lebih lanjut di zettagrid.id dan rasakan langsung kemudahan mengelola infrastruktur cloud melalui Virtual Datacenter.

Nikmati FREE TRIAL 30 hari serta Konsultasikan kebutuhan infrastruktur IT Anda kepada kami.