Menghindari Pemadaman Data Center Dengan Desain Daya Yang Tepat

Menghindari Pemadaman Data Center Dengan Desain Daya Yang Tepat

Pemadaman data center terus menjadi hantu bagi pelaku IT. Pemeliharan data center atau audit dan kekuatan desain yang solid dapat mencegah pemadaman data center. Downtime tidak dapat di toleransi, apalagi kegagalan menghidupkan pembangkit selama berjam-jam.

Menghindari Pemadaman Data Center dengan Desain Daya Listrik Yang Tepat

United, Delta dan Southwest Airlines, dan sejumlah perusahaan terkenal lainnya – baru-baru ini mengalami gangguan data center. Dan penghentian yang sangat dipublikasikan telah menambahkan kekhawatiran lain pada daftar eksekutif IT di perusahaan tersebut. Selain biaya downtime, perusahaan yang mengalami pemadaman data center juga berisiko dalam hal reputasi bisnis dan penurunan kepercayaan pelanggan.

Banyak dari kasus pemadaman data center ini dilaporkan disebabkan oleh kegagalan listrik, yang bukan merupakan kejutan besar. Menurut Institut Uptime, sistem mesin generator yang merupakan sumber daya utama data center dalam menghadapi downtime, sering menjadi penyebab pemadaman data center. Gangguan daya utilitas, bagaimanapun, “tidak dianggap sebagai kegagalan, melainkan kondisi operasional yang diharapkan dimana situs harus dipersiapkan.”

Dengan kata lain, gangguan daya listri mungkin terjadi di sebagian besar data center perusahaan. Bagi CIO yang khawatir dengan hal semacam ini, ini mungkin merupakan kesempatan untuk mendanai beberapa perbaikan yang dibutuhkan. Tapi sadarilah bahwa dengan menambahkan redundansi tidak dapat menjamin sepenuhnya akan terhindar dari pemadaman.

Tantangan desain sumber daya data center untuk misi kritis

Kerentanan terbesar di data center perusahaan adalah kekurangan dan kesalahan instalasi yang tersembunyi. Ada perbedaan antara peralatan duplikasi dan desain mission-critical sejati. Namun, ini adalah proses yang perlu dilakukan dengan sangat teliti untuk memeriksa desain daya listrik data center untuk titik-titik kegagalan potensial. Pertimbangkan untuk menyewa konsultan data center yang berkualifikasi tinggi untuk melakukan tugas ini bagi perusahaan Anda.

Anda dapat terus meninjau fasilitas baru atau yang telah direnovasi melalui disain dan pemasangan. Namun, ini adalah masalah lain untuk memperbaiki kerentanan di fasilitas yang ada saat layanan berlangsung. Bila Anda memperbaiki kerentanan, Anda dapat mengekspos operasi terhadap kegagalan. Tetapi bahkan jika Anda tidak melakukan koreksi berisiko, ketahuilah di mana potensi kegagalan terletak untuk meminimalkan risiko pemadaman data center.

Keamanan palsu dari listrik cadangan

Salah satu gangguan listrik yang terdokumentasi dengan baik dalam sejarah terjadi di 365 Main Data Center di San Francisco. Perusahaan memiliki sistem dan generator power supply dan UPS yang tidak terputus-putus yang berlebihan untuk memenuhi harapan pelanggannya terhadap ketersediaan konstan. Tapi, pada tanggal 24 Juli 2007, Murphy’s Law terjadi pada data center ini.

Pertama, ada kegagalan sumber daya utama. UPS data center mempertahankan daya sampai generator mulai menyala. Namun, segera setelah itu, generator ditutup satu per satu, menyebabkan pemadaman data center yang mempengaruhi operasional perusahaan selama berjam-jam.

Meskipun data center tersebut memiliki desain sistem pasokan listrik yang solid, operator data center tidak mengungkapkan masalah firmware dalam kontrol generator melalui pengujian rutin. Alih-alih menguji kegagalan berulang dan generator restart, administrator mengandalkan keamanan palsu dari kekuatan cadangan dan redundansi.

Banyak sistem UPS modern dapat memberi sinyal pada server untuk menyalakan shutdown terkontrol saat masa pakai baterai turun di bawah ambang batas yang telah ditentukan. Meski tidak ideal, jauh lebih baik menerapkan kemampuan ini daripada mengalami kegagalan saat memulai ulang.

Tips Untuk Manajer Data Center

Jika Anda dapat memperbaiki kerentanan, buatlah rencana terperinci tentang bagaimana Anda dapat melakukannya, dan juga bagaimana Anda menangani potensi kegagalan yang dapat diatasi oleh proses pemulihan. Misalnya, jika seorang admin menyalakan alarm kebakaran, pasti ada seseorang bersamanya yang dapat mengatasi kondisi tersebut dan menghindari pembuangan sistem proteksi kebakaran gas dan sebuah shutdown otomatis. Dan, jika rencananya adalah mematikan alarm kebakaran selama bekerja, beritahu petugas fasilitas, petugas keamanan dan pemadam kebakaran, dan pastikan seseorang petugas untuk bertanggung jawab terhadap alat pemadam portabel.

Jika ada potensi kegagalan pendinginan, rencanakan untuk melakukan shutdown selektif untuk mengurangi beban panas dan menempatkan pendingin udara portabel sebagai tindakan pencegahan. Dan yang terpenting adalah, selalu melakukan pengujian secara berkla terhadap seluruh komponen di data center berdasar petunjuk dari masing-masing vendor.

Dengan melakukan pemeliharaan rutin maka downtime dapat lebih terprediksi dan kegagalan data center dapat lebih terhindari.