Skip to content

REDUNDANCY ควรทำหรือไม่ เพราะอะไร

 

หลายครั้งที่ผมเห็นการขึ้นระบบใหม่ และข้อหนึ่งที่มักจะถูกหยิบมาพูดกัน คือ เงื่อนไขว่า ระบบจะต้องไม่ล่ม ข้อมูลต้องไม่หาย หรือเน็ตต้องใช้ได้ตลอดเวลา และข้อสรุปก็มักนำไปสู่การซื้อ Redundancy เช่น Redundant Power Supply, RAID Disk, Cluster ของอุปกรณ์ต่าง ๆ เช่น Firewall หรือ Core Switch, Multiple Fiber Optic Cabling และอื่น ๆ อีกมาก

ทีนี้พอถึงคราวพิจารณางบประมาณ Redundancy ที่วางเอาไว้มากมายกลับถูกตัดออกอย่างง่ายดาย ความกังวลเรื่องระบบจะไม่ต่อเนื่อง มันหายไปไหนไม่รู้ ละลายหายไปเฉยเลย คำว่า “ไม่มีงบ” สยบทุกอย่าง สรุปว่าคนที่วาง Redundancy แต่แรกนั้น พี่แกเยอะ หรือคนที่มาตัดออกทีหลังมันซี้ซั้ว คนเสนอมักเป็นฝ่ายไอที คนตัดออกมักเป็นฝ่ายบริหาร ตกลงใครถูกใครผิด

มีตลกร้ายกว่านั้น คือในวันที่ฮาร์ดแวร์มีปัญหา ระบบล่มเพราะไม่มี Redundancy ฝ่ายไอทีตะโกนก้องในใจ “กูบอกมึงแล้วไงให้ซื้อ Redundant” แม้ความจริงฝ่ายไอที จะเป็นฝ่ายที่ถูกเฉ่งอยู่ตลอดก็ตาม ในขณะเดียวกัน ฝ่ายบริหารเองก็รู้สึกเหมือนโดนมัดมือชก ถ้าไม่จ่ายตามที่เสนอตอนต้นปี มันก็ตามมาราวีตอนกลางปี พังกันซะตรงหน้า อ่ะ…ยังไงก็ต้องจ่าย นี่มันมัดมือชกชัด ๆ เลย ต่างฝ่ายต่างก็ไม่แฮปปี้ แล้วอย่างนี้ Redundancy มันมีเรื่องดี ๆ อยู่ตรงไหน

เวลาพูดถึง Redundancy ผมอยากให้นึกกว้างไปถึงทุกอย่างที่มีซ้ำกันมากกว่าหนึ่งที่สามารถทำงานทดแทนกันได้ ซึ่งเราจะคิดถึง Redundancy ใน 3 ระดับครับ ไล่จากง่ายไปยาก, ถูกไปแพง, Manual ไป Auto

Redundancy แบบ Active/Standby หรือ Active/Passive แปลว่า ตัวหนึ่งทำงาน อีกตัวอยู่เฉย ๆ และเวลาที่เกิดปัญหา จะต้องมีใครซักคนไปสลับการทำงานจากตัว Active ที่หยุดทำงานไปแล้ว ให้ Passive มาทำงานแทน เช่น สวิตช์สำรองที่ซื้อเก็บไว้, Generator ที่ต้องมีคนไปเปิดใช้ตอนไฟดับ

แบบแรกนี้จะ”ถูกสุด”เพราะไม่ต้องมีระบบหรือกลไกอะไรมาบอกว่าเมื่อไหร่ตัวสำรองจะเริ่มทำงาน เพราะเราเอาคนมาทำงานตรงนี้ และแน่นอนว่าการสลับจากระบบหลักไประบบสำรอง ย่อมใช้เวลาพอสมควร

Redundancy ถัดมาคือแบบ Failover คือความสามารถในการที่อุปกรณ์ตัวสำรอง จะสามารถรับภาระของตัวหลักได้ทันที โดยที่คนไม่ต้องเข้าไปเกี่ยวข้อง แบบที่สองนี้จะมีราคาและความยุ่งยากเพิ่มขึ้นมา เพราะระบบสำรองต้องมีกลไกเอาไว้คอยดูระบบหลักว่ายังทำงานอยู่หรือเปล่า (Heartbeat) และระบบสำรองอาจต้องตื่นขึ้นมาทำงานแทนแบบทันทีทันใด (High availability) โดยงานที่ทำนั้น จะต้องต่อเนื่องสมบูรณ์ ไม่ใช่ว่าต้องเริ่มทำใหม่ (Active/Standby Synchronization)

Redundancy แบบสุดท้าย คือ Load Balancing ก็คือ อุปกรณ์ทุกตัวใน Redundant set ทำงานพร้อมกันหมด รับภาระงานด้วยกันหมด ถ้าตัวใดหยุดทำงาน ตัวที่ทำงานอยู่ก็จะรับภาระนั้นไป จะเรียกว่าเป็น Active/Active ที่ตรงข้ามกับ Active/Standby ก็ได้ ทั้งนี้ ต้องไม่ลืมประเมินว่า อุปกรณ์ที่คอยรับภาระจากตัวที่หยุดทำงานไปนั้น ต้องมี Capacity พอจะรับงานได้ นั่นจึงเป็นที่มาของ Redundancy แบบ N+1

แบบที่ 3 นี้มักจะเป็นระบบที่”แพงที่สุด”ด้วย Performance ของอุปกรณ์ที่อาจจะต้องใกล้เคียงกับ License ที่จะต้องเหมือนกัน ฯลฯ แต่ก็ได้ข้อดีคือ Capacity ของระบบเพิ่มขึ้นเพราะอุปกรณ์ทุกตัวทำงานหมด ไม่มีตัวไหนอยู่เฉย ๆ

หลายระบบมีออพชั่นให้ซื้อ Redundancy เพิ่มเติมได้ จะเป็นแบบไหนก็ไปเลือกกันดูครับ ค่าใช้จ่ายถูกแพงแตกต่างกันไป แต่คำถามแรกก่อนที่จะลงมือเลือก Redundancy เราควรจะรู้ว่า เมื่อไหร่ควรจะมี Redundancy ไม่ใช่ว่าถ้ามีงบก็ซื้อ มันดีที่จะมีไว้ ไม่ใช่แบบนั้นนะครับ และคงไม่ใช่ว่าไม่ซื้อเพราะไม่มีงบ ผมมีข้อให้คิดแบบนี้ครับ “อย่าลงทุนกับการป้องกัน มากกว่ามูลค่าความเสียหาย”

เช่น ถ้าฝ่ายไอที จะเสนอให้องค์กรซื้อ Cluster Firewall ลองถามฝ่ายบริหารว่า ถ้าฮาร์ดแวร์ของ Firewall เกิดเสียขึ้นมา คุณขอเวลา 4 ชั่วโมงในการทำให้คนในองค์กรออกเน็ตได้ หรือเข้าถึงเซิร์ฟเวอร์ใน DMZ ได้ โดยเป็นแบบใช้งานไปก่อน ไม่ใช่ Full recovery ฝ่ายบริหารคิดว่า 4 ชั่วโมงที่ออกเน็ตและเข้าเซิร์ฟเวอร์ไม่ได้นั้น จะเกิดความเสียหายต่อธุรกิจคิดเป็นเงินเท่าไหร่ ถ้าคำตอบมันคือ 25,000 บาท คำตอบนี้จะทำให้คุณเลือกประเภทของ Redundancy ที่เหมาะสมกับ “ความต้องการทางธุรกิจ” ซึ่งคุณคงจะไม่เลือกอะไรที่เกินกว่า 25,000 บาท

ฝ่ายไอทีควรจะเลือก Redundancy แบบไหน หรือไม่ควรจะเสียเงินให้มันเลย…

ลองเอาแนวคิดเรื่อง “Downtime cost” มาตั้งเป็นงบประมาณในการเลือกและซื้อ Redundancy นะครับ ถ้าทำได้แบบนี้ ฝ่ายบริหารกับฝ่าย IT จะพูดภาษาเดียวกัน เรื่องมีงบหรือไม่มีงบ มันจะมาจากความเข้าใจร่วมกันคือเอา “ความต้องการทางธุรกิจเป็นที่ตั้ง” โดยใช้ Downtime cost มาเป็นตัวอธิบาย

ลองไปตั้งคำถามเหล่านี้ดูนะครับ…

● ถ้าฮาร์ดดิสก์ในเซิร์ฟเวอร์นี้เสีย Downtime cost แพงพอจะซื้อ RAID หรือไม่

● ถ้าสาย Fiber เส้นนี้ขาด Downtime cost ของเน็ตเวิร์คที่ปลายสาย Fiber นี้ แพงพอจะมี Fiber ในอีกเส้นทางหนึ่งหรือไม่

● ถ้า Wifi controller หยุดทำงาน ทั้งออฟฟิศใช้ Wifi ไม่ได้ ความวุ่นวายนี้มีมูลค่าต่อชั่วโมง เมื่อคูณด้วย Recovery time แล้วมันถูกหรือแพงกว่า Redundant controller

รำลึกไว้เสมอว่า ไม่มีธุรกิจไหนอยากอยู่บนความเสี่ยง Redundancy มีไว้ลดความเสี่ยงและป้องกันความเสียหาย ว่ากันง่าย ๆ ใจจริงธุรกิจก็อยากได้ Redundancy ครับ ถ้าฝ่ายไอทีกับภาคธุรกิจเห็นภาพเดียวกัน Redundancy เป็นสิ่งที่คุ้มค่าต่อการลงทุน และไม่ใช่ค่าใช้จ่ายสูญเปล่าอย่างแน่นอน ขอเพียงแต่ให้ค่าใช้จ่ายเรื่อง Redundancy ต่ำกว่า Downtime cost เป็นอันว่าใช้ได้ครับ



สอบถามรายละเอียดเพิ่มเติม เรามีพันธมิตรพร้อมให้คำปรึกษา

02-2479898 ต่อ 87

[email protected]

@optimusthailand

OPT-Care โดย บริษัท ออพติมุส (ประเทศไทย) จำกัด

SHARE TO:

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on email
Email