שחזור רייד - RAID

שחזור רייד - RAID
מערכות רייד (RAID Systems)
משמעות המילה RAID היא Redundant Array of Inexpensive Disks, אשר פירושה בעברית הוא מערך של דיסקים לא יקרים (רגילים).
מערכות רייד נמצאות בשימוש בארגונים בעלי צורכי אחסון מיוחדים (לדוגמא: אמינות יתרה, ביצועים משופרים, וכו'). מערכות אחסון אלה מורכבות מכוננים קשיחים רגילים (בממשקים שונים, כגון SATA, SCSI) אשר מוגדרים בתצורה המאפשרת להם לעבוד בשיתופיות בכדי לאפשר צרכים מיוחדים אלה.
שחזור מערכות רייד מצריך הכרות מעמיקה עם מספר רב של תצורות רייד וניסיון רב עם מספר גדול של בקרי רייד (RAID Controllers). חברת Recover בעלת ניסיון רב בשחזור מערכות רייד רבות. אנו משתמשים בכלי שחזור מיוחדים אשר פותחו על ידינו במשך זמן רב והוכיחו את יעילותם ואיכותם במספר רב מאוד של מקרים מורכבים. שחזור רייד מצריך טיפול המתאים לתצורת הרייד אשר בשימוש:
להלן מספר דוגמאות למערכות רייד מקובלות ולשחזורים של מערכות אלה:
• RAID Level 0: תצורה זו נקראת גם "רצועה" (Stripe) ובדרך כלל נמצאת בשימוש בארגונים אשר זקוקים לפתרונות אחסון מהירים במיוחד. בתצורה זו, שני דיסקים או יותר, פועלים ביחד בכדי לחלק את העומס על כל אחד מהדיסקים הבודדים. כתוצאה מחילוק העומס, המערכת כולה עובדת מהר יותר מכל דיסק בודד. במקרים רבים, בסיסי נתונים אשר עמוסים במידע רב ונמצאים בשימוש ע"י מספר רב של משתמשים עובדים בתצורה זו בכדי לשפר את ביצועי המערכת. חשוב לציין כי בתצורה זו מערכת הרייד זקוקה לכל הכוננים הקשיחים במערך בכדי לעבוד בצורה תקינה. במידה ואחד מהכוננים מפסיק לעבוד בצורה תקינה כל המערך מושבת.
במקרים בהם יש שימוש בתצורת Stripe בלבד (ללא תצורה משולבת) יש לדאוג לתקינותם של כל הכוננים ברייד. לכן, לפני תהליך השחזור יש לבדוק את כל הדיסקים בנפרד ולמצוא את הכוננים (או הכונן) הבעייתיים ולשחזר אותם. לאחר מכן יש לבחון את תוכנם של כל הכוננים ולהשתמש בכלים מיוחדים על-מנת "לחבר" את הכוננים הקשיחים בהתאם לתצורה של הבקר שהיה בשימוש. מכיוון שקיימים דגמים רבים ואפשרויות הגדרה רבות תהליך זה הוא מורכב ומצריך ניסיון רב וכלים מיוחדים אשר מאפשרים פעולה זו. לבסוף יש לבחון את המבנים הלוגים שקיימים על המערכת השלמה ולאמת את תקינותם.
• RAID Level 1: תצורה זו נקראת גם תצורת "מראה" (Mirror) ובדרך כלל נמצאת בשימוש בארגונים אשר זקוקים לפתרונות אחסון אמינים במיוחד. בתצורה זו כל כונן קשיח במערך הדיסקים מגובה ע"י כונן קשיח נוסף. בכדי שהכוננים תמיד יהיו זהים, בכל פעם אשר מידע נכתב (פעולת מחיקה גם מתבצעת ע"י כתיבה) למערך הדיסקים, הוא בעצם נכתב לשני כוננים נפרדים. בצורה זו, במידה ואחד מהכוננים הקשיחים נפגם, המערכת יכולה להמשיך לפעול ללא הפרעה ע"י שימוש בכונן הקשיח התקין (במערכות מסוימות ניתן להחליף את הכונן הפגום ללא הפרעה לפעילות השוטפת של המערכת בכדי לאפשר זמינות גבוהה למערכת וללא הפרעה למשתמשים). חשוב לציין כי בתצורה זו יש "בזבוז" של מקום אשר נגרם מכך שכל פיסת מידע רשומה על שני דיסקים שונים למקרה שאחד יפסיק לפעול (לדוגמא: שני דיסקים של 80GB בתצורה של Mirror מאפשרים גישה ל-80GB בלבד ולא ל- 160GB כמו למשל בתצורה של Stripe).
ברוב המקרים כאשר נדרש שחזור מערכות רייד בתצורת Mirror המצב יחסית פשוט – אחרי הכול תצורה זו מיועדת לשפר את אמינות או שרידות המערכת. אך עם זאת קיימות מספר בעיות במערכות רייד בתצורות אלו. לדוגמא: במקרים מסוימים בקר הרייד לא מזהה כי אחד הכוננים לא עובד כשורה ולא מתריע על כך (או לחילופין מתריע אך המשתמש אינו שם לב או לא מגיב מספיק מהר) כתוצאה מבעיה זו המידע נכתב רק על אחד הכוננים הקשיחים. במקביל, הכונן השני מפסיק לעבוד גם כן ולכן המערכת כולה מפסיקה לעבוד. במקרים אלה יש לבדוק את שני (או יותר) הכוננים הקשיחים בנפרד ולשחזר את הכונן המעודכן ביותר.
• Raid Level 5: תצורה זו נקראת גם "רצועה עם זוגיות" (Stripe with Parity) ובדרך כלל נמצאת בשימוש בארגונים אשר מעוניינים בתצורה בעלת ביצועים משופרים וגם אמינות משופרת (יותר מתצורת "רצועה" רגילה). היתרון של תצורה זו על תצורת ה "רצועה" היא שבמידה ואחד (לא משנה איזה) מהכוננים הקשיחים מפסיק לפעול, המערכת יכולה להמשיך לעבוד ללא הפסקה (כל עוד רק כונן אחד מכל המערך התקלקל). בתצורה זו, המספר המינימאלי של כוננים הוא 3, וה"בזבוז" קטן יותר מתצורת ה"מראה". לדוגמא, מערך דיסקים בעל 4 כוננים קשיחים של GB80 מאפשר גישה ל-GB240 (במקום GB160 בתצורת "מראה" ו-GB320 בתצורת "רצועה"). כתוצאה מאיזון של אמינות וביצועים, תצורה זו מאוד מקובלת בארגונים קטנים עד גדולים.
שיחזור RAID 5 מצריך בדיקה של כל הכוננים בנפרד בכדי לאתר את הכונן (או הכוננים) הבעייתי. מכיוון ש- RAID 5 בנוי לעבוד גם במידה ואחד מהכוננים הקשיחים התקלקל, מערכות רייד בתצורה זו זקוקות לשחזור במידה ויותר מכונן קשיח אחד התקלקל, או במידה ובקר הרייד התקלקל וכתוצאה מכך פגם במידע אשר נמצא על הכוננים. כמו כן, ישנם מצבים אשר אחד הכוננים מתקלקל והבקר אינו מדווח על בעיה, והבעיה מתעוררת רק כאשר כונן נוסף מפסיק לעבוד. במקרים מסוימים יש צורך לשחזר את שני הכוננים (או יותר) בכדי לשחזר את המידע המעודכן ביותר. גם כאן יש צורך בכלים מיוחדים בכדי "לחבר" את הכוננים הבודדים ולאפשר גישה למידע.
• RAID Level 6: תצורה זו דומה מאוד לתצורת "רצועה עם זוגיות" אך בעלת יכולת לעבוד גם אם שני כוננים קשיחים מתקלקלים באותו הזמן. כמובן שגם כאן, ה"בזבוז" במקום בא על חשבון אמינות המערכת. בתצורה זו המספר המינימאלי של הכוננים הקשיחים הינו 4 (בכוננים של 80GB שטח האחסון הוא 160GB, כמו ב"מראה", אך כמו ב- 5 RAID יחס זה משתפר ככל שמוסיפים כוננים קשיחים נוספים לתצורה זו).
תצורה זו בדומה לתצורה של RAID 5 בנויה בכדי לשפר את אמינות מערכות הרייד, אך גם כאן ישנם מקרים אשר דורשים שיחזור מידע, לדוגמא: בקר רייד שהתקלקל וכתוצאה מכך פגם במידע על הכוננים הקשיחים, או לחילופין נזק ליותר משני כוננים קשיחים באותו הזמן (תקלות מרובות עלולות להיגרם כתוצאה מקצר חשמלי או כתוצאה מפגם ביצור של כוננים זהים, וכו'.)
ישנן תצורות נוספות כגון 10 RAID 01 ,RAID ותצורות מכוננות נוספות אשר נמצאות בשימוש במקרים מיוחדים אחרים. תצורות אלה מצריכות בדיקה יסודית של הדיסקים הבודדים, שיחזור של דיסקים במקרים מסוימים, ושימוש בכלים מיוחדים בכדי "לחבר" את הכוננים הבודדים בתצורה של הבקר המקורי. תהליך זה מצריך ניסיון רב, והכרות מעמיקה עם סוגים רבים של בקרים בצורות רבות. לבסוף יש צורך לאמת את תקינות המבנים הלוגיים אשר נמצאים על המערכת (למשל מערכות קבצים של (Windows, Linux, OSX, etc..