גיבוי

גיבוי בטכנולוגיית המידע מתייחס ליצירת עותקים ("גיבויים") של נתונים כך שאלו יכולים לשמש לשחזור המידע המקורי לאחר אירוע (פיזי או לוגי) הגורם לאובדן הנתונים המקוריים מאמצעי לאחסון נתונים בו הם הוחזקו. גיבויים אלו משמשים בעיקר לשתי מטרות: הראשונה היא שחזור מידע בעקבות אסון ("התאוששות מאסון") והשנייה היא שחזור מידע שנמחק או הושחת. לרוב יהיו הגיבויים קו ההגנה האחרון כנגד איבוד נתונים וזאת מכיוון שהם השיטה הכי פחות נוחה והכי פחות ממוקדת להתגברות על אובדן כזה.

מערכת גיבוי מכילה לפחות עותק אחד של כל הנתונים, דבר המביא לניסיונות לחסוך בשטח האחסנה הדרוש. ארגון שטח האחסון וניהול הגיבוי עצמו הם לרוב החלק המורכב יותר במשימת הגיבוי כאשר ישנן אפשרויות רבות למערכת האחסון הדרושה. ישנן דרכים שונות רבות בהן התקנים אלו יכולים לספק יתירות גאוגרפית, אבטחת נתונים, ניידות וביצועים. היות שגיבוי אמין ועדכני של המידע דורש משאבי זיכרון וזמן, תדירות הגיבויים תלויה בחשיבות השינויים שהמידע עבר, ובתדירות התרחשותם.

לפני משלוח נתונים אל מערכת האחסנה יש לבחור אותם, להוציא אותם ולעיתים אף לבצע בהם שינויים ובמהלך השנים פותחו שיטות רבות לעשות כן. שיטות אלה כוללות אופטימיזציות עבור קבצים פתוחים, מקורות נתונים פעילים כמו גם דחיפה, הצפנה, ביטול כפילות ואחרות. מורכבות תהליך הגיבוי הביאה לפיתוח שיטות רבות לאימות של הנתונים ולהגדרת רמת האמינות שלהם מבחינה טכנית. נקודה נוספת שנלקחת בחשבון היא הגורם האנושי המעורב בתהליך.

בשל חפיפה ניכרת בטכנולוגיה, ישנו בלבול ניכר בין גיבויים וגיבוי מערכות לבין ביצוע ארכוב ומערכות סובלניות לתקלות. ההבדל בין ארכיונים לבין גיבויים הוא בכך שארכיון מהווה עותק ראשי של הנתונים בעוד גיבוי מהווה עותק משני שלו. בעוד שגיבוי יוצא מנקודת הנחה כי נתונים הלכו לאיבוד הרי שמערכות סובלניות לתקלות יוצאות מנקודת הנחה שהנתונים לא אבדו באמת.

מערכת גיבוי גדולת מימדת (הגובה המצולם הוא כ-1.8 מטר). המערכת מכילה מאות קלטות גיבוי המסומנות במדבקה עם ברקוד, ומסודרות במדפים. בעת הצורך, זרוע רובוטית שולפת את הקלטת המתאימה ומכניסה אותה אל הכונן לטובת קריאה או כתיבה של נתונים

אחסנה - הבסיס של מערכת גיבוי

[עריכת קוד מקור | עריכה]

מודל אחסון הנתונים

[עריכת קוד מקור | עריכה]

כל אסטרטגית גיבוי חייבת להתחיל במודל אחסון הנתונים. נתוני הגיבוי צריכים להיות מאוחסנים בדרך כלשהי וכנראה צריכים להיות מסודרים לפחות במידת מה. שיטת הארגון יכולה לנוע בטווח שבין דף נייר עם רשימה של כל סרטי הגיבוי והתאריכים בהם לבין קטלוג ממוחשב במסד נתונים יחסי. למודלי אחסון נתונים שונים יש יתרונות וחסרונות שונים והבחירה בהם מושפעת גם משיטת המחזור של מתקני אחסון הגיבוי.

שיטות ארגון מקובלות כוללות בין השאר:

בלתי מאורגן
אחסון בלתי מאורגן יכול להיות ערמה של דיסקים או תקליטורים המכיל את הנתונים עם רישום מינימלי של זמן הגיבוי. בעוד שיטה זו היא הפשוטה ביותר הרי הסיכויים להשיג זמינות של הנתונים בה הם הנמוכים ביותר.
גיבוי מלא + גיבוי מצטבר
מודל זה נועד לאפשר ביצוע מספר גיבויים של המקור. בשלב הראשון נלקח גיבוי מלא (של כל המידע) ולאחר מכן מתבצע גיבוי מצטבר של הקבצים שהנתונים בהם שונו מאז הגיבוי המלא הקודם או הגיבוי המצטבר הקודם. שחזור שלם לנקודה מסוימת בזמן דורש איתור של הגיבוי המלא האחרון שנעשה לפני נקודה זו ושל כל הגיבויים המצטברים שנלקחו ממנו ועד הנקודה אליה רוצים לשחזר. יתרונו של מודל זה הוא בכך שישנה סבירות גבוהה לשחזור חלקי לפחות וניתן להשתמש בו עם אמצעים נשלפים כזה כסרטי גיבוי ודיסקים אופטיים. חסרונותיו הן הצורך בסדרה ארוכה של גיבויים מצטברים ודרישות האחסון הגבוהות בעקבות כך.
גיבוי מלא + גיבוי שינויים
מודל זה נבדל מהמודל הקודם בכך שהגיבויים החלקיים כוללים את השינויים מהגיבוי המלא האחרון, גם אם נשמרו כבר בגיבוי חלקי קודם. יתרונו הוא בכך שיש צורך בגיבוי חלקי אחד בלבד נוסף על הגיבוי המלא.
שיקוף + הוראות חזרה
מודל זה הוא דומה למודל גיבוי מלא + גיבוי מצטבר, כאשר ההבדל הוא בכך שנשמר המידע האחרון בצירוף הוראות כיצד לחזור למצבים קודמים. יתרונו של מודל זה הוא בדרישת גיבוי מלא בלבד כאשר כל גיבוי חלקי מתבצע באופן מיידי על ידי דחיקת הנתונים הקודמים להוראות החזרה. חסרונו הוא בכך שהוא דורש שיקוף של הנתונים כך שלא ניתן להשתמש בו בנוחות באמצעי גיבוי נתיקים.
הגנה רצופה על הנתונים
מודול זה לוקח את זה הגיבוי צעד קדימה ובמקום קביעת לוח זמנים תקופתי, המערכת רושמת כל שינוי בנתונים, דבר הנעשה בדרך כלל ברמה נמוכה יחסית (רמת הבית הבודד או הבלוק הבודד) ולא ברמת הקובץ או גבוהה מכך (רפליקציה של מסדי נתונים היא חריג בולט לכלל זה). גיבוי כזה נבדל משיקוף נתונים באמצעות RAID או טכנולוגיות דומות בכך שישנו רישום הפעולות שבוצעו כך שניתן לחזור לנקודה קודמת בזמן.
קלטת גיבוי מסוג LTO-2, ללא המכסה העליון

אמצעי אחסון

[עריכת קוד מקור | עריכה]
ערך מורחב – אמצעי לאחסון נתונים

כל גיבוי דורש אמצעי אחסון כלשהם המספקים את המקום הדרוש על מנת לשמור את הנתונים. בעוד שישנם סוגים רבים מאוד של מדיות אחסון האפשריים לגיבוי, המקובלים ביניהם מפורטים להלן:

סרט מגנטי
סרט מגנטי שימש במשך זמן רב כמדית אחסון המועדפת עבור גיבוי וארכוב של נתונים, כאשר היה זול יותר בסדר גודל מאשר דיסק קשיח בעל נפח דומה אולם לאחרונה הפער קטן מאוד. ישנו מגוון גדול מאוד של פורמטים, רבים מהם פרטיים או משמשים בשווקים ספציפיים כמו MainFrame או סדרה מסוימת של תחנות עבודה. סרט מגנטי הוא בעל גישה סדרתית, כך שאפילו אם זמני גישה ארוכים ניתן להגיע לקצבי קלט/פלט גבוהים (בשל ייתור הצורך בגישה לחלקים שונים של המדיה), לעיתים אף יותר מאשר דיסקים קשיחים.
דיסק קשיח
יחס הנפח/מחיר של דיסק קשיח הולך ומשתפר עם השנים וכיום הוא קרוב יחסית לזה של סרט מגנטי. היתרונות העיקריים דיסק קשיח הם זמן גישה נמוך, זמינות, קיבולת ונוחות שימוש. דיסקים חיצוניים יכולים להתחבר לשרת דרך ממשקים מקומיים כמו SCSI ,USB או FireWire, או דרך יותר ממשקי רשת כמו Ethernet, iSCSI או רשת אופטית. כמה מערכות של דיסקי גיבוי תומכות בביטול כפילות של הנתונים היכולה להקטין דרמטית את הכמות הדרושה לאחסנת גיבוי נתונים סדירים.
דיסק אופטי
תקליטור הניתן לצריבה יכול לשמש כמכשיר גיבוי. יתרונותיו כוללים את היכולת לקרוא אותו בכל מחשב עם כונן תקליטורים ומחיר זול יחסית. בנוסף תקליטורים רבים מאפשרים כתיבה אחת בלבד כך שלא ניתן לדרוס נתונים ישנים וניתן להשתמש בהם לצורכי ארכוב. אפשרות אחרת היא להשתמש בהם לגיבוי באמצעות פורמט המאפשר כתיבה מחדש. עם זאת, גם לאחר הגידול בשטח האחסון המוצע על תקליטור שיטה זו יקרה יחסית.
דיסקט
במשך שנות השמונים והתשעים המוקדמות היה הדיסקט מדיה פופולרית לגיבוי. עם זאת הגידול בנפחי האחסון הדרושים הפכה את האופציה הזאת ללא שימושית.
התקני מצב מוצק
התקנים אלו הידועים יותר כזיכרון הבזק או Disk on key אמנם יקרים יחסית עבור הקיבולת שלהם אולם ניידותם הגבוה הופכים אותם לזמינים יחסית.
שרות גיבוי מרוחק
שירות זה נהיה פופולרי עם הגדלת הזמינות של חיבורים רחבים לרשת (לרוב רשת האינטרנט הציבורית אך לעיתים נעשה שימוש גם ברשת פרטית). גיבוי דרך הרשת לאתר מרוחק יכול להגן כנגד תסריטי המקרה הגרוע ביותר כשריפה, הצפה, רעידת אדמה או פגיעה גרעינית היכולים להשמיד כל גיבוי הנמצא בטווח הקרוב של המקור. החיסרון לשירות גיבוי מרוחק הוא בכך שהתקשורת דרך הרשת היא איטית יותר מאשר הגישה המקומית בשל רוחב הפס וגם במקרים בהן מגבלה זו איננה משמעותית גיבוי הנתונים מחייב מעבר נתונים בעל מהירות מקסימלית של מהירות כך שגיבוי לאתר מרוחק עשוי להיות איטי גם בנסיבות הטובות ביותר. בנוסף גיבוי דרך הרשת, במיוחד אם היא ציבורית, עשוי לאפשר גישה גם של גורמים בלתי מורשים למידע.

מודל ניהול הנתונים

[עריכת קוד מקור | עריכה]

בלי קשר למודל אחסון הנתונים או לאמצעי האחסון, מודל ניהול נתוני הגיבוי צריך להיבחר תוך איזון בין נגישות, אבטחה ועלות:

מקוון
גיבוי מקוון הוא בדרך הנגיש ביותר, וניתן להתחיל שיחזור שלו בזמן של אלפיות שנייה ואף פחות. דוגמאות טובות לכך הן דיסק קשיח פנימי או מערך אחסון נתונים. סוג זה של אחסון נתונים הוא מאוד נוח ומהיר, אבל הוא יקר באופן יחסי. אחסון מקוון הוא גם פגיע למחיקת מידע, דריסת נתונים, מכוונת או מקרית

וכן לטעויות לוגיות אחרות.

near line
אחסון זו הוא לרוב פחות נגיש ופחות יקר מאחסון מקוון, אבל עדיין שימושי עבור אחסון נתוני גיבוי. דוגמה טובה לסוג זה הוא ספריית קלטות עם זמני שחזור הנעים בין שניות למספר דקות בה מכשיר מכני מסוגל להזיז את הקלטת לכונן כך שהנתונים יכולים להיקרא אותו או להיכתב.
לא מקוון
סוג זה דומה לקודם פרט לכך שיש צורך בפעולה אנושית על מנת להשתמש בו. סוג זה יכול להתבטא למשל בספרית קלטות הנמצאת בארון אותה יש להכניס ידנית לכונן. זמן הגישה לסוג זה יכול לנוע בין שניות לשעה.
גיבוי מחוץ לאתר
על מנת להגן כנגד אסון או בעיה ספציפית לאתר, נשלחים לעיתים קרובות הגיבויים למיקום אחר. מיקום זה יכול להיות החל מביתו או משרדו של מנהל המערכת וכלה באתר מאובטח כנגד אסון בעלת שליטת טמפרטורה היכול לשמש לאחסון הנתונים.
אתר גיבוי או מרכז התאוששות מאסון
במקרה של אסון, הנתונים על מדיית גיבוי לא מספיקים להתאוששות. יש צורך במערכות מחשב שהנתונים יכולים לעבור שיחזור עליהן וברשתות נתונים מתאימות. כמה ארגונים מחזיקים אתר גיבוי משלהם עבור משימה זו בעוד אחרים רוכשים יכולת זאת מחברה המתמחה בכך. אתר גיבוי הוא אופציה יקרה מאוד, כך שלרוב גיבוי איננו האופציה המועדפת להעברת נתונים אליו ולרוב משתמשים ברפליקציה, קרי העברת נתונים באופן רציף כך שאתר הגיבוי יהיה מעודכן ככל האפשר.

בחירה, הוצאה ושינוי של נתונים

[עריכת קוד מקור | עריכה]

בחירה והוצאה נתונים

[עריכת קוד מקור | עריכה]

בחירת הנתונים לגיבוי מושפעת משני שיקולים מנוגדים - כאשר הגיבוי מכיל נתונים מיותרים, שטח האחסון המוקדש לגיבוי מתמלא במהירות, לעומת זאת אם הגיבוי חלקי מדי אזי מידע קריטי יכול ללכת לאיבוד. לרוב האיזון הזה מתבצע באמצעות גיבוי הנתונים שהשתנו בלבד (שההגדרה שינוי משתנה בהתאם להחלטה).

העתקת קבצים
העתקת הקבצים על ידי כלי ייעודי של מערכת ההפעלה (או תוכנית שירות) למקום שונה מהמיקום המקורי.
גיבוי מערכת קבצים
העתקת מערכת הקבצים המכילה את הנתונים למיקום אחר. תהליך זה כולל בדרך כלל הפיכת מערכת הקבצים ללא פעילה והרצת תוכנית ייעודית כמו dump, פעולה זו נקראת גם גיבוי מחיצה (בהתאם למערכת ההפעלה). סוג זה של גיבוי יכול להיות מהיר מגיבוי קבצים ויש תוכניות המאפשרות לשחזר ממנו קבצים ספציפיים.
זיהוי קבצים שהשתנו
כמה ממערכות הקבצים מכילות דגל ארכוב עבור כל קובץ המסמן האם הקובץ שונה מאז הגיבוי האחרון. תוכנות גיבוי מסוימות מסוגלות להשוות את תאריך השינוי האחרון של הקובץ עם הגיבוי ובכך לקבוע האם יש לגבותו.
זיהוי בלוקים שהשתנו
שיטה זו היא מיקוד של השיטה הקודמת לרמה של בלוקים מסוימים שהשתנו והיא דורשת רמה גבוהה יותר של אינטגרציה בין מערכת הקבצים ותוכנת הגיבוי.
ניהול גרסאות במערכת קבצים
ניהול גרסאות במערכת קבצים פירושו שלוג השינויים עבור כל קובץ הוא נגיש למשתמש. ניהול כזה מאפשר גישה לכל גרסה קודמת של הקובץ הנשמרת במערכת הקבצים (לרוב ניתן להגדיר גם זמן התחלה מאוחר מאשר זמן היצירה של הקובץ).

בחירה והוצאה של נתונים בשימוש

[עריכת קוד מקור | עריכה]

אם מערכת מחשב היא בשימוש בזמן הגיבוי למעלה, האפשרות של קבצים היה פתוח עבור קריאה או כתיבה היא סבירה. אם קובץ הוא פתוח, התוכן על דיסק עלול שלא כהלכה ליצג מה שבעלים של הקובץ התכוון לגבות, במיוחד אם מדובר במסד נתונים כלשהו.

צילום תמונת מצב (Snapshot)
צילום תמונת מצב מיידית הוא פונקציה המסופקת על ידי מספר מערכות אחסון המסוגלות לשמור עותק של הקובץ בנקודה מסוימת בזמן, בדרך כלל על ידי מנגנון העתקה בזמן כתיבה. דרך יעילה לגיבוי נתונים חיים הוא השתקה זמנית של פעילות הקלט/פלט (קרי סגירת כל הקבצים), צילום המצב וחידוש הפעילות. על ידי רצף פעולות זה ניתן לגבות את תמונת המצב באמצעות השיטות הרגילות. בעוד שלקיחת תמונת מצב היא שיטה יעילה לאפשור הסתכלות על מערכת קבצים כפי שהייתה בנקודות שונות בזמן, קשה להגדירה כשיטת גיבוי בפני עצמה.
גיבוי קבצים פתוחים
הרבה חבילות גיבוי מסוגלות לטפל גם בקבצים פתוחים. חלקן משתמשות בפשטות בבדיקה האם הקובץ פתוח, אם לא הן נועלות אותו ואם כן הן מנסות יותר מאוחר.
כאשר מגבים קבצים פתוחים יש לקחת בחשבון את העובדה כי גיבוי קובץ גדול (למשל קובץ מידע של מסד נתונים) יכול לקחת מספר דקות, כך שיש להקפיד לקחת תמונת מצב הנכונה לזמן מסוים ולא את התוצאות המתקבלות מקריאה רגילה המכילה שינויים המתבצעים תוך כדי התהליך. מצב זה מחייב שיטה המונעת ביצוע שינויים במהלך הגיבוי או מאפשרת לשמור את תמונת המצב המקורית גם לאחר ביצוע השינויים. גיבוי קובץ בזמן שינויו, כך שהחלק הראשון בגיבוי מייצג נתונים לפני השינוי והחלק השני מייצג את הקובץ לאחר השינויים הוא לרוב איננו שימושי וזאת בשל התלות הקיימת לרוב בין חלקי הקובץ (למשל מחיקת התמונה האחרונה מהסרט בזמן שהפתיח המכיל את מספר התמונות כבר נשמר תביא לכך שהקובץ לא יוכל להיות מוצג).
גיבוי קר של מסד נתונים
במהלך גיבוי קר, מאגר הנתונים סגור או נעול ולא זמין למשתמשים. קובצי הנתונים לא משתנים במהלך ההעתקה ולכן מסד הנתונים מסונכרן בזמן השחזור.
גיבוי חם של מסד נתונים
מערכות ניהול מסדי נתונים מציעות גיבוי של מאגר הנתונים בזמן שזה הוא מקוון ובשימוש ("חם"). שיטה זו כוללת בדרך כלל קובצי מידע לא עקביים ועוד יומן של שינויים שנעשו בזמן הגיבוי. בזמן השחזור, השינויים שנשמרו בקובצי היומן מבוצעים על קובצי הנתונים וכך מתקבל מסד נתונים מסונכרן עם עצמו ושמיש.

בחירה והוצאה של מטה נתונים

[עריכת קוד מקור | עריכה]

לא כל המידע הקיים במחשב מאוחסן בקבצים. שחזור מדויק של מערכת שלמה דורש מעקב גם אחרי נתונים שלא נשמרים בקבצים:

תיאור מערכת
מפרטים המערכת אותה צריך לשחזר אחרי האסון.
סקטור אתחול
לעיתים קרובות יותר קל ליצור סקטור אתחול חדש מאשר לשחזר אחד, אבל עדיין, זה בדרך כלל הוא לא קובץ רגיל והמערכת לא ניתנת לשחזור בלעדיו.
תיאור מערכת הקבצים והדיסקים
המבנה (הלוגי והפיזי) של הדיסקים המקוריים, כטבלאות מחיצות, והגדרות מערכת קבצים, נדרש כדי לשחזר את המערכת.
מטה נתונים עבור קובץ
עבור כל קובץ ישנן הרשאות, תאריכי יצירה, סוג הקובץ ועוד, אותן צריך לשחזר על מנת להביא את המערכת למצבה המקורי.
מטה נתונים של המערכת
מערכות הפעלה שונה הן בעלות דרכים שונות של אחסון הגדרות תצורה. מערכת חלונות למשל מחזיקה registry המכיל מידע ואותו קשה יותר לשחזר מאשר קובץ רגיל.

שינוי הנתונים

[עריכת קוד מקור | עריכה]

לעיתים קרובות יעיל לשנות את הנתונים לגיבוי על מנת לבצעו בצורה אופטימלית. פעולות אלו יכולות לשפר את מהירות הגיבוי, את מהירות השחזור, את אבטחת נתונים ואת השימוש במקום:

כיווץ

שיטות שונות יכולות לשמש להקטנת גודל האחסון הנדרש עבור נתוני המקור. כיווץ הוא לעיתים קרובות תכונה מובנית של טייפ גיבוי.

ביטול כפילות
כאשר מערכות דומות מגובות לאותו יעד גיבוי קיים פוטנציאל גדול לכפילות. למשל, אם 20 תחנות עבודה של חלונות היו מגובות לאותו יעד, אזי יהיה חלק שכיח בגיבוי של קובצי מערכת משותפים וניתן לשמור רק עותק אחד של המידע עבור השחזור של כל התחנות. טכניקה זו יכולה להיות ברמת הקובץ או אפילו על בלוקים של נתונים והיא מאפשרת לעיתים קיטון משמעותי בדרישות האחסון. ביטול כפילות יכולה להתבצע על השרת לפני שליחת הנתונים למדיית גיבוי, כך שגם תקטין רוחב פס נדרש לשליחת נתוני הגיבוי שלו למדית הגיבוי. התהליך יכול להתבצע גם במכשיר הגיבוי עצמו.
שכפול
לפעמים הגיבוי משוכפל לסט שני של מדיות אחסון. המטרות יכולות להיות אופטימיזציה של הגיבוי או שמירת עותק נוסף של הגיבוי במיקום שונה או במדיה שונה.
הצפנה
מדיה נתיקה המשמשת לאחסון גיבוי יכולה להוות סיכון אבטחה אם היא נגנבת או נאבדת. הצפנת הנתונים על מתקני אחסון כאלו יכולה להקל על הבעיה, אבל יוצרת בעיות חדשות. הראשונה, הצפנה הוא תהליך הצורך יכולת עיבוד רבה כך שהגיבוי מואט. השנייה, לא ניתנת לדחוס ביעילות נתונים מוצפנים (אף על פי שחזרה על נתונים מקלה על ניסיון פיצוח, הרבה תהליכי הצפנה דוחסים את הנתונים כחלק מהתהליך). השלישית, הביטחון הנובעת מהצפנת הגיבויים הוא יעיל רק באותה מידה שתהליך ניהול מפתחות ההצפנה יעיל.
Staging
לפעמים הגיבוי מתבצע תחילה לדיסק המשמש לאחסון תוצאות ביניים. תהליך זה יכול להועיל אם יש בעיה בתיאום המהירות של היעד הסופי עם המקור, דבר הקורה לעיתים קרובות בגיבוי מבוסס רשת. מיקום ביניים זה יכול לשמש גם כמקום לביצוע השינויים האחרים.

ניהול תהליך הגיבוי

[עריכת קוד מקור | עריכה]

הגיבוי הוא תהליך - כל עוד נוצרים נתונים חדשים ושינויים נעשים, הגיבוי צריך להיות להתעדכן. אנשים וארגונים עם כל כמות מחשבים - ממחשב אחד לאלפים (או אפילו מיליונים) הם בעלי דרישות הגנה על הנתונים. בזמן שקנה המידה שונה, המטרות וההגבלות זהים בעיקרם. כמו כן, מי שביצע את הגיבוי צריך לדעת באיזה מידה הם הצליחו, בלי קשר לקנה מידה.

נקודת שחזור רצויה (RPO)
הנקודה בזמן שהשחזור צריך לשקף, במהותו מדובר בנקודה אליו חוזרים לאחר השחזור. הנקודה הכי רצויה היא הנקודה לפני מאורע איבוד הנתונים. אפשור שחזור דורש סינכרון בין המקור לבין הגיבוי וככל שדרישה זו תקיפה יותר כך יש צורך בגיבוי תכוף יותר
משך השחזור (RTO)
משך הזמן שחולף בין האסון והחזרה לפעילות רגילה.
אבטחת נתונים
בנוסף לשמירת גישה לנתונים עבור הבעלים, יש להגן על הנתונים מגישה לא מורשית. דבר זה מצריך שימוש נכון בהצפנה ובמדיניות הגישה אל מתקני האחסון.
השפעות מערכת
כל גיבוי צריך לקחת בחשבון את השפעות המערכת, כל מערכות הגיבוי משפיעות על המערכת אותה מגבים. אם ההשפעה היא משמעותית, הגיבוי צריך להתבצע בחלון זמן מוגבל או להיות מוחלף בשיטת הגנת נתונים אחרת, לרוב יקרה יותר.
עלויות של חומרה, תוכנה, עבודה
כל הסוגים של אמצעי גיבוי הם בעלי עלות לא אפסית. התיאום הנכון בין העלות של אמצעי הגיבוי (במשך הזמן) עם צורכי הגיבוי הוא חלק חשוב מתוכנית הגיבוי. כל תוכנית גיבוי דורשת עבודה מסוימת, אולם ככל שהיא מסובכת יותר כך העבודה הנדרשת רבה יותר ועלותה יכולה להגיע לסכומים משמעותיים.
רוחב פס
גיבוי מערכות רשתי יכול להיות מושפע מרוחב הפס של הרשת.

מימוש הדרישות של הגיבוי תוך ציות למגבלות שלו לרוב אינן משימה פשוטה, שימוש בכלים הנכונים ובתהליכים הנכונים יכול להיות משמעותית על ביצוע הגיבוי.

קביעת לוח זמנים
מתזמן גיבוי יכול לשפר את הנאמנות ועקביות של גיבוים על ידי הקטנת התלות ברכיב האנושי. הרבה חבילות גיבוי כוללת את היכולת הזאת.
אימות
מעבר לתהליך הפעולות הרגילות, המשתמשים או המערכת צריכים לוודא את נכונות הגיבוי. הכוח להעתיק כל הנתונים של או על מערכת דורש גישה לא מוגבלת. שימוש במנגנון אימות הוא דרך טובה למנוע שימוש בגיבוי למטרות בלתי מורשות.
שרשרת של אמון
מתקן אחסון נשלף או כזה הניתן לטיפול פיזי חייב להיות מטופל על אנשים מורשים, אחרת מערכת ההרשאות איננה מועילה.

מדידת התהליך

[עריכת קוד מקור | עריכה]

אימות תוכנית הגיבוי, דורש לכלול נקודות פיקוח וניהול של נתונים היסטוריים.

אימות גיבוי
תהליך הבודק שבעלי הנתונים יכולים לקבל מידע לגבי איך הנתונים שלהם גובו. תהליך זה משמש גם כן להוכחת ציות להוראות גופי רגולטוריזציה המפקחים על הארגון, למשל, חברת ביטוח רפואי בארצות הברית נדרשת על ידי HIPAA להראות "הוכחה" שתוכנית הגיבוי שלהם עומדות בדרישות. אסונות, מורכבות הנתונים, ערך הנתונים והגדלת התלות באמצעי אחסון של נתונים הגדלים והולכים תורמים להגדלת החשיבות של הגיבויים לנושא ההמשכיות העסקית. מסיבה הזאת, הרבה ארגונים משתמשים בפתרונות של גוף-שלישי או "עצמאי" לבדיקה, אימות ואופטימזציה של הגיבוי שלהם.
דיווח
בסביבות מחשוב גדולות, דוחות נם שימושיים עבור ניטור שימוש במדיה, מצב ההתקן, שגיאות ומידע אחר על תהליך הגיבוי.
רישום
בנוסף לדוחות היסטוריים, רישום פעולות ושינויים שימושי לניטור מערכת גיבוי.
אימות
הרבה תוכניות גיבוי עושות שימוש ב-checksum או hash על מנת לוודא נאמנות של הגיבוי. לשיטות אלו מספר יתרונות: הראשון, ניתנת לאמת נכונות הנתונים ללא התייחסות לקובץ המקורי, אם הקובץ המאוחסן בגיבוי יש checksum זה, יש סבירות גבוהה שהוא נכון. השני, מספר תוכניות גיבוי יכולות להשתמש ב-checksum על מנת להימנע משמירת עותקים מיותרים של קבצים ובכך לשפר את מהירות גיבוי, תוכנה השימושית במיוחד בשביל תהליך ביטול הכפילות.
ניטור הגיבוי
ניתן לנטר את תהליכי הגיבוי על ידי מרכז צד שלישי. מרכז זה מתריע למשתמשים על שגיאות שהתרחשו במהלך הגיבויים האוטומטיים. ניטור גיבוי דורש תוכנה מסוגל לתקשר עם שרתי הגיבוי במקרה של שגיאות.

קישורים חיצוניים

[עריכת קוד מקור | עריכה]
ויקישיתוף מדיה וקבצים בנושא גיבוי בוויקישיתוף