✕ סגור 
צור קשר
תודה על ההתעניינות .

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form

אז מה לעזאזל קרה לגוגל ב-2.6?

IsraelClouds
|
קלה
|
Jun 17, 2019
alt="facebook"alt="linkedin"להרשמה לניוזלטר

אין ספק שאחד הדברים שאנשי טכנולוגיות המידע הכי מרוצים ממנו בשנים האחרונות, הוא המעבר של האפליקציות, השירותים והמידע אל הענן, מה שאפשר להם להתרכז בנושאים רבים שאינם בניה ותחזוק התשתית בארגון. אך אליה וקוץ בה, ומחשוב הענן מביא איתו לא מעט אירועים בלתי צפויים שנובעים מהמורכבות של האינטרנט והחיבור לענן. אם כבר הספקתם לשכוח במה מדובר, המציאות מזכירה לנו זאת מדי פעם לפעם, ביחוד כאשר אנו נתקלים בקריסה של שירות אינטרנטי מוביל כלשהו.


ברבע שעה קריטית ב-2.6, חברת Thousandeyes גילתה קריסת רשת ברשת של גוגל שהשפיעה על שירותים שמתבססים על פלטפורמת הענן של גוגל ברחבי ארה"ב. הקריסה נמשכה במשך יותר מארבע שעות, והשפיעה על שירותים שונים כמו יוטיוב,  g suiteומנוע העיבוד של גוגל. כתוצאה מכך, ריכזנו עבורכם את מה שקרה, ומה אתם צריכים לחשוב על יכולת ההתאוששות והשקיפות שכדאי לכם לקחת בחשבון כאשר אתם עוברים אל שירותי הענן.


רמזים מטרימים


חברת TE החלה לראות השפעות הקשורות גם לרמת המשתמש וגם לרמת המאקרו של הרשת כבר בשעה 12 בצהריים, מה שקרה בד בבד עם הודעות ודיווחים על הנושא ברשתות החברתיות השונות. בתרשים 1 ניתן לראות את התפוצה של התקלה דרך 249 נקודות עולמיות של סוכני הענן של TE, הממוקמים ב-170 ערים שהשתמשו בתוכן המאוחסן על אינסטנס של GCE על GCP במזרח ארה"ב, אם כי הם קיבלו שירות דרך רשת קצה של CDN. משתמשים שניסו לגשת לשירותים המתבססים על GCP, כבר החלו להרגיש שמשהו לא עובד כשורה.

תרשים 1


בתרשים 2 ניתן לראות את ההשפעה של איבוד הפקטות – 100%, שהשפיעו בעיקר על משתמשים מרחבי העולם שניסו לגשת לשירותים המאוחסנים על שרתי GCP במערב ארה"ב.

תרשים 2


ברמת המאקרו, גם יכלנו לראות בעיות של אובדן פקטות וחיבורים שהשפיעו על מיקומים של הרשת של גוגל במזרח ארה"ב בערים כמו אשברן, אטלנטה ושיקאגו. לדוגמא, בתרשים 3 ניתן לראות מיפוי טופולוגי של מיקומי הרשת של גוגל. הצבע הכחול הבהיר מצביע על כמות המקורות המשיקים בכל מיקום, אשר ניסו להגיע לשני דומיינים המאוחסנים בגוגל, ונמצאים בצד ימין.


בין שתי נקודות אלו, 15 השקות הנמצאות ברשת של גוגל חוות אובדן פקטות כבד שמונע טראפיק ממקורות משיקים המנסים להגיע לדומיינים של אותם שירותים. הערת צד מעניינת היא שהחלק התחתון של הטופולוגיה בתרשים 3 מראה עדות לכך שישנן בעיות חיבור המשפיעות על הרשת של גוגל בהודו.

תרשים 3


מנקודת מבט של החיבור, תצוגת הדרכים הראתה נפילות בתעבורה בקצה הרשת של גוגל, כפי שניתן לראות בתרשים 4. למעשה, במשך 3.5 שעות מתוך 4+ השעות של הקריסה, ראינו אובדן פקטות מוחלט עבור ניטור גלובאלי של מקומות המנסים להתחבר לשירות שנמצא על GCP במערב אמריקה. אובדן נוסף נראה עבור אתרים המאוחסנים על חלקים מסוימים של GCP במזרח ארה"ב.

תרשים 4


למרות זאת, התקלה לא הייתה מוחלטת בקרב האזורים המושפעים. לדוגמא, בתרשים 5 ניתן לראות שירות אחר שמבוסס על GCP במערב ארה"ב, וניתן היה להשתמש בו באופן מלא במהלך שעות הקריסה.
למעשה, רוב האזורים של GCP לא הושפעו מהקריסה, כולל אזורים בארה"ב, אירופה וכו'. לדוגמא, בתרשים 6 ניתן לראות שרת במערב אירופה הממוקם בהולנד, שנשאר זמין במהלך תקופת הקריסה. הסטטוס הירוק מראה את הסוכנים הגלובאליים המשמשים לניטור שדיווחו על אובדן פקטות אפסי.

תרשים 5


האנליזה של גוגל


גוגל שמה לב לבעיות כבר בשלב מוקדם, והכריזה על הפרעות שעלולות לחול בשירותים המבוססים על שירות הענן שלה, כבר כ-25 דקות לאחר הדיווח הראשוני (כפי שניתן לראות בתרשים 6). ב-12:53 כבר התקבל עדכון על כך שתקלות הרשת קשורות לבעיות רשת נרחבות, וכבר בשעה 13:36 גוגל זיהתה את הבעיה כקשורה לרמות גבוהות של עומס ברשת במזרח ארה"ב, שהתקשרו לאובדן הפקטות המוגבר שהתחלנו לראות כבר לפני ההכרזה (ע"ע תרשים 2).

תרשים 6

תרשים 7


שחזור השירות


בערך בשעה 15:30, כבר התחלנו לראות הקלה בנתוני אובדן הפקטות ושיפור בגישה לשירותי גוגל, כמו שניתן לראות בתרשים 8 שמראה עדכון בסטטוס עבור חיבור לשירות ב-GCP הממוקם במערב ארה"ב. הגישה לשירותים המשיכה להשתפר במהלך השעה שעברה מאז, כפי שניתן לראות בנתונים.

תרשים 8


בסופו של יום, השירות חזר לפעילות מלאה ותקינה סמוך לשעה 16:45, כפי שניתן לראות בתרשים 9.

תרשים 9


בשעה 17:09, גוגל דיווחה שבעיית העומס ברשת נפתרה עבור כל המשתמשים שהושפעו מכך, כמו שניתן לראות בתרשים ב10. בנוסף, הם הבטיחו חקירה מעמיקה בנוגע לנושא.

תרשים 10


מה משתמשי הענן יעשו עכשיו?


אחת מהמסקנות החשובות שכדאי לנו לקחת בנוגע לתקלות בענן היא שחשוב במיוחד לוודא שתשתית הענן שלכם כוללת דרכי פעולה מספקות, בין אם מדובר על התבססות במספר אזורים או אפילו שימוש במספר שירותי ענן, ובכך להגן על התשתית שלכם ממקרים עתידיים כאלו. אחרי הכל, זה רק טבעי להניח שמתישהו יהיו תקלות הקשורות לתשתית טכנולוגיות המידע ושירותים נוספים יחוו קריסות, בין אם בענן או בארגון עצמו.
מחשוב הענן והאינטרנט מועדים לחוות קריסות שונות מפני שהם גדולים, מסועפים ומחוברים באינספור חיבורים שונים. הענן הוא עדיין הדרך הכי טובה עבור אגף טכנולוגיות המידע ברוב הארגונים כיום, אבל ישנם סיכונים ששום צוות, לא משנה כמה הוא מקצועי, לא אמור להיתפס עם המכנסיים למטה כשהם מתרחשים.


בהינתן העובדה שהמורכבות והמגוון של התשתית, התוכנה והרשתות שאתם מסתמכים עליהן כשאתם מריצים את העסק שלכם, אתם צריכים שקיפות מתוזמנת בכדי שתוכלו לדעת מה קורה ולהתעדכן כמה שיותר מהר. החדשות הטובות הן שאתם לא צריכים להיות עם תשתית גלובאלית או צוות מהנדסים עצום, בכדי להצליח להתמודד עם הבעיות הצפויות. שיהיה בהצלחה!

מאת: מערכת IsraelClouds

רוצים להתעדכן בתכנים נוספים בנושאי GCP? הירשמו עכשיו לניוזלטר שלנו ותמיד תישארו בעניינים > להרשמה

אין ספק שאחד הדברים שאנשי טכנולוגיות המידע הכי מרוצים ממנו בשנים האחרונות, הוא המעבר של האפליקציות, השירותים והמידע אל הענן, מה שאפשר להם להתרכז בנושאים רבים שאינם בניה ותחזוק התשתית בארגון. אך אליה וקוץ בה, ומחשוב הענן מביא איתו לא מעט אירועים בלתי צפויים שנובעים מהמורכבות של האינטרנט והחיבור לענן. אם כבר הספקתם לשכוח במה מדובר, המציאות מזכירה לנו זאת מדי פעם לפעם, ביחוד כאשר אנו נתקלים בקריסה של שירות אינטרנטי מוביל כלשהו.


ברבע שעה קריטית ב-2.6, חברת Thousandeyes גילתה קריסת רשת ברשת של גוגל שהשפיעה על שירותים שמתבססים על פלטפורמת הענן של גוגל ברחבי ארה"ב. הקריסה נמשכה במשך יותר מארבע שעות, והשפיעה על שירותים שונים כמו יוטיוב,  g suiteומנוע העיבוד של גוגל. כתוצאה מכך, ריכזנו עבורכם את מה שקרה, ומה אתם צריכים לחשוב על יכולת ההתאוששות והשקיפות שכדאי לכם לקחת בחשבון כאשר אתם עוברים אל שירותי הענן.


רמזים מטרימים


חברת TE החלה לראות השפעות הקשורות גם לרמת המשתמש וגם לרמת המאקרו של הרשת כבר בשעה 12 בצהריים, מה שקרה בד בבד עם הודעות ודיווחים על הנושא ברשתות החברתיות השונות. בתרשים 1 ניתן לראות את התפוצה של התקלה דרך 249 נקודות עולמיות של סוכני הענן של TE, הממוקמים ב-170 ערים שהשתמשו בתוכן המאוחסן על אינסטנס של GCE על GCP במזרח ארה"ב, אם כי הם קיבלו שירות דרך רשת קצה של CDN. משתמשים שניסו לגשת לשירותים המתבססים על GCP, כבר החלו להרגיש שמשהו לא עובד כשורה.

תרשים 1


בתרשים 2 ניתן לראות את ההשפעה של איבוד הפקטות – 100%, שהשפיעו בעיקר על משתמשים מרחבי העולם שניסו לגשת לשירותים המאוחסנים על שרתי GCP במערב ארה"ב.

תרשים 2


ברמת המאקרו, גם יכלנו לראות בעיות של אובדן פקטות וחיבורים שהשפיעו על מיקומים של הרשת של גוגל במזרח ארה"ב בערים כמו אשברן, אטלנטה ושיקאגו. לדוגמא, בתרשים 3 ניתן לראות מיפוי טופולוגי של מיקומי הרשת של גוגל. הצבע הכחול הבהיר מצביע על כמות המקורות המשיקים בכל מיקום, אשר ניסו להגיע לשני דומיינים המאוחסנים בגוגל, ונמצאים בצד ימין.


בין שתי נקודות אלו, 15 השקות הנמצאות ברשת של גוגל חוות אובדן פקטות כבד שמונע טראפיק ממקורות משיקים המנסים להגיע לדומיינים של אותם שירותים. הערת צד מעניינת היא שהחלק התחתון של הטופולוגיה בתרשים 3 מראה עדות לכך שישנן בעיות חיבור המשפיעות על הרשת של גוגל בהודו.

תרשים 3


מנקודת מבט של החיבור, תצוגת הדרכים הראתה נפילות בתעבורה בקצה הרשת של גוגל, כפי שניתן לראות בתרשים 4. למעשה, במשך 3.5 שעות מתוך 4+ השעות של הקריסה, ראינו אובדן פקטות מוחלט עבור ניטור גלובאלי של מקומות המנסים להתחבר לשירות שנמצא על GCP במערב אמריקה. אובדן נוסף נראה עבור אתרים המאוחסנים על חלקים מסוימים של GCP במזרח ארה"ב.

תרשים 4


למרות זאת, התקלה לא הייתה מוחלטת בקרב האזורים המושפעים. לדוגמא, בתרשים 5 ניתן לראות שירות אחר שמבוסס על GCP במערב ארה"ב, וניתן היה להשתמש בו באופן מלא במהלך שעות הקריסה.
למעשה, רוב האזורים של GCP לא הושפעו מהקריסה, כולל אזורים בארה"ב, אירופה וכו'. לדוגמא, בתרשים 6 ניתן לראות שרת במערב אירופה הממוקם בהולנד, שנשאר זמין במהלך תקופת הקריסה. הסטטוס הירוק מראה את הסוכנים הגלובאליים המשמשים לניטור שדיווחו על אובדן פקטות אפסי.

תרשים 5


האנליזה של גוגל


גוגל שמה לב לבעיות כבר בשלב מוקדם, והכריזה על הפרעות שעלולות לחול בשירותים המבוססים על שירות הענן שלה, כבר כ-25 דקות לאחר הדיווח הראשוני (כפי שניתן לראות בתרשים 6). ב-12:53 כבר התקבל עדכון על כך שתקלות הרשת קשורות לבעיות רשת נרחבות, וכבר בשעה 13:36 גוגל זיהתה את הבעיה כקשורה לרמות גבוהות של עומס ברשת במזרח ארה"ב, שהתקשרו לאובדן הפקטות המוגבר שהתחלנו לראות כבר לפני ההכרזה (ע"ע תרשים 2).

תרשים 6

תרשים 7


שחזור השירות


בערך בשעה 15:30, כבר התחלנו לראות הקלה בנתוני אובדן הפקטות ושיפור בגישה לשירותי גוגל, כמו שניתן לראות בתרשים 8 שמראה עדכון בסטטוס עבור חיבור לשירות ב-GCP הממוקם במערב ארה"ב. הגישה לשירותים המשיכה להשתפר במהלך השעה שעברה מאז, כפי שניתן לראות בנתונים.

תרשים 8


בסופו של יום, השירות חזר לפעילות מלאה ותקינה סמוך לשעה 16:45, כפי שניתן לראות בתרשים 9.

תרשים 9


בשעה 17:09, גוגל דיווחה שבעיית העומס ברשת נפתרה עבור כל המשתמשים שהושפעו מכך, כמו שניתן לראות בתרשים ב10. בנוסף, הם הבטיחו חקירה מעמיקה בנוגע לנושא.

תרשים 10


מה משתמשי הענן יעשו עכשיו?


אחת מהמסקנות החשובות שכדאי לנו לקחת בנוגע לתקלות בענן היא שחשוב במיוחד לוודא שתשתית הענן שלכם כוללת דרכי פעולה מספקות, בין אם מדובר על התבססות במספר אזורים או אפילו שימוש במספר שירותי ענן, ובכך להגן על התשתית שלכם ממקרים עתידיים כאלו. אחרי הכל, זה רק טבעי להניח שמתישהו יהיו תקלות הקשורות לתשתית טכנולוגיות המידע ושירותים נוספים יחוו קריסות, בין אם בענן או בארגון עצמו.
מחשוב הענן והאינטרנט מועדים לחוות קריסות שונות מפני שהם גדולים, מסועפים ומחוברים באינספור חיבורים שונים. הענן הוא עדיין הדרך הכי טובה עבור אגף טכנולוגיות המידע ברוב הארגונים כיום, אבל ישנם סיכונים ששום צוות, לא משנה כמה הוא מקצועי, לא אמור להיתפס עם המכנסיים למטה כשהם מתרחשים.


בהינתן העובדה שהמורכבות והמגוון של התשתית, התוכנה והרשתות שאתם מסתמכים עליהן כשאתם מריצים את העסק שלכם, אתם צריכים שקיפות מתוזמנת בכדי שתוכלו לדעת מה קורה ולהתעדכן כמה שיותר מהר. החדשות הטובות הן שאתם לא צריכים להיות עם תשתית גלובאלית או צוות מהנדסים עצום, בכדי להצליח להתמודד עם הבעיות הצפויות. שיהיה בהצלחה!

מאת: מערכת IsraelClouds

רוצים להתעדכן בתכנים נוספים בנושאי GCP? הירשמו עכשיו לניוזלטר שלנו ותמיד תישארו בעניינים > להרשמה

Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.
IsraelClouds
IsraelClouds
בואו נעבוד ביחד
צרו קשר