Русские документы
Ежедневные компьютерные новости RSS rusdoc.ru  Найти :
Новости
Последние поступления
Книжный магазин
  Hardware:
Видеоустройства
Системные платы
Процессоры
Мобильные устройства
Аудиосистема
Охлаждение системы
Накопители информации
КПК и ноутбуки
Телефоны и связь
Периферия
Система
Сети
Разные устройства
 
  Programming:
Web-разработка
Языки программирования
Технологии и теория
Разработка игр
Программная инженерия
 
  Software:
Операционные системы
Windows 7
Базы данных
Обзоры программ
Графика и дизайн
   
  Life:
Компьютерная жизнь
Разные материалы
   
Партнеры
Публикация
Правовая информация
Реклама на сайте
Обратная связь
Экспорт в RSS Экспорт в RSS2.0
    Читать в Яндекс.Ленте



Gmail — что же произошло?

Раздел: Software / Почта @ 02.09.2009 | Ключевые слова: gmail отключение gmail не работает gmail версия для печати

Источник: habrahabr

Вчера веб-интерфейс почтового сервиса Gmail был недоступен по всему миру на протяжении достаточно большого промежутка времени — около 100 минут. Мы знаем, что много людей полагаются на Gmail как на инструмент для личных и корпоративных коммуникаций и относимся к проблемам с сервисом очень серьезно. Поэтому я сразу хотел бы извиниться перед всеми вами — отключение, произошедшее сегодня, было беспрецедентным по своему масштабу, и именно с такой точки зрения мы и будем его рассматривать. Мы уже провели тщательное расследование случившегося, и на базе полученных сведений в настоящее время составляем список того, что мы намерены исправить или улучшить.

Вот что случилось: сегодня утром по тихоокеанскому времени (вчера вечером по МСК) мы отключили несколько серверов Gmail, чтобы провести плановое обновление. Само по себе это не проблема — мы проводим обновления постоянно, в то время как веб-интерфейс Gmail продолжает работать, используя серверы, расположенные в других точках мира.

Однако, как теперь стало ясно, мы слегка недооценили нагрузки, которые были вызваны недавними изменениями (по иронии судьбы, некоторые из них были предназначены для улучшения доступности сервисов) в маршрутизаторах запросов — серверах, которые перенаправляют прямые запросы из Сети на соответствующие серверы Gmail. Примерно в 12:30 по тихоокеанскому времени (23:30 по МСК) несколько маршрутизаторов оказались перегруженными и фактически заявили остальной системе «хватит отправлять нам трафик, мы слишком медленно работаем!». Это привело к тому, что нагрузка перенеслась на оставшиеся маршрутизаторы, из-за чего некоторые из них также не выдержали нагрузки, и через несколько минут почти все маршрутизаторы были перегружены. В результате, пользователи не могли получить доступ к Gmail через веб-интерфейс, поскольку их запросы не могли быть перенаправлены на серверы Gmail. IMAP/POP-доступ по-прежнему работал нормально, поскольку эти запросы обрабатывались незатронутой группой других маршрутизаторов.

Команда инженеров Gmail получила уведомления об отказе маршрутизаторов спустя несколько секунд после возникновения проблемы (мы очень серьезно относимся к мониторингу). Как только стало ясно, что причиной проблемы является недостаток имеющихся мощностей, инженеры незамедлительно начали подключать большое количество маршрутизаторов запросов (гибкая расширяемость является одним из преимуществ архитектуры Google) и направили трафик через них, после чего веб-интерфейс Gmail возобновил свою работу.

Что же дальше: Мы приложим все усилия, чтобы не допустить повторения подобных ситуаций впредь. Некоторые из действий по предотвращению таких инцидентов очевидны и уже предприняты — например, увеличение мощностей маршрутизаторов с целью получить технологический запас. Другие решения не так просты — например, мы пришли к выводу, что маршрутизаторы запросов недостаточно защищены от сбоев (например, если в одном из центров обработки данных возникла проблема, это не должно влиять на серверы другого центра обработки данных) и плохо реагируют на нагрузку (например, если несколько маршрутизаторов запросов перегружены одновременно, они все должны просто работать медленнее вместо того, чтобы отказываться принимать трафик и перенаправлять нагрузку). Мы будем усиленно работать в течение ближайших нескольких недель для принятия этих и других мер по улучшению надежности сервиса. Gmail по-прежнему остается сервисом с уровнем доступности более чем 99,9% для всех пользователей, и мы постараемся в будущем свести количество подобных инцидентов к минимуму.

Ben Treynor, VP Engineering and Site Reliability Czar

Это интересно:








версия для печатиРаспечатать статью


Вернуться в раздел: Software / Почта


Реклама:
Читать наc на:

Add to Google
Читать в Яндекс.Ленте






Rambler's Top100
© Copyright 1998-2012 Александр Томов. All rights reserved.