Мы в Backblaze предлагаем нашим клиентам неограниченное хранилище всего за $5 в месяц, поэтому нам пришлось выяснить, как хранить сотни петабайт клиентских данных надёжным масштабируемым образом, при этом сохраняя цены низкими. Посмотрев на несколько коммерческих решений с неоправданно высокими ценами, мы решили строить наши собственные нестандартные контейнеры хранилища Backblaze (Backblaze Storage Pods): 67-терабайтные 4U-серверы за $7867.
В этом постинге мы расскажем, как создать такой контейнер хранилища, и будем рады, если вы используете подобный дизайн сами. Мы надеемся, что от совместного использования этой идеи выиграют все: как вы, так и мы, поскольку вы можете усовершенствовать этот дизайн и прислать нам улучшения. Эволюция и снижение затрат являются критичными для продолжения успеха Backblaze.
Вот видео, показывающее 3-мерную модель контейнера хранилища Backblaze. Продолжайте читать, чтобы узнать о всех деталях дизайна.
Здесь можно загрузить полную 3-мерную модель контейнера хранилища Backblaze в формате EASM.
Backblaze нужно большое, надёжное, дешевое хранилище
Сказать, что Backblaze нуждается в большом хранилище, — ничего не сказать. Мы предоставляем услуги бэкапа, так что наш дэйтацентр содержит полную копию всех данных наших клиентов, плюс несколько версий изменяющихся файлов. Грубо говоря, каждый раз, когда один из наших клиентов покупает жесткий диск, Backblaze нужен ещё 1 жесткий диск. Уже давно мы перестали измерять хранилища в наших дэйтацентрах в гигабайтах или терабайтах и начали мерить в петабайтах.
Чтобы получить представление, как это выглядит, вот на фото я устанавливаю новые контейнеры в нашем дэйтацентре. Я работаю со стойкой, содержащей небольшой «штабель» из 6 контейнеров, содержащих в сумме почти полпетабайта данных.
Чтобы предлагать наши услуги по разумной цене, нам нужно доступное по цене хранилище многопетабайтного масштаба.
Никто не продаёт дешёвые хранилища, поэтому мы спроектировали их сами
Прежде чем мы поняли, что нам придётся решать эту проблему с хранилищем самостоятельно, мы рассматривали Amazon S3, серверы Dell и Sun, файлеры NetApp, EMC SAN и т. д. По мере изучения этих традиционных «готовых решений», у нас пропадали все иллюзии о стоимости. Когда вы отбрасываете маркетинговые термины и красивые логотипы с любых решений по хранению данных, как ни крути, данные оказываются на обычном жестком диске. Но когда мы сравнивали цены различных коробочных решений, стоимость была в 10 и более раз выше «сырой» стоимости жестких дисков. Вот диаграмма, сравнивающая стоимость 1 петабайта от различных вендоров:
Оценив затраты, мы решили создавать наши собственные контейнеры хранения Backblaze. У нас были 2 основные цели: сохранять затраты на низком уровне, используя накопители потребительского уровня и легкодоступные массовые комплектующие, и использовать электроэнергию и место в дэйтацентре настолько эффективно, насколько возможно, используя «зелёные» комплектующие и «втискивая» большое хранилище в небольшой корпус.
Результат — это стоечный сервер высотой 4U на Linux, содержащий 67 терабайт, себестоимостью $ 7867, львиная доля которых уходит на покупку самих жестких дисков. Это составляет всего ~0.3 цента за гигабайт в месяц на протяжении 3 лет. Даже включая дополнительные издержки, такие как электричество, трафик, аренду места и зарплату IT-администраторов, Backblaze тратит 1/10 от цены в сравнении с использованием Amazon S3, серверов Dell, файлеров NetApp или EMC SAN.
Из чего состоит контейнер хранения Backblaze
Контейнер хранения Backblaze является самодостаточным узлом, который делает хранилище доступным онлайн. Он представляет собой сделанный по спецзаказу металлический корпус с широко доступными бюджетными комплектующими внутри. Конкретнее, 1 контейнер включает 1 системную плату Intel c вставленными в нее 4-мя платами SATA. 9 SATA-кабелей отходят от плат к 9 панелям умножителей портов (port multiplier backplanes), в каждую из которых непосредственно вставлено 5 жестких дисков (всего 45 жестких дисков).
Выше вы видите развернутую диаграмму, а подробный список комплектующих вы можете увидеть в Приложении A. 2 главнейших фактора, которые необходимо упомянуть: стоимость жестких дисков является львиной долей стоимости всего контейнера, а остальная часть системы полностью построена на широко доступных бюджетных комплектующих.