Рубрика «replication» - 4

Начинаем использовать Tarantool в Java проекте

2012-10-21 в 20:36, admin, рубрики: java, mysql, nosql, replication, tarantool, метки: java, mysql, nosql, replication, tarantool

В статье ниже я попытаюсь кратко рассказать о том, что такое Tarantool и как начать его использовать в уже существующем проекте если вы программируете на Java. Если же вы программируете на другом языке, то вам могут быть интересны некоторые инструменты доступные в коннекторе, такие как возможность редактирование xlog файлов и создание snap файлов из любых данных.
Читать полностью »

Big Data: Backup делать нельзя работать без него

2012-07-17 в 8:27, admin, рубрики: backup, big data, recovery, replication, Администрирование баз данных, Восстановление данных, метки: backup, big data, recovery, replication

За время работы администратором баз данных я выработал для себя одно правило, которого придерживаются многие DBA. Это «золотое» правило всех администраторов баз данных – не делай ничего серьезного с базой данных, если у тебя нет бэкапа. Если ты собрался серьезно изменить параметры базы данных, провести операции по техническому обслуживанию базы данных и т.п. – то всегда перед этим надо выполнить операцию резервного копирования. Этот принцип достаточно долго работал и оправдывал себя, и даже в нескольких случаях помогал восстановить базу данных на определенный момент времени.

Недавно перед нами была поставлена задача – разработать процедуру резервного копирования хранилища данных размером в 20 Терабайт. Используя наработанные практики резервного копирования, я попытался разработать такую процедуру и уложиться в то же время в рамки RPO (recovery point objective) и RTO (recovery time objective). Обе эти характеристики измеряются во времени и представляют собой следующее: RPO – допустимый объем возможных потерь данных, RTO – допустимое время простоя или за какое время база данных должна восстановиться. Вот тут-то и началось самое интересное – как бы я не прикидывал и не рассчитывал, но разработанная процедура резервного копирования никак не желала укладываться в эти рамки – слишком большой объем данных надо было забэкапить. В самом лучшем случае, с многочисленными оговорками и условиями база данных восстанавливалась за несколько часов, а такого бизнес себе позволить не мог. Хотя, у Сбербанка на этот счет несколько иное мнение и они считают, что клиенты могут и подождать. Но тут был не Сбербанк. В обычной же ситуации, когда на базу данных не налагались серьезные ограничения и условия, восстановление заняло бы несколько дней. Это усугублялось тем, что невозможно «снять» бэкап за приемлемое время – это также занимало несколько дней и создавало большую нагрузку на базу данных. Сразу оговорюсь, что эта база данных не поддерживает инкрементальный бэкап в текущей версии. Возможно, если бы мы могли получить инкрементальность, то игра и стоила бы свеч, и традиционная процедура резервного копирования имела бы право на жизнь в этом случае.

Поняв, что процедура резервного копирования здесь нежизнеспособна, я начал поиск уже существующих решений этой проблемы. Довольно быстро обнаружилось, что такие объемы информации никто не бэкапит «в лоб». Существуют несколько подходов, которые позволяют иметь резервную копию базы данных такого объема, более или менее актуальную во времени.
Читать полностью »

Практическая оптимизация и маштабируемость MySQL InnoDB на больших объёмах данных

2012-06-04 в 3:10, admin, рубрики: highload, innodb, mysql, mysql performance, replication, метки: highload, innodb, mysql, mysql performance, replication

Данный пост не будет рассказывать про индексы, планы запросов, триггеры для построения агрегатов и прочие общие способы оптимизации запросов и структуры БД. Так же не будет рассказывать про оптимальные настройки с префиксом innodb_. Возможно прочитав текст ниже вы лучше поймёте смысл некоторых из них. В данном посте речь пойдёт об InnoDB и его функционирование.

Какие проблемы может помочь решить этот пост?

Что делать если у вас в списке процессов множественные селекты которым казалось бы никто не мешает?
Что делать если всё хорошо настроено, запросы пролетают как ракеты и список процессов постоянно пустой, но на сервере высокий LA и запросы начинают работать немного медленнее, ну например вместо 100мс получается 500мс ?
Как быстро масштабировать систему, когда нет возможности всё переделать?
У вас коммерческий проект в конкурентной среде и проблему надо решать немедленно?
Почему один и тот же запрос работает то быстро то медленно?
Как организовать быстрый кеш и поддерживать его в актуальном состояние?

Читать полностью »

Эволюция архитектуры: от «самописных» сервисов к HandlerSocket

2012-04-12 в 9:16, admin, рубрики: badoo, mysql, replication, баду, Блог компании Badoo, Веб-разработка, высокая производительность, репликация, метки: badoo, mysql, replication, баду, репликация

Сегодня мы расскажем о том, как в Badoo изменился подход к проектированию нагруженных “key-value” сервисов. Вы узнаете, по какой схеме такие сервисы создавались нами несколько лет назад (использование БД в качестве репозиториев и специализированного демона как интерфейса к данным), с какими трудностями мы при этом столкнулись и к какой архитектуре в результате пришли, разрешив появившиеся проблемы.
Читать полностью »

О Чем Стоит Задуматься, Сохраняя Свои Данные в Облаке. Часть 2

2012-04-06 в 6:34, admin, рубрики: backup, cloud storage, clouds, redundanancy, replication, бэкап, восстановление, Восстановление данных, метки: backup, cloud storage, clouds, redundanancy, replication, бэкап, восстановление, восстановление данных

Вкратце, речь идет о том, что, сохраняя данные на нескольких облаках, можно существенно повысить их доступность и сохранность. Под сохранностью имеется ввиду, что данные будут существовать, даже если у одного провайдера (или нескольких) случился серьезная проблема. Подробная мотивация в первой части.

Читать полностью »

О Чем Стоит Задуматься, Сохраняя Свои Данные в Облаке. Часть 1

2012-04-04 в 11:33, admin, рубрики: backup, cloud storage, clouds, redundanancy, replication, бэкап, восстановление, Восстановление данных, метки: backup, cloud storage, clouds, redundanancy, replication, бэкап, восстановление, восстановление данных

В этой статье я собираюсь обсудить доступность данных, сохраненных в облаках. Вторым (и наиболее интересным) пунктом программы выступает приватность и защищенность этих данных.

О Чем Стоит Задуматься, Сохраняя Свои Данные в Облаке. Часть 1

Читать полностью »

PostgreSQL / Отказ мастера в PostgreSQL-кластере: как быть?

2012-02-10 в 0:11, admin, рубрики: failover, postgresql, replication, репликация, метки: failover, postgresql, replication, репликация

Приветствую. Сегодня я хотел бы поговорить о такой неприятной ситуации, как отказ мастера в случае применения нативной репликации в PostgreSQL 9.x. Итак, предположим, что у вас есть кластер из двух и более PostgreSQL-серверов и на мастер внезапно упал метеорит. Логично предположить, что вам придётся сделать мастером одну из реплик. Сделать это можно двумя способами.
1. Применение триггер-файла.

В мануале по настройке репликации сказано, что в recovery.conf помимо прочего можно(и нужно) указать параметр trigger_file. Здесь всё просто — как только вы создадите на реплике файл, указанный в этом параметре, PostgreSQL прервёт процесс восстановления(вЧитать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «replication» - 4

Начинаем использовать Tarantool в Java проекте

Big Data: Backup делать нельзя работать без него

Практическая оптимизация и маштабируемость MySQL InnoDB на больших объёмах данных

Какие проблемы может помочь решить этот пост?

Эволюция архитектуры: от «самописных» сервисов к HandlerSocket

PostgreSQL / Отказ мастера в PostgreSQL-кластере: как быть?