Рубрика «Администрирование баз данных» - 2

Как устроено индексирование баз данных

2023-03-22 в 13:00, admin, рубрики: B-дерево, bitmap-индексирование, gist, ruvds_перевод, Администрирование баз данных, Алгоритмы, базы данных, Блог компании RUVDS.com, индексирование, полнотекстовый индекс, Программирование, хэш-индекс

Индексирование баз данных — это техника, повышающая скорость и эффективность запросов к базе данных. Она создаёт отдельную структуру данных, сопоставляющую значения в одном или нескольких столбцах таблицы с соответствующими местоположениями на физическом накопителе, что позволяет базе данных быстро находить строки по конкретному запросу без необходимости сканирования всей таблицы. Применяются разные типы индексов, однако они занимают пространство и должны обновляться при изменении данных. Важно тщательно продумывать стратегию индексирования базы данных и регулярно её оптимизировать.
Читать полностью »

6 книг по MySQL для старта работы и погружения в технологию

2023-03-01 в 12:14, admin, рубрики: mysql, Администрирование баз данных, базы данных, Блог компании Selectel, подборка книг, Профессиональная литература, СУБД

MySQL — реляционная СУБД, использующая декларативный язык программирования SQL. Она предлагает все необходимые возможности для создания баз данных и написания серверных приложений.

В нашей подборке — 6 книг по MySQL, которые будут полезны как на старте, так и для развития навыков. Рекомендуйте свои книги в комментариях!
Читать полностью »

Сможет ли Event Sourcing перерасти базы данных?

2023-02-27 в 13:00, admin, рубрики: crud, event sourcing, ruvds_перевод, Администрирование баз данных, архитектурные шаблоны, базы данных, Блог компании RUVDS.com, хранение данных, хранилища данных

Event sourcing — не новый термин. Если вы работаете с технологиями, то должны были с ним сталкиваться. Это мощный инструмент, используемый многими крупными организациями в качестве архитектуры баз данных. Он имеет возможность масштабирования и отвечает потребностям современной отрасли обработки данных.

В этой статье мы глубже рассмотрим ES и расскажем о причинах его популярности. Также мы поразмыслим над популярным вопросом: перерастёт ли event sourcing базы данных?
Читать полностью »

8 книг по PostgreSQL: от баз данных с «нуля» для самоучек до руководства про БД в облаках

2023-02-07 в 14:35, admin, рубрики: DBaaS, postgresql, sql, Администрирование баз данных, базы данных, Блог компании Selectel, облако, Профессиональная литература

В целом, эта объектно-реляционная СУБД в дополнительном представлении не нуждается. Разработанная более 20 лет назад, она предназначена для создания и поддержки баз данных серверных приложений, в том числе ресурсоемких аналитических БД. Одна из особенностей PostgreSQL — открытый исходный код. Мы любим ее за развитое комьюнити и возможность развернуть «постгрю» самостоятельно и бесплатно.

Подготовили подборку полезных книг для тех, кто только начал или собирается работать с PostgreSQL. В нее вошли актуальные руководства на русском и английском языках. Если знаете еще одну-две отличных книги, смело рекомендуйте в комментариях.
Читать полностью »

Генерация конвейеров обработки данных в Dataflow

2022-12-23 в 13:00, admin, рубрики: big data, dataflow, netflix, pyspark, R, ruvds_перевод, scala, Администрирование баз данных, Блог компании RUVDS.com, конвейеры данных, пайплайны, рабочие потоки

Эта статья посвящена всем практикующим специалистам по данным, заинтересованным в освоении запуска, стандартизации и автоматизации пакетных конвейеров данных в Netflix.

О Dataflow мы писали в статье под названием Data pipeline asset management with Dataflow. Та статья представляла подробное знакомство с одним из наиболее технических аспектов Dataflow, но сам этот инструмент толком не описывала. На сей раз мы оправдаем заявленное вступление, после чего сосредоточимся на одной из основных возможностей Dataflow — образцах рабочих потоков. Для начала же мы коротко разберём Dataflow в общем.Читать полностью »

Оптимизация поиска по большому полю

2022-12-21 в 7:01, admin, рубрики: Microsoft SQL Server, MS Sql Server, search, sha256, sql, tsql, Администрирование баз данных, Блог компании «Лаборатория Касперского», Программирование

Вновь привет, уважаемые читатели ! Работая с одной из систем хранения метаданных о файлах в «Лаборатории Касперского» вспомнил, что давно хотел написать об оптимизации поиска по большому полю в базах данных. О чем далее и расскажу более подробно.

В данной публикации будет рассмотрена оптимизация поиска по полю бинарного массива и, в частности, по равномерно распределенным данным, а также сравнение между собой выявленных способов.

Оптимизация поиска по большому полю - 1

Итак, представьте: у вас есть таблица в базе данных MS SQL, в которой десятки миллиардов строк данных. И в эту таблицу вставляются и удаляются суммарно десятки и сотни тысяч строк в секунду. Назовем эту таблицу dbo.metadata.

Замечание. Для проведенного анализа ниже была создана новая база данных TEST, в которой были созданы две таблицы dbo.metadata и dbo.sha256_checksum (о второй таблице будет написано ниже) и сгенерированы синтетические данные на 1+ млрд строк в каждую. После каждого вызова запроса проводился полный сброс кэша планов для базы данных TEST (DBCC FREEPROCCACHE), чтобы план для запроса каждый раз строился заново, а не брался уже готовый.

Таблица dbo.metadata упрощенно выглядит так:

Определение таблицы dbo.metadata
Определение таблицы dbo.metadata
Читать полностью »

Как избежать распространенных ошибок при работе с СУБД

2022-11-25 в 11:04, admin, рубрики: sql, Администрирование баз данных, архитектура, базы данных, Блог компании Selectel, СУБД

В этом материале мы поговорим о практиках и ошибках при работе с разными СУБД, а также поделимся чек-листом от менеджера PaaS-продуктов Selectel Андрея Андронова.

Мы начнем с планов на проект и серверных комплектующих, пройдем через правила проектирования баз данных и доберемся до уровня доступности.
Читать полностью »

Наша новая удачная попытка бесшовной замены Redis на KeyDB

2022-11-25 в 6:20, admin, рубрики: devops, KeyDB, kubernetes, redis, Администрирование баз данных, Блог компании Флант

Мы уже как-то рассказывали о базе данных KeyDB — форке Redis, разработка которого началась в 2019 году. Проект распространяется под свободной лицензией BSD, и у него уже почти 6k звезд на GitHub. Авторы в свое время столкнулись с проблемами производительности оригинала и пошли хардкорным путём: взяли всё в свои руки и привнесли много нового как в части многопоточности, так и в других областях.

В статье делимся еще одним положительным опытом замены Redis на KeyDB.

Читать полностью »

Топ полезных SQL-запросов для PostgreSQL

2022-10-30 в 15:08, admin, рубрики: administration, database development, database optimization, postgresql, sql, sql tips and tricks, Администрирование баз данных, базы данных

Статей о работе с PostgreSQL и её преимуществах достаточно много, но не всегда из них понятно, как следить за состоянием базы и метриками, влияющими на её оптимальную работу. В статье подробно рассмотрим SQL-запросы, которые помогут вам отслеживать эти показатели и просто могут быть полезны как пользователю.

Топ полезных SQL-запросов для PostgreSQL - 1

Зачем следить за состоянием PostgreSQL?

Читать полностью »

Обзор операторов PostgreSQL для Kubernetes. Часть 3: CloudNativePG

2022-09-09 в 6:05, admin, рубрики: CloudNativePG, devops, kubernetes, kubernetes operator, postgresql, Администрирование баз данных, Блог компании Флант, Флант

Статья продолжает наш обзорный цикл о PostgreSQL-операторах для Kubernetes. В первой части мы рассматривали операторы Stolon, Crunchy Data и Zalando. Во второй — KubeDB и StackGres, а также объединили все пять операторов в сравнительную таблицу. В этот раз разбираем решение CloudNativePG, его возможности и особенности, а заодно актуализируем таблицу.

Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «Администрирование баз данных» - 2

Как устроено индексирование баз данных

6 книг по MySQL для старта работы и погружения в технологию

Сможет ли Event Sourcing перерасти базы данных?

8 книг по PostgreSQL: от баз данных с «нуля» для самоучек до руководства про БД в облаках

Генерация конвейеров обработки данных в Dataflow

Оптимизация поиска по большому полю

Как избежать распространенных ошибок при работе с СУБД

Наша новая удачная попытка бесшовной замены Redis на KeyDB

Топ полезных SQL-запросов для PostgreSQL

Зачем следить за состоянием PostgreSQL?

Обзор операторов PostgreSQL для Kubernetes. Часть 3: CloudNativePG

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «Администрирование баз данных» - 2

Зачем следить за состоянием PostgreSQL?

Новости

Актуальные темы

Архив