Bloat в PostgreSQLБазы данных

Программный комитет ещё не принял решения по этому докладу
Андрей Сальников
Data Egret

Пришел в мир баз данных по воле случая, как и многие другие ДБА. За время работы с базами данных успел поработать с ними в телекоме, в банковской сфере, в сфере интернет-рекламы, консультировал проекты, работающие в сфере государственных услуг. На своем пути ДБА много работал с Oracle в прошлом, сейчас в основном работает с PostgreSQL.

Тезисы

Bloat в PostgeSQL с одной стороны упоминается вскользь в каждом втором докладе, связанном с автовакуумом или MVCC-моделью, с другой стороны никогда не раскрывается как отдельная тема. Для разработчика backend на самом деле не сильно интересны DBA-темы про автовакуум и его механизмы, они узкоспециализированные и, в основном, представляют интерес для практикующих DBA.

Цель этого доклада - познакомить разработчиков с проблемой bloat в PostgreSQL, которая действительно важна для понимания и осознания, как сильно она может влиять на конечную производительность приложения. Не сильно углубляясь во внутренности устройства этой БД, я хочу показать, какие проблемы создает код, не учитывающий особенностей модели MVCC и ведущий к bloat таблиц и индексов, как правильно вести работу с базой данных со стороны приложения. Покажу основные ситуации, когда проблема bloat возникает, что было неправильно изначально, и как при небольших трудозатратах ситуацию можно изменить к лучшему. Для администраторов и техподдержки будет интересно узнать, как выявлять bloat в базе данных, какую профилактику проводить, чтобы уменьшить bloat и его воздействие на систему в эксплуатации. Основная цель доклада - сократить количество детских ошибок при разработке кода под базы данных, которые могут помешать в будущем для успешного использования вашего приложения. И сделать это наиболее доступным языком для разработчиков, а не для DBA PostgreSQL, они обычно и так знают, что делать в данном случае.

Бэкенд / другое
,
PostgreSQL

Другие доклады секции Базы данных