Категории
DeFi Альткойны Анализ крипторынка Биткойн Виртуальная реальность Инвестиционная стратегия Институциональное принятие Интервью с лидерами отрасли Крипто-кошельки Майнинг и стейкинг	Мероприятия Налоги и криптовалюта Новости криптобиржи Продажи токенов ICO Скам и безопасность Стартапы и венчурный капитал Стейблкоины Технология блокчейн Цифровое искусство NFT Юридические новости

Страницы
Главная О нас Условия	Поиск

Подписывайтесь

Категории
DeFi Альткойны Анализ крипторынка Биткойн Виртуальная реальность Инвестиционная стратегия Институциональное принятие Интервью с лидерами отрасли Крипто-кошельки Майнинг и стейкинг	Мероприятия Налоги и криптовалюта Новости криптобиржи Продажи токенов ICO Скам и безопасность Стартапы и венчурный капитал Стейблкоины Технология блокчейн Цифровое искусство NFT Юридические новости

Страницы
Главная О нас Условия	Поиск

Подписывайтесь

Категории
DeFi Альткойны Анализ крипторынка Биткойн Виртуальная реальность Инвестиционная стратегия	Институциональное принятие Интервью с лидерами отрасли Крипто-кошельки Майнинг и стейкинг Мероприятия Налоги и криптовалюта	Новости криптобиржи Продажи токенов ICO Скам и безопасность Стартапы и венчурный капитал Стейблкоины Технология блокчейн	Цифровое искусство NFT Юридические новости

Страницы
Главная О нас Условия	Поиск

Подписывайтесь

Категории
DeFi Альткойны Анализ крипторынка Биткойн Виртуальная реальность Инвестиционная стратегия	Институциональное принятие Интервью с лидерами отрасли Крипто-кошельки Майнинг и стейкинг Мероприятия Налоги и криптовалюта	Новости криптобиржи Продажи токенов ICO Скам и безопасность Стартапы и венчурный капитал Стейблкоины Технология блокчейн	Цифровое искусство NFT Юридические новости

Страницы
Главная О нас Условия	Поиск

Подписывайтесь

Пятница, 12 Сентябрь 2025

Опасности блокировок PostgreSQL: как одна команда ALTER TABLE остановила наш продакшн API и путь к решению

Продажи токенов ICO Интервью с лидерами отрасли

Крипта́ kripta.biz

The PostgreSQL Locking Trap That Killed Our Production API (and How We Fixed It)

Рассказ о том, как неосторожное использование ALTER TABLE в PostgreSQL привело к масштабным сбоям в продакшн API, и методы устранения проблемы с блокировками, советы по оптимизации процессов миграции и организации локов для повышения стабильности и производительности базы данных.

В современном мире технологий редко что-то происходит мгновенно и без последствий, особенно когда речь идет о базах данных и продакшн-системах. Одним из таких примеров стала ситуация с нашей продакшн API, которую неожиданно вывел из строя простой в своей сути запрос к базе данных PostgreSQL — команда ALTER TABLE. История началась с того, что будучи занятым подготовкой презентации, я был вынужден проснуться посреди ночи из-за тревоги в системе мониторинга Google Cloud, сигнализирующей о превышении порога ошибок в базе данных. Первым естественным порывом было найти виновника среди последних изменений в инфраструктуре, и на первый взгляд подозрение упало на недавно развернутые реплики для чтения базы данных. В попытке быстро восстановить работоспособность, репликация была остановлена, а основной экземпляр базы рестартован.

Это временно помогло, однако с ростом нагрузки проблема вернулась. Самое удивительное заключалось в том, что метрики нагрузки на процессор, память и ввод-вывод не показывали аномалий, как и задержка репликации отсутствовала. Внимательное изучение ситуации выявило накопление размера бинарных логов на основном сервере после остановки репликации, что заставило меня вручную удалить репликационные слоты PostgreSQL и даже самих реплик в надежде устранить причину. Тем не менее корень проблемы оказался гораздо глубже и коварней. Постепенно анализ медленных и висящих запросов выявил паттерн — большое количество блокирующих инструкций SELECT FOR UPDATE, множества ALTER TABLE add column, а также вставок с условием ON CONFLICT DO NOTHING, все они пытались получить доступ к одной и той же таблице malware_analyses.

Именно эта таблица, используемая для хранения результатов сканирования OSS пакетов и постоянно обновляемая как фоновыми заданиями, так и API-запросами, стала эпицентром коллизии блокировок. Понимание происходящего требовало углубленного взгляда на архитектуру, в частности тех процессов, которые взаимодействовали с данной таблицей. Можно выделить три ключевых компонента: Submission API, обеспечивающий идемпотентное создание заданий для анализа пакетов; фоновый механизм обработки задач с использованием долгих транзакций и удержанием блокировок на строках; а также встроенный инструмент миграции схемы, который отвечает за применение изменений в структуре таблиц. Submission API выполнял свои операции в транзакциях для сохранения консистентности, включая проверку существования задачи и создание новой с гарантией отсутствия дубликатов за счет уникальных индексов. Фоновые воркеры держали блокировки строк, ожидая завершения длительных внешних вызовов, порой длительностью до нескольких минут.

Однако одновременно с этими процессами была запущена миграция схемы, в ходе которой выполнялась команда ALTER TABLE для добавления двух новых колонок с индексами типа GIN. В PostgreSQL такое изменение требует экслюзивной блокировки AccessExclusiveLock, которая конфликтует со всеми прочими блокировками и не позволяет доступ к таблице до завершения операции. В результате по цепочке блокировок Background Jobs удерживали рядовые замки, что не позволило миграции установить запретительный AccessExclusiveLock. Новые запросы Submission API встали в очередь, ожидая освобождения таблицы, что привело к блокировке всех гошутин из приложений и полной остановке API. Именно это и стало причиной каскадного фиаско в продакшн-системе.

Такая ситуация — яркий пример того, что наличие даже поверхностно незначительных изменений, как ALTER TABLE с добавлением колонки, может вызвать системный коллапс, если не учитывать особенности работы блокировок в СУБД и взаимодействия с длительными транзакциями приложений. Переосмысление проблемы привело к выводу, что решения необходимо искать в изоляции блокировок. Длительные транзакции, особенно те, кто удерживает locks на таблицах с высокой нагрузкой, создают угрозу стабильности. Основная идея решения состояла в отделении механизмов синхронизации и сериализации от самой бизнес-логики, хранящейся в таблицах предметной области. Это было реализовано путем введения отдельной таблицы resource_locks, назначенной исключительно для управления блокировками по ресурсам с использованием строковых ключей.

Фоновые работы и сервисы начали использовать эту специализированную таблицу для получения и удержания блокировок, сводя к минимуму необходимость захватывать блокировки непосредственно на бизнес-таблицах. Такой подход позволил упростить схему миграций, снизив вероятность конфликтов с AccessExclusiveLock и устранив длительные блокировки на таблицах бизнес-логики. Реализованный паттерн позволил выполнять операции с сегрегированными локами, сохраняя при этом целостность данных и последовательность бизнес-процессов. Пользовательский код был пересмотрен таким образом, чтобы держать долгие операции вне транзакций с блокировками на критичных таблицах, а также обеспечить работу с общей таблицей блокировок, которая потенциально меняется чрезвычайно редко. Деплой изменений осложнялся необходимостью временной приостановки фоновых заданий с последующим ожиданием окончания активных транзакций, что позволило применить миграцию безопасно и без риска подвесить систему.

Эта история подчеркивает фундаментальный вызов работы с распределёнными системами и особенно с базами данных, вытекающий из теоремы CAP, когда попытка одновременно гарантировать согласованность и доступность приводит в сложных сценариях к неожиданным сбоям на продакшнах. Полученный опыт учит не только правильному планированию и исполнению миграций, но и проактивному подходу к архитектуре локов и транзакций, их изоляции для облегчения обслуживания и масштабирования систем. Кроме того, данный кейс демонстрирует, что системные инструменты вроде Google Cloud мониторинга и анализа запросов PostgreSQL являются незаменимыми при расследовании и поиске корня проблем. В конечном итоге, развёрнутое решение с выделенной таблицей resource_locks снизило риск блокировок и позволило команде продолжать развитие без опасений внезапных остановок продакшн API. Методы, основанные на изоляции синхронизации от бизнес-логики, могут служить ориентиром для разработчиков и инженеров по надежности, стремящихся минимизировать простои и повысить устойчивость приложений на PostgreSQL.

Этот опыт полезен для всех, кто работает с базами данных на высоконагруженных продуктах и желает понять тонкости внутренних блокировок и возможных ловушек, способных остановить работу целых сервисов. На пути к безопасной и эффективной работе с миграциями стоит учитывать все причины, включая длительные операции, уникальные индексы, и распределённые процессы, и применять проверенные практики, чтобы минимизировать влияние изменений на пользователей и бизнес.

Telegram's Durov wills his $14B estate to his 100 children

Пятница, 12 Сентябрь 2025 Наследие Павла Дурова: Миллиардер завещал своё состояние своим 100 детям

История о том, как Павел Дуров, основатель Telegram, решил разделить своё состояние в 14 миллиардов долларов между своими 100 детьми, привлекает внимание общественности. Разбор значения такого шага и его возможные последствия для наследия и бизнеса.

Tech's Turn to Trump Was a Labor Story, and the Response Should Be Too

Пятница, 12 Сентябрь 2025 Как Технологический Сектор Перешел на Сторону Трампа: История Труда и Необходимость Ответа

Исследование причин правого поворота в технологической индустрии через призму трудовой борьбы, влияние на работников и пути создания более справедливой и коллективной технологической среды.

Show HN: A Lisp like dictionary validator in Python

Пятница, 12 Сентябрь 2025 Уникальная проверка словарей в Python с помощью biggusdictus: Lisp-подобный валидатор для вашего кода

Подробный обзор библиотеки biggusdictus — инновационного инструмента для валидации словарей в Python, вдохновлённого языком программирования Lisp. Рассмотрены возможности, применение и преимущества использования такого подхода в реальных проектах.

Ethereum bulls must break $2.8K: What will trigger a 'violent move'?

Пятница, 12 Сентябрь 2025 Ethereum и битва за уровень 2800$: что станет катализатором сильного роста?

Ethereum приближается к ключевой отметке в 2800 долларов, преодоление которой может запустить мощный рост цены. Рассматриваются факторы, влияющие на динамику ETH, включая институциональный спрос, технические индикаторы и ограничение ликвидного предложения.

GENIUS Act & Stablecoins: A turning point for crypto? | Cryptocurrency | US market | US Dollar

Пятница, 12 Сентябрь 2025 Закон GENIUS и стабильные монеты: новый виток развития криптовалютного рынка США

Обзор принятия закона GENIUS в США и его влияния на рынок стабильных монет, а также анализ значимости этого события для мировой криптоиндустрии и экономики, привязанной к доллару.

Пятница, 12 Сентябрь 2025 Texas Instruments вкладывает 60 миллиардов долларов в развитие полупроводниковой промышленности в США

Texas Instruments объявила о масштабных инвестициях в размере 60 миллиардов долларов для расширения производства полупроводниковых чипов на территории США, что укрепляет позиции американской технологической индустрии и способствует развитию инновационных технологий.

Is Molina Healthcare Stock Underperforming the S&P 500?

Пятница, 12 Сентябрь 2025 Анализ акций Molina Healthcare: уступает ли она индексу S&P 500?

Глубокий разбор текущего положения акций Molina Healthcare на фондовом рынке, сравнительный анализ с динамикой индекса S&P 500 и факторы, влияющие на производительность компании в 2025 году.