С момента первого света Обсерватория Вера Рубин и предстоящий масштабный проект Legacy Survey of Space and Time (LSST) привлекают внимание астрономов всего мира благодаря своему беспрецедентному потенциалу к изучению ночного неба. LSST призвана открыть множество новых данных, которые станут ключом к ответам на важнейшие вопросы современной астрофизики, в том числе помочь в поиске таинственных первичных черных дыр (ПЧД) — объектов, которые могли сформироваться в первые мгновения после Большого взрыва и до сих пор остаются одним из главных кандидатов на роль темной материи. Однако задача обнаружения ПЧД с помощью LSST связана с серьезными статистическими трудностями, которые необходимо преодолеть ради надежных и однозначных выводов. ПЧД — это гипотетические черные дыры, чье происхождение относится не к коллапсу звезд, а к флуктуациям плотности на ранних этапах развития Вселенной. Если они действительно существуют в значительных количествах, они могли бы объяснить большую часть загадочной темной материи, ответственной за значительную часть массы Вселенной.
Уловить их присутствие — чрезвычайно сложная задача. Одним из самых перспективных методов обнаружения ПЧД является отслеживание эффекта гравитационного микролинзирования. При прохождении ПЧД на фоне удаленной звезды его гравитация фокусирует и усиливает свет звезды, вызывая кратковременное и заметное увеличение яркости. Именно подобные всплески яркости планирует фиксировать LSST. Тем не менее, не все резкие изменения яркости звёзд вызваны микролинзированием.
Вариабельные звезды, инструментальные шумы и другие астрономические явления могут имитировать аналогичные сигналы, создавая множество ложных срабатываний. Пределы эффективности поиска ПЧД во многом зависят от способности аналитических алгоритмов отделять истинные события микролинзирования от помех и ложных всплесков. Высокий уровень ложноположительных результатов (False Positive Rate, FPR) серьезно усложняет анализ и может привести к ошибочным выводам о существовании или отсутствии ПЧД. Команда исследователей из Даремского университета и Университета Нью-Мексико провела тщательное исследование статистических методов обработки данных LSST для минимизации FPR. Одна из главных целей состояла в достижении ложноположительного риска всего в одну на десять миллионов, что учитывая количество звезд и частоту наблюдений LSST, соответствует реально достижимому стандарту надежности.
Для проверки они применили несколько фильтров к смоделированным данным, имитирующим условия, с которыми столкнется LSST в реальной работе. Одним из традиционных методов является использование критерия χ² (хи-квадрат), который сравнивает насколько световые кривые звёзд соответствуют моделям микролинзирования. Однако, учитывая шумы и сложные временные изменения, этот метод оказался наименее эффективным: он чувствителен к случайным колебаниям и не справляется с отделением ложных сигналов. Это подчеркивает ограничения классических статистических подходов в условиях огромных массивов данных, которые генерирует современная астрономия. Более сложные алгоритмы машинного обучения, такие как Бустинг Деревьев Решений (Boosted Decision Trees, BDT), демонстрируют значительно лучшие результаты.
Эти методы способны самостоятельно учиться на огромном объеме данных, распознавая тонкие особенности, отличающие истинные события микролинзирования от других явлений. Такой подход позволяет значительно уменьшить количество ошибочных классификаций. Особую эффективность показал сравнительный анализ на основе критерия Байесовской информации (Bayesian Information Criterion, BIC). В отличие от классического χ², метод BIC включает штраф за излишнюю сложность модели, уменьшая вероятность переобучения на шумных данных. Это способствует более точному выявлению реальных сигналов микролинзирования.
Кроме того, авторы исследования разработали уникальный подход, который фокусируется на оценке экстремальных хвостов распределения выходных данных BDT и BIC. Моделируя эти хвосты собственными статистическими распределениями, ученые смогли дополнительно снизить уровень ложноположительных результатов до контролируемого и приемлемого уровня. Такой инновационный метод значительно расширяет возможности использования LSST для надежного отбора кандидатов в первичные черные дыры. Результаты предполагают, что даже после всего одного года наблюдений LSST сможет значительно сжать возможный диапазон параметров ПЧД или, наоборот, убедительно исключить их как основной компонент темной материи. А окончательные десять лет сбора данных обещают многократное усиление этой способности, позволяя проверить гипотезы о роли первичных черных дыр с беспрецедентной точностью.
Однако ряд вызовов остается нерешенным. Одним из них является уникальный ритм наблюдений LSST — так называемый каденс, который влияет на способ получения и интерпретации световых кривых звезд. В модели, использованной в исследовании, этот каденс оставался упрощённым, и его реальное влияние на эффективность алгоритмов еще предстоит тщательно изучить. Ожидается, что с каждым годом работы LSST и улучшением методов обработки данных статистические фильтры будут адаптироваться и совершенствоваться, повышая шансы на успех. Запуск LSST знаменует собой новую эру в астрономических исследованиях.