Новости криптобиржи Инвестиционная стратегия

Маленькие языковые модели для обнаружения секретов: новые горизонты кибербезопасности

Новости криптобиржи Инвестиционная стратегия
Small language model for secrets detection

Обзор современных подходов к обнаружению секретов в коде с использованием малых языковых моделей. Рассмотрены проблемы традиционных методов, преимущества оптимизированных моделей и перспективы их применения в корпоративной безопасности.

В эпоху цифровой трансформации безопасность информации становится одной из ключевых задач для компаний по всему миру. Одним из самых распространённых и опасных уязвимых мест в инфраструктуре безопасности являются «секреты» — конфиденциальные данные, такие как пароли, токены и ключи доступа, которые могут случайно или намеренно оказаться в исходном коде или настройках систем. Их утечка зачастую ведёт к серьёзным последствиям, включая компрометацию данных, нарушение работы сервисов и финансовые потери. В связи с этим перед специалистами по безопасности стоит задача точного, быстрого и масштабируемого обнаружения таких секретов в самых разных средах. Традиционные методы, основанные на регулярных выражениях, не удовлетворяют этим требованиям из-за ограниченной точности и повышенного количества ложных срабатываний.

В последние годы технологии искусственного интеллекта стали ключевыми инструментами в борьбе с подобными угрозами, особенно в виде машинного обучения и языковых моделей. Однако использование масштабных моделей зачастую связано с высокими вычислительными затратами и вопросами конфиденциальности данных. Решение проблемы нашли в разработке и обучении малых специализированных языковых моделей, адаптированных под конкретные задачи обнаружения секретов, сочетающих эффективность, скорость и безопасность. Секреты в коде представляют собой не только прямые текстовые значения, но и контекстуальные паттерны, скрытые в комментариях, строках или логах. Регулярные выражения, несмотря на простоту и распространённость, не способны эффективно работать с такими тонкими нюансами, что приводит к высокой частоте ложных тревог и пропуска угроз.

В свою очередь крупные языковые модели, хотя и более точны благодаря глубокому пониманию контекста, требуют значительных ресурсов, что затрудняет их внедрение на уровне больших предприятий. Для решения этих задач специалисты компании Wiz разработали подход с использованием небольшой модели LLAMA 3.2 с 1 миллиардами параметров, которая была специально дообучена для задачи обнаружения секретов. Эта модель обеспечивает баланс между производительностью и ресурсными затратами, достигая точности порядка 86% и полноты 82%, превосходя традиционные методы. Создание качественной обучающей выборки потребовало инновационного подхода.

Для разметки данных применялась многоагентная система, где крупные языковые модели выступали помощниками и судьями, автоматически идентифицируя секреты в открытых репозиториях кода, включая скрытые и сложные для обнаружения варианты. Данные тщательно фильтровались с применением алгоритмов кластеризации и проверки качества, что позволило исключить дубли, ложноположительные случаи и недостаточно информативные образцы. Обучение модели базировалось на технологии Low-Rank Adaptation (LoRA), которая стала прорывом в области тонкой настройки. Вместо полного перестроения всех весов сети, LoRA добавляет управляющие матрицы с низким рангом, значительно снижая требования к вычислениям и памяти. Это позволило не только сохранить исходные способности модели, но и эффективно адаптироваться под специфику задачи секретного детектирования.

Кроме того, была применена квантзация, сокращающая размер модели и ускоряющая обработку без значительной потери точности. Экспериментальная эксплуатация показала, что такая модель может работать с приемлемой скоростью на стандартных CPU, что исключает необходимость в дорогой GPU-инфраструктуре. Это фактор особенно важен для обработки миллионов файлов в корпоративных средах, где требования к приватности и стоимости услуг играют ключевую роль. Внедрение этой технологии открывает новые возможности для оперативного мониторинга кода и конфигураций на наличие конфиденциальных данных, значительно снижая риски утечки и упрощая работу команд безопасности. Вместо замены существующих решений новая модель интегрируется в гибридные системы, повышая общую эффективность за счёт уменьшения количества ложных совпадений и расширения охвата обнаруживаемых угроз.

Автоматическая торговля на криптовалютных биржах Покупайте и продавайте криптовалюты по лучшим курсам Privatejetfinder.com (RU)

Далее
History of the browser user-agent string (2010)
Среда, 17 Сентябрь 2025 История user-agent строки браузеров: эволюция и современное состояние в 2010 году

Подробный обзор развития user-agent строки в браузерах от первых браузеров до состояния 2010 года, раскрывающий причины её усложнения, влияние на веб-разработку и необходимость перехода к более современным методам определения возможностей браузера.

Optifye.ai (YC W25) – Founding Back End Engineer
Среда, 17 Сентябрь 2025 Оптифай.ai (YC W25): Революция в мониторинге производительности с помощью искуственного интеллекта и возможности для ведущих инженеров бекэнда

Оптифай. ai – передовая компания в области AI-мониторинга производительности на производственных площадках, подкрепленная поддержкой Y Combinator.

Always use undefined, and never null
Среда, 17 Сентябрь 2025 Почему в JavaScript стоит всегда использовать undefined и никогда не применять null

Разберемся, почему в JavaScript лучше отдавать предпочтение undefined вместо null, как это влияет на качество кода, читабельность и производительность, а также какие проблемы возникают при смешивании этих двух понятий.

SuperClaude
Среда, 17 Сентябрь 2025 SuperClaude: Революция в разработке программного обеспечения с помощью мета-программирования

SuperClaude – это инновационная платформа, которая переводит код Claude в структурированную среду разработки, обеспечивая автоматизацию процессов и умное управление задачами. Погрузитесь в мир современных технологий мета-программирования и узнайте, как SuperClaude меняет подход к созданию и интеграции программного обеспечения.

Handling safety/compliance in edtech apps?
Среда, 17 Сентябрь 2025 Как обеспечить безопасность и соответствие нормативам в edtech приложениях при использовании ИИ

Рассмотрены ключевые аспекты обеспечения безопасности и соблюдения нормативных требований в образовательных технологиях, использующих большие языковые модели и искусственный интеллект. Обсуждаются проблемы соответствия FERPA, COPPA, методы ведения аудита, отслеживания согласий и взаимодействия с образовательными учреждениями и юридическими отделами.

Ethereum Futures Show Heavy Selling Amid Escalating Geopolitical Tension
Среда, 17 Сентябрь 2025 Ethereum под давлением: почему фьючерсы на ETH массово распродаются на фоне геополитической напряжённости

Ethereum сталкивается с существенным снижением на рынке фьючерсов, под влиянием обострения геополитической обстановки между США, Израилем и Ираном. Падение ниже ключевых технических уровней усиливает медвежьи настроения среди инвесторов и трейдеров, создавая предпосылки для дальнейшего падения цены актива.

GNW-News: Bitget geht Partnerschaft mit MotoGP ein - eine rasante Begegnung von Technologie und
Среда, 17 Сентябрь 2025 Bitget и MotoGP: Новая эра скорости и технологий в мире криптовалют и мотоспорта

Bitget заключила стратегическое партнерство с MotoGP, объединяя динамику и высокотехнологичный подход двух миров — криптовалютной торговли и профессиональных мотогонок, что открывает новые возможности для фанатов и трейдеров по всему миру.