В последние годы технологии искусственного интеллекта стремительно развиваются, открывая новые горизонты для автоматизации и повышения эффективности в самых разных областях. Особое внимание привлекают подходы к обработке естественного языка, а именно системы Retrieval Augmented Generation (RAG), которые становятся ключевыми решениями для точного поиска и генерации ответов на сложные вопросы. Компания webAI завоевала лидерство в этой сфере, представив свою инновационную технологию Knowledge Graph RAG, которая продемонстрировала выдающуюся точность более 94% на одном из самых строгих отраслевых бенчмарков — RobustQA. Этот результат существенно превосходит существующие аналоги и открывает новые возможности в сфере работы с корпоративной документацией и технической информацией. RobustQA давно используется профессиональным сообществом исследователей искусственного интеллекта в качестве стандарта оценки эффективности систем по возврату и обработке релевантной информации.
Тестовые данные включают короткие естественно-языковые документы, на базе которых системы должны извлекать точные и полные ответы. Традиционные RAG системы часто используют метод разбиения текстов на крайне мелкие фрагменты по 100 токенов, что приводит к потере целостности контекста и снижению точности конечных результатов. В отличие от этих подходов, решение webAI работает с целыми документами, сохраняя внутреннюю семантическую связь, благодаря чему достигается более высокий уровень понимания и точности. Техническая инновация webAI заключается в отказе от традиционного «чанкинга» — искусственного дробления текста, что не только снижает объём необходимых вычислительных ресурсов и требования к хранению, но и значительно повышает качество поиска. При этом система ищет ответ в пределах пяти полноценных, цельных документов, что позволяет избежать искажений смысла и потери важной информации, неизбежных при работе с мелко сегментированными блоками.
Такой подход подтверждается результатами комплексного тестирования, продемонстрировавшими стабильность и масштабируемость технологии при различных условиях и типах документов. Одной из ключевых особенностей Knowledge Graph RAG от webAI является возможность обработки не только текстовой, но и мультимодальной информации. В реальных корпоративных условиях документы часто содержат графики, таблицы, диаграммы и прочие визуальные элементы, взаимодействие с которыми традиционные RAG системы не способны реализовать на должном уровне. В отличие от подобных решений, webAI интегрирует мультиформатные данные в единый граф знаний, что обеспечивает глубокое понимание и точный анализ сложных документов, характерных для авиационной, медицинской, производственной и юридической сфер. Практическая значимость такой технологии трудно переоценить.
Авиационные инженеры, например, при обслуживании высокотехнологичных самолётов сталкиваются с огромными массивами технических руководств, требующих предельно точного соблюдения процедур и рекомендаций. Ошибки или задержки в поиске информации могут повлечь за собой высокие финансовые потери и угрозы безопасности. Благодаря высокой точности и целостности ответов от Knowledge Graph RAG специалисты получают чёткие и полные инструкции без риска утраты контекста, что существенно повышает эффективность и безопасность их работы. Подобные преимущества успешно находят применение и в здравоохранении, где обработка комплексных протоколов лечения и медицинской документации требует неукоснительного соблюдения всех нюансов. В производстве же система помогает оптимизировать процессы контроля качества, обеспечивая быстрый доступ к нормативной и технической документации с минимальными рисками ошибок.
Команда webAI предпринимает систематические усилия по дальнейшему подтверждению и расширению достижений на RobustQA. В планах — проведение дополнительных тестирований с использованием отраслевых наборов данных и сценариев целевого применения, а также организация публичных демонстраций в реальных условиях. Ожидается, что эти испытания продемонстрируют ещё более явные преимущества мультиформатного Knowledge Graph RAG перед традиционными текстовыми системами. Несмотря на общую востребованность стандартного бенчмарка RobustQA, он отражает только часть потенциала webAI — поскольку оценивает исключительно работу с текстовыми фрагментами. В реальных задачах важна именно комплексная работа с мультимодальными данными, и именно здесь технология webAI достигает своего максимума, обеспечивая уникальный уровень понимания и точности.
Особое внимание уделяется и удобству внедрения и эксплуатации. Для оптимальной работы Knowledge Graph RAG требует значительных аппаратных ресурсов — рекомендовано не менее 128 Гб оперативной памяти с предпочтением к 256 Гб унифицированной памяти. Это обусловлено необходимостью обработки больших объёмов информации и сложных графовых структур знаний без потери производительности. Тем не менее для менее ресурсоёмких сценариев доступны режимы с компромиссным уровнем точности, позволяющие адаптировать технологию под различные корпоративные требования и бюджеты. В ближайших планах webAI — проведение вебинаров и презентаций, посвящённых практическому применению Knowledge Graph RAG в различных индустриальных сферах.
Эти мероприятия позволят компаниям познакомиться с технологией изнутри, увидеть живые демонстрации и узнать о сравнении webAI с другими современными AI-платформами, включая ChatGPT и Claude. Уже сейчас результаты тестов на технической документации F-18 демонстрируют впечатляющее преимущество — 95% против 80% точности у конкурентов, что подтверждает жизнеспособность и эффективность нового подхода. Компания активно делится своими методологическими наработками и визуальными материалами, которые иллюстрируют технические детали процесса обработки, сравнения с традиционными методами, а также архитектуру и принципы работы своей платформы. Такая прозрачность способствует укреплению доверия и интереса со стороны профессионального сообщества и клиентов. Таким образом, webAI с технологией Knowledge Graph RAG выводит индустрию искусственного интеллекта на качественно новый уровень, создавая основу для дальнейших инноваций в области интеллектуального поиска и анализа сложной документации.