Переосмысление искусственного интеллекта с целью улучшения качества жизни людей становится одной из ключевых задач современности. В этом контексте бывший генеральный директор Intel Пат Гелсингер сделал важный шаг, представив новый уникальный AI-бенчмарк под названием Flourishing AI (FAI). Основная цель этого инструмента — оценить, насколько большие языковые модели (LLM) способствуют человеческому благополучию и соответствуют основным жизненным ценностям. В то время, когда многие существующие бенчмарки сосредоточены преимущественно на технических характеристиках и точности работы моделей, FAI предлагает совершенно новый взгляд на оценку, фокусируясь не просто на «безопасности» и «корректности», а на реальном улучшении качества жизни и развития человека во всех областях. В основе проекта FAI лежат данные Глобального исследования процветания (Global Flourishing Study), выполненного при участии ученых из университетов Бэйлора и Гарварда.
Это исследование не ограничивается традиционными измерениями счастья и удовлетворенности жизнью, оно охватывает гораздо более многогранные аспекты, характеризующие человеческое благополучие и развитие. FAI исследует искусственный интеллект по семи основным категориям, отражающим фундаментальные составляющие здоровой и полноценной жизни. Помимо таких привычных направлений, как физическое и ментальное здоровье, финансовая стабильность или социальные отношения, здесь введена и категория «Вера и духовность», что выделяет данный бенчмарк на фоне многих конкурирующих. Пат Гелсингер, оставивший пост руководителя Intel в конце 2024 года, известен не только как талантливый управленец в области высоких технологий, но и как человек с глубокими религиозными убеждениями. Его многолетняя связь с технологической компанией Gloo, которая стремится объединить верующие сообщества посредством современных IT-решений, стала определяющим фактором в создании FAI.
По словам Гелсингера, в эпоху социальных сетей религиозные и духовные сообщества практически не повлияли на развитие технологических платформ, но сейчас, с приходом ИИ, такая возможность появляется вновь. Он подчеркивает необходимость создания стандартов и эталонов для внедрения в AI технологий не просто безопасности, а нравственной и ценностной направленности, способной содействовать нравственному развитию пользователей. Flourishing AI предлагает более 1200 вопросов, направленных на оценку качества и глубины моделей по упомянутым семи направлениям. Вопросы варьируются от объективных, которые имеют «правильный» ответ, до субъективных, требующих экспертной оценки, выполняемой другими продвинутыми AI-моделями, выступающими в роли судей. Примеры таких вопросов включают финансовые рекомендации, аспекты построения здоровых отношений, вопросы счастья и самореализации, а также элементы духовности и веры.
Такой комплексный подход позволяет бенчмарку избегать упрощения и предоставляет всю полноту параметров для комплексной оценки AI. Интересно, что в FAI используется геометрическое среднее для подсчёта итогового балла, а не простое среднее арифметическое. Это значит, что слабые показатели по одному из аспектов человеческого благополучия существенно снижают общую оценку модели. Такой метод гарантирует, что высокий результат не может быть достигнут за счет превосходства в одной или нескольких категориях с одновременной плохой производительностью в других, особенно если речь идет, например, о вере или смысле жизни. На сегодняшний день, по результатам первых тестирований, лучшие модели искусственного интеллекта набирают баллы около 70 из 100, что далеко от желаемого порога в 90 баллов, который является признаком полноценного соответствия человеческим ценностям и задачам процветания.
На вершине рейтинга на данный момент находится модель OpenAI o3, за ней следуют Gemini 2.5 Flash Thinking, Grok 3, а также GPT-4.5 Preview. Все эти модели демонстрируют довольно высокие показатели в сферах здоровья и финансов, что объяснимо, учитывая их ориентацию на уже существующие и популярные технические тесты. В то же время, показатели по духовным аспектам и смысловым категориям остаются существенно ниже, что свидетельствует о необходимости дальнейшей доработки и более глубокого обучения моделей в этих областях.
Бенчмарк FAI обращает внимание на многие ключевые вызовы и трудности в разработке камер социального интеллекта. Проблемы оценки духовности, этического поведения и моральных принципов искусственного интеллекта сложно формализовать и измерить, но именно эти факторы являются фундаментальными при рассмотрении влияния AI на общество в долгосрочной перспективе. Исследователи признают, что текущая версия FAI является лишь отправной точкой и требует дальнейшего развития и углубления. При этом сотрудничество с ведущими академическими и исследовательскими структурами, а также постоянные обсуждения с экспертным сообществом делают этот проект надежным и владным с научной точки зрения. Важно отметить и некоторые ограничения текущей методологии.
Пока что FAI не учитывает культурные различия в восприятии человеческого благополучия, не делает акцент на региональных особенностях и не рассматривает экономические и экологические последствия работы AI-систем. Эти направления остаются за рамками границ бенчмарка, поскольку его задача — именно оценка качеств и ценностей AI, направленных на формирование позитивных жизненных установок и состояний у пользователей. Инициатива Пата Гелсингера демонстрирует важность новых принципов в развитии искусственного интеллекта, при которых технология не просто выполняет технические задачи, но и способна содействовать духовному и нравственному развитию общества. Такие подходы обещают повысить уровень доверия пользователей к AI, сделать взаимодействие с ним более осознанным и конструктивным, а также способствовать решению глобальных социальных вызовов. Будущее искусственного интеллекта, как подчеркивает Гелсингер, зависит от того, насколько эти системы смогут взаимодействовать с человеком на уровне его ценностей и стремлений.
Если все ведущие модели ИИ улучшат свои показатели согласно критериям, заложенным в FAI, то это станет важным шагом для человечества в использовании новых технологий на благо развития и процветания, а не лишь на основе эксплуатационной эффективности и чистой технической мощи. Это момент, когда технологии начинают не просто имитировать человека, а способствуют его становлению как личности. Новый AI-бенчмарк Flourishing AI – значимый шаг в направлении этического и духовно ориентированного развития искусственного интеллекта. Он призывает индустрию задуматься о том, на каких ценностях основаны современные модели и какова их роль в формировании будущего общества. Проект Пата Гелсингера наполнен глубоким смыслом и представляет собой вызов всем исследователям, разработчикам и пользователям систем искусственного интеллекта – сделать технологии более человечными, ответственными и направленными на общее благо.
Таким образом, запуск FAI не просто открывает новый этап в тестировании AI-моделей, но и задает вектор новейшим исследованиям и практикам, где технология становится инструментом поддержки человеческих достижений и принципов, а не только механизмом выполнения вычислительных задач. Интеграция таких идей в индустрию и общественное сознание сулит большую трансформацию, способную изменить не только качество ИИ, но и социальные отношения, экономику и культуру в целом. Это по-настоящему революционный подход к развитию искусственного интеллекта и одной из самых актуальных тем будущего.