Данные стали неотъемлемым ресурсом двадцать первого века, вокруг которого строятся бизнес-стратегии, государственная политика и научные исследования. Однако главная дилемма заключается не в накоплении информации, а в понимании, от чего зависит её настоящая ценность и как она трансформируется в новых условиях цифровой экономики. Исторически стремление собирать данные возникло задолго до изобретения письменности. Уже в глубокой древности первые цивилизации, такие как шумеры около трех тысяч лет назад, фиксировали зерновые запасы и торговые транзакции на глиняных табличках. Это позволило им планировать налогообложение, контролировать ресурсы и регулировать торговлю.
Тем не менее, даже в те времена данные не обладали самостоятельной ценностью — их ценность была обусловлена возможностью использования для принятия решений и управления. Истинная природа данных как ресурса отличается от материальных активов. Данные сами по себе не имеют внутренней ценности, она возникает лишь при их применении. Например, записи о запасах зерна могут использоваться для разных целей — от оценки экономического состояния до прогнозирования будущих кризисов или оптимизации сельскохозяйственного производства. Более того, данные обладают уникальным свойством сетевого эффекта: с увеличением объёма и разнообразия информации их ценность растет экспоненциально, а не линейно.
Современный этап развития технологий ознаменовался переходом от дефицита данных к их изобилию. Сегодня информация генерируется постоянно и практически беспрерывно, зачастую как побочный эффект различных процессов: мобильные устройства фиксируют местоположение пользователя, социальные сети накапливают огромные массивы пользовательских данных, датчики в умных городах собирают сведения об окружающей среде. Этот «цифровой след» или «экзост» информации зачастую недооценивается, но его потенциал огромен. Природа ценности данных в современном мире стала гораздо сложнее из-за специфики их воспроизводства и применения. Данные могут быть многократно использованы без уменьшения их качества, в отличие от физических ресурсов.
Они не истощаются и могут преобразовываться и комбинироваться, создавая принципиально новые возможности и инсайты. Переоценка данных происходит только тогда, когда появляется инициативный предприниматель, способный найти инновационные способы их использования. Например, сервис Netflix не ограничивается применением данных для рекомендаций, но использует их для создания собственного контента. Банковские организации извлекают выгоду из аналитики транзакций для предотвращения мошенничества и выявления рыночных тенденций. Tesla использует данные о поведении автомобилей и водителей для расширения возможностей автономного вождения.
Часто данные, собранные с одной целью, оказываются гораздо более ценными для совершенно иных задач. Еще одной особенностью рынка данных является высокая степень асимметрии стоимости. Одна и та же база данных может иметь кардинально разные оценки в зависимости от того, кто и для каких целей её приобретает. Одним покупателям она может быть нужна для базового анализа, а для других — стать ключевым активом, способным обеспечить конкурентное преимущество. В последнее время популярна метафора «данные — это новая нефть», однако она не совсем отражает реальность.
Нефть ограничена, её использование исключает повторное потребление. Данные не являются исчерпаемым ресурсом и могут быть использованы одновременно многими участниками. К тому же потенциал их применения огромен и комбинируется с другими наборами данных, создавая новые инновационные продукты и услуги. Главные факторы, влияющие на ценность данных, включают сложность их получения и поддержки, длительность и неоднозначность процесса трансформации данных в конкретные результаты и возможности для дальнейшего использования. Появление трансформерных моделей и прогресс в области искусственного интеллекта увеличили горизонты применимости данных, превращая ранее незначительные или «отходные» наборы в ценные активы.
В мировом цифровом пространстве бесценным стало и разнообразие данных — от текстов и аудио до изображений и мультимодальных комбинаций. Однако вместе с ростом возможностей для получения и обработки данных появляется и конкуренция со стороны технологий, способных быстро и дешево создавать синтетические данные или автоматизировать маркировку. Это создает одновременно давление на снижение стоимости традиционных баз данных и открывает новые пути для монетизации и применения информации. Успешность бизнеса и инвестиций в данном секторе во многом зависит от способности создавать и поддерживать защитные барьеры: уникальные источники данных, эксклюзивные партнерства и мощные сетевые эффекты. Компании, которые не успеют адаптироваться, рискуют оказаться в «квадранте незащищенных активов» и потерять значительную часть стоимости своих данных.
Устойчивое конкурентное преимущество получат те, кто сможет создавать так называемые «круговые данные» или «data flywheels», когда сбор, обработка и анализ информации взаимно усиливают друг друга, обеспечивая непрерывное улучшение качества и полезности данных. Именно такие инфраструктуры и сложные цепочки создания ценности делают активы действительно дорогостоящими в эпоху искусственного интеллекта. По сути, данные представляют собой потенциал — они подобны капиталу высшего порядка, который приобретает цену через развитие инфраструктуры и процессов, способных раскрыть его возможности. Лидеры рынка не обязательно обладают крупнейшими массивами данных, но имеют наиболее продуманные механизмы их использования и защиты. Важно понимать, насколько ценность данных устойчиво сохраняется и увеличивается даже при значительном улучшении технологий обработки.