#утренняяреплика в telegram-канале Content Review
Еще несколько назад Big Data называли новым Эльдорадо. Сегодня пришло понимание, что сами по себе данные не стоит ничего. Конечно, в рекламной индустрии, которая и была первой ступенью ракеты Big Data, нашли способ применения персональным данным. Но по большому счету это лишь мизерная часть того, чтобы было обещано евангелистами.
Что делать с собранными массивами данных не знает никто. В библиотеках всегда были старички, которые умели ориентироваться в архивах и каталогах. В Big Data старичков нет, а молодежь зачастую идет тропой Data Scientist не потому, что им интересно ковыряться в залежах сырой информации, а из-за высокой зарплаты.
В мире не так уж много интересных кейсов использования Big Data. И все они реализованы в компаниях, которые изначально даже не думали ни об этом термине, ни о том, что когда-то это станет мейнстримом. Компания Netflix изначально занималась рассылкой DVD по подписке, и лишь потом начала собирать данные о предпочтениях пользователей, чтобы предлагать им каждую неделю именно те фильмы, которые им highly likely понравятся.
Путь от конвертов с DVD до одной из самых продвинутых платформ рекомендаций контента Netflix прошел за какие-то десять лет. Сегодня механизм рекомендаций у этого сервиса настолько сложный, что разобраться в нем труднее, чем в системе «социального кредита» в Китае. Понятно, что в первую очередь система обращает внимание на то, какие фильмы и сериалы отложил в свой список пользователь, какие он начал смотреть и не досмотрел, а какие посмотрел залпом за пару вечеров. Но Netflix пошел дальше.
Не секрет, что сервису обходится дешевле просмотр контента собственного производства, потому и подсовывает он свои оригинальные сериалы и фильмы в первую очередь. С недавних пор Netflix стал не просто показывать карточки с фильмами, но и сопровождать их разными картинками для каждого пользователя. Для мужчин, понятно, акцент делается на женской груди (никакого сексизма), для женщин – на семейных сценах. Для каждого шоу есть несколько разных карточек с индивидуально подобранными промо-кадрами. И тот же Orange is the new black промотируется девушкам фотографией главной героини (смотрите, какая сильная женщина), а мужчинам – фотографией второстепенных, но более веселых персонажей (смотрите, в женской тюрьме весело). Для мужчин фильм ужасов промотируется кадром с кричащим чудовищем (смотрите, страшный фильм), а для женщин – изображением загадочного дома (смотрите, таинственная загадка).
Интерпретация собранных данных – задача нетривиальная, но все становится проще, когда появляется ответ на вопрос «зачем». Правда, как только приходит осознание, что сервисы, которыми мы пользуемся, знают о нас больше, чем кто-либо, происходит обратный эффект: мы начинаем бояться. И если с сервисом подбора фильмов и сериалов на вечер страх нивелируется хорошо подобранным кино, то в социальных сетях и поисковых системах излишне релевантная реклама действительно пугает.
Придется с этим как-то жить.