Первая молодость Big Data

PC Week/RE №6 (905) 5 апреля 2016, Автор: Николай Носов

 

В последнее время немного снизился шум, связанный с технологиями Big Data. Нет, проблема никуда не исчезла, мир по-прежнему производит огромные и непрерывно увеличивающиеся объемы информации, но сами эти слова стали упоминаться реже. Дело дошло до того, что понятие Big Data исчезло из последнего исследования Gartner «Hype Cycle for Emerging Technologies 2015», породив волну комментариев о неактуальности этой темы. На самом деле Big Data всегда было термином зонтичным, объединяющим разные целевые задачи и методы их решения. Термин этот подчеркивал переход количества в качество, когда размер данных становится самостоятельной проблемой. И его отсутствие в исследовании Gartner говорит только о том, что одни направления, такие как Machine Learning и Data Science, вышли из тени «зонтика» Big Data и привлекли особое внимание, другие — вошли в повседневность и перестали быть развивающимися.

………..

Большие данные и банки

Банки используют технологии анализа больших данных при обеспечении информационной безопасности (недопущение проведения сомнительных операций и мошенничества), в работе с персоналом, для маркетинга — персонализации предлагаемых клиентам банковских продуктов. И, конечно, скоринга.

Скоринг — оценка кредитных рисков физического или юридического лица, основанная на статистических методах, ‒ одна из важнейших банковских систем. Кому можно дать кредит, а кому нельзя? Как оценить риски и какой заложить процент? Эти вопросы очень интересуют банкиров.

Помочь могут операторы телекома. Например, крупнейший китайский оператор China Telecom анализирует своих клиентов, классифицирует их по степени надежности и эту информацию продает банкам. По такому пути могут пойти и наши операторы. Но пока банки проводят анализ сами.

Большими данными уже занимается Сбербанк. Наша крупнейшая ИТ-компания с банковской лицензией имеет огромную клиентскую базу и огромные объемы информации о своих клиентах, так что вполне логично, что Сбербанк создал лабораторию Big Data и использует полученные ею результаты в своей работе. В том числе в кредитном скоринге, в борьбе с мошенничеством, в управлении персоналом.

Например, Сбербанк отслеживает клиентские потоки, анализирует их средствами Big Data, что позволяет прогнозировать пиковые дни, когда нужно добавить или убавить людей в отделениях, обслуживающих клиентов. Для HR-департамента интересен проект по оценке вероятности ухода вновь нанятого сотрудника.

Подтягиваются и другие российские банки: анализом Big Data занимаются «Тинькофф», «Альфа-банк», «Открытие». «Big Data — это прежде всего внешние данные», — считает руководитель управления хранилищами данных и отчетностью банка «Тинькофф» Сергей Сотниченко. И на рынке есть компании, которые могут поделиться не только обобщенными аналитическими данными, но и первичными. Например, Data-Centric Alliance.

При этом компания не торгует персональными данными, она просто дает банку информацию о том, какие сайты посещал пользователь с определёнными cookies и рекламными идентификаторами (advertising ID) и какие он делал поисковые запросы. Ведь пользователь, заходя на страничку интересующего его сайта в Интернете, многим оставляет информацию об этом. Не только владельцу сайта и браузеру, но и владельцам установленных на страничке счетчиков и рекламных блоков.

Сама идентификация пользователя происходит на стороне банка. У банка есть сайт, личные кабинеты пользователей, системы интернет-банкинга, то есть он обладает достаточной информацией, чтобы идентифицировать клиента. Причем как текущего, так и работавшего с данным банком прежде.

Клиенты периодически чистят свои cookies, сбрасывают рекламные идентификаторы, заходят на сайты банка с разных браузеров и устройств, так что в профиле клиента будет несколько cookies. По ним внешняя компания определяет, что делал клиент в сети, и передает банку информацию. Банк оценивает психотип клиента, что очень важно в маркетинге для создания индивидуального предложения, определяет его надежность клиента и привлекательность для себя. Например, если клиент делал поисковые запросы типа «как обмануть банк и не отдать кредит», «как сделать фальшивый паспорт», то стоит задуматься, имеет ли смысл давать ему деньги.

Другой возможный путь использования такой информации — оценка проводимых банком рекламных кампаний, работы его отделений, проблем, с которыми сталкиваются конкретные клиенты. При этом использование лингвистических технологий дает возможность проанализировать даже эмоциональную окраску информации, получаемой по обратной связи, и оценить степень удовлетворения клиентов новыми или уже используемыми услугами.

Вся статья

Leave a Reply