Что дает очистка данных

Игорь Артамонов
artamonov.ru

Расскажу немного о том зачем нужна очистка данных и CDI. Сейчас не буду углубляться в CDI, MDM, это потом, и будем считать что данные должны быть чистые, это вполне логично. Вопрос в другом, вот почистили мы наши клиентские базы, положили в некую CDI систему, а на что можно рассчитывать дальше? Т.е. как мы сможем их использовать, помимо того что теперь мы знаем что у нас не мусор в базе/CRM? Какие преимущества мы получим от очистки данных?

Ну, во-первых, благодаря стандартизации упрощается работа всех связанных систем, грязные данные тянули за собой слишком много костылей во внешних системах, что лишь увеличивало степень неопределенности. А вот после очистки данных уже можно найти тысячи положительных эффектов, все зависит от конкретной ситуации. От снижение количества искажений при анализе клиентской базы, до возможности проведения таких BI операций, о которых до этого и речи быть не могло за отсутствием нужных данных. В конце концов мы будем точно знать кто наши клиенты, а не предполагать основываясь на куче неверных данных.

Основные блоки данных

Приведу список основных элементов данных и то что можно получить на из основе.

Адрес

  1. Дает возможность сделать географическую привязку клиента, для:
    1. Анализ эффективности деятельности филиалов, проанализировав объемы клиентов в различных зонах.
    2. Анализ действия рекламной компании, сравнивая области с различным уровнем объема уличной рекламы по разным частям города.
    3. Сегментация уровня дохода/социального положения клиентов по стоимости жилья. Как минимум можно составить характеристики по районам города, а по хорошему еще составить отдельный список элитного жилья, и наоборот.
    4. Обнаружение аномалий в распределении. К примеру повышенный объем страховок в одном из регионов относительно других регионов, при прочих равных факторах, возможно говорит о наличии неучтенного повышенного риска для жителей данной области (т.е. жители чего то опасаются, лучше узнать чего именно, пока не поздно).
    5. Определить где можно открыть новый филиал/банкомат/магазин и пр.
  2. Обнаружение связей:
    1. соседи и друзья
    2. семья
    3. коллеги, при анализе рабочего адреса
  3. Дополнение недостающей информации (например индекс,который, как известно, никто не заполняет правильно), что может устранять неоднозначности адреса, ускорять доставку корреспонденции и пр.
  4. Удаление из базы мусорных записей.

Имя

  1. Определение пола. Нужно для:
    1. Формировании исходящей корреспонденции. Может и мелочь, но меня лично раздражает эта запись в поздравительных письмах типа «уважаемый(ая)». Ты или определись с моим полом или не делай вид что письмо совсем уж персональное.
    2. Сегментация по полу при исследованиях
  2. Уточнение семейных связей (используя совместно со значениями адреса и возраста)

Телефон

  1. Дополнение недостающей информации (код города из адреса или наоборот)
  2. Обнаружение связей (по домашнему и рабочему телефонам)
  3. Определение сферы деятельности по рабочему телефону (используя справочники организаций)

Прочие поля

Название компании в которой работает клиент дает установить связи, определить уровни доверия, платежеспособности, доходов и пр. и пр. Тут больше зависит от того какие имеются сторонние базы организаций. Кстати, название компании и должность одни из немногих полей которые чаще всего позволяют заполнить произвольным образом, и, как следствие, требуют тщательной очистки и насыщения, иначе не могут в полной мере использоваться при анализе клиентской базы.

Связи между клиентами

Зачем нам знать связи между клиентами? Допустим мы почистили данные и нашли связи между людьми, но для чего нам выяснение всяких связей и пр.? Бесспорно, это хорошо что мы выяснили зависимости, но как на этом заработать?
Приведу пару примеров, навскидку:

  • Анализ нового клиента. Т.е. известное «скажи мне кто твой друг и я скажу кто ты» в действии.
    • К примеру у нас появляется новый клиент, молодой человек или девушка, по которому мы определили что он родственник нашего существующего vip клиента, и даже то что это сын или дочь. В таком случае нам лучше пометить и этого клиента как VIP, или ввести тип вроде VIP-related. Вполне возможно что если ему не понравится сервис, он может отговорит и своего отца пользоваться нашими услугами. Да, дети иногда имеют хорошее влияние на своих родителей, да еще и с учетом юношеского максимализма. В общем лучше подстраховаться сразу.
    • С другой стороны таким образом можно вычислить родственника (или соседа/друга) нежелательного клиента, или мошенника.
    • Ну конечно дополнительные критерии для скоринга.
  • Следующий вариант это коллеги. Если в одной организации есть несколько лояльных клиентов, то такую организацию будет гораздо проще поставить на какое либо корпоративное обслуживание. Опять же будет возможность улучшить лояльность компании, которой делается соответствующее предложение, предложив перед этим какой то бонус найденным (но ничего не подозревающим) «инсайдерам». Но это уже в сторону вирусного маркетинга и пр., тут главное что нашли точку куда можно приложить силу.

На самом деле тут можно придумать много очень хитрых вариантов использования, все зависит конкретно от тонкостей текущего бизнеса.

Да, и еще, тут еще интересный момент есть: для обнаружения связей между клиентами можно воспользоваться базами «Одноклассников» и «В Контакте». Если у нас не трудно достать базы не только всех гос. структур, но и вполне серьезных коммерческих организаций, банков и операторов сотовой связи, то база «Одноклассников» вообще не проблема, рано или поздно базы социальных сетей будут в продаже. Кстати, в случае БД социальных сетей типа «Одноклассников» все даже проще, так как доступ ко всем связям есть извне, через web, не надо прямого доступа к серверам. Я более чем уверен что уже есть софт который вытаскивает всю нужную информацию с этих сайтов и сохраняет ее в нужном виде. В конце концов вполне реально самостоятельно сделать парсинг подобных сайтов и последующее насыщение профайла, по мере надобности, так даже правильнее будет. Причем это будет вполне законно, в отличии от краденных баз.

Tags: ,

Leave a Reply