Здесь наша задача — решить, что делать с данными.
Например, модель выдает нам 300 000 человек, которые каждый месяц могут уйти в отток. Сколько времени нам нужно, чтобы обзвонить 300 000 человек? Ресурс контакт-центра ограничен. Другой момент — если модель будет предсказывать отток на момент оттока (когда клиент уже уйдет), у нас не будет времени их обзвонить — они будут уходить раньше, чем мы успеем с ними связаться. То есть нужен запас по времени между предсказанием и коммуникацией. Но чем дальше от момента оттока, тем ниже точность предсказания. И здесь мы снова идем на риск, который должны учитывать.
Кроме того, нужно понять, как быстро позволяют реагировать на изменения наши бизнес-процессы.
Все три вышеуказанных пункта обязательны еще до привлечения математиков.
Если же все сошлось и модель мы построили, начинается вторая и самая интересная часть — интеграция в бизнес-процесс. При этом, если на построение модели и сопутствующую математику уходит 20% времени, то остальные 80% (а иногда сильно больше) — на реализацию в продуктиве. Для того же оттока нужно будет наладить работу колл-центра, IT-интеграцию, отработать воронку. И на это могут уйти месяцы — в зависимости от подвижности компании.
Модель — это всего лишь пилот, MVP (минимально жизнеспособный продукт). В big data все любят делать пилоты, потому что на модели результаты обычно хорошие. Но большинство компаний в итоге не могут внедрить их в реальные бизнес-процессы, так как бизнес-процесс изменить сложнее всего.
Поэтому в структуре любого big data проекта есть data scientist, есть product manager, который отвечает за бизнес, а есть project manager и проектная команда, которые будут внедрять это, модифицировать бизнес-процесс под результаты. И только при таком комплекте есть смысл внедрять big data решения.