|
Big data —
это большой массив разнородных
данных. Чтобы они принесли
пользу, в них нужно найти
какие-то полезные
закономерности: сходства,
различия, общие категории и так
далее. Процесс поиска таких
закономерностей и называют data
mining — добыча данных, или
глубинный анализ данных. Как это
работает. Мы берем большие
данные и «добываем» из них новые
полезные данные с помощью
различных технологий:
всевозможных методов
классификации, моделирования и
прогнозирования, основанные на
применении деревьев решений,
нейросетей, генетических
алгоритмов и других методик. К
методам data mining часто
относят и статистические методы.
Мониторинг данных в реальном
времени важен, чтобы отслеживать
некоторые бизнес-процессы.
Например, банки могут
анализировать денежные переводы
и выявлять попытки мошенничества
при операциях с картами, а
транспортные компании быстро
менять маршруты водителей с
учетом поступающей информации о
новых заказах. На таком же
принципе строится автоматический
аукцион при отображении
онлайн-рекламы (bidding) — когда
система выбирает, какое
объявление показать новому
пользователю на основании
информации о нем и ставках
рекламодателей. |
|
|
В зависимости от цели, которой
нужно добиться в процессе
анализа данных, выделяют
несколько основных видов
аналитики. Продуктовая аналитика
собирает данные, которые
помогают изучать поведение
пользователей во время их
взаимодействия с продуктом. Везде, где из
больших данных нужно извлекать
какие-то тенденции и
закономерности. Решение
большинства задач компании,
связанных с данными, сводится к
той или иной задаче data mining
или их комбинации. Например,
оценить риски можно с помощью
регрессионного анализа,
сегментировать покупателей с
помощью кластеризации.
|
|
Нас окружает много данных: контакты в
телефоне, список покупок, фотоальбомы, плейлисты,
задачи по работе. А ещё каждую секунду в мировом
киберпространстве передаются тысячи терабайт
данных. Часть из них пока не обработана и не
представляет собой ценной информации. Чтобы
данные стали полезными, их нужно собрать и
проанализировать. Этим занимается аналитик
данных. Данные важны для разных сфер бизнеса,
науки, образования, медицины, потому что
помогают принимать решения, планировать
действия. Например, в торговле анализ данных
поможет понять, какой товар будет популярен в
следующем месяце, на каком этапе покупатели не
оплачивают «Корзину» в интернет-магазине, как
расположить товары, чтобы вызвать наибольший
интерес покупателей. Анализ данных в
производстве и промышленности поможет выбрать
оптимальные каналы сбыта, спрогнозировать
продажи или износ оборудования.
Основные инструменты аналитика помогают
ему собирать, обрабатывать, анализировать и
интерпретировать данные. Несмотря на большое
количество сервисов и программного обеспечения,
на практике специалист использует в работе 3–4
ключевых инструмента. Их выбор зависит не только
от знаний и опыта аналитика, но и от того, с чем
уже работает компания. Например, если бизнес
использует Tableau — дорогой инструмент, —
аналитику придётся работать с ним, даже если он
привык работать в Power BI. А вот в плане
написания кода специалист свободен в выборе и
может использовать любой язык программирования.
Мы выбрали самые распространённые инструменты
дата-аналитика, которыми владеют практически все
специалисты. Программ, технологий и приложений
гораздо больше, но мы не рекомендуем гнаться за
количеством освоенных инструментов. Важнее
понимать, что можно сделать с помощью той или
иной технологии и программы.
В зависимости от цели, которой нужно добиться в
процессе анализа данных, выделяют несколько
основных видов аналитики. Продуктовая аналитика.
Нужна, чтобы улучшать продукт. Продуктовая
аналитика собирает данные, которые помогают
изучать поведение пользователей во время их
взаимодействия с продуктом. Например,
производителю важно знать, как часто пользуются
его продуктом, какие проблемы при этом
возникают, какую пользу от использования
получает клиент. Маркетинговая аналитика. Нужна,
чтобы оценивать эффективность маркетинговых и
рекламных кампаний. Такая аналитика собирает
данные из рекламных каналов и CRM. С её помощью
определяют, с какой рекламной кампании пришёл
пользователь, купил продукт или нет, сделал это
сразу или через какое-то время и т. д. Работа с
данными маркетинговой аналитики помогает понять,
почему пользователи покупают или не покупают
продукт, какой бюджет нужен для рекламной
кампании, что нужно изменить на сайте, в работе
отдела продаж или логистике.
Структурированные данные — те, что собираются
в базах данных в определенном формате. Например,
это может быть таблица со строго определенными
полями, где в одном столбце данные,
идентифицирующие клиента, в другом сумма его
покупок, в третьем дата и так далее.
Неструктурированные данные — разнородные массивы
информации без четкой структуры, например:
текстовые файлы, изображения, комментарии из
соцсетей. Эти данные помогают найти скрытые
взаимосвязи и проанализировать предпочтения
клиентов, стратегии конкурентов, тенденции
ценообразования и другие важные для компании
параметры.
BI-аналитика (Business Intelligence-аналитика).
Нужна, чтобы собирать, хранить, анализировать,
обрабатывать и наглядно представлять все данные,
которые есть в компании. BI-аналитика помогает
собирать данные из разных источников,
разрабатывать и подтверждать гипотезы,
моделировать возможные решения. Компании,
которые используют BI-аналитику, могут
анализировать операционные расходы,
прогнозировать доходы, сегментировать целевую
аудиторию по разным признакам и т. д. Данные,
которые используют для анализа, невозможно
собирать, хранить и обрабатывать вручную,
поэтому аналитики используют специальные
инструменты. |
|
|