Какие компетенции потребуются для решения аналитических задач бизнеса

Анна Племяшова, Руководитель Департамента аналитики больших данных и искусственного интеллекта Beltel Datanomics.

Согласно исследованию 2020 Global State of Enterprise Analytics компании MicroStrategy, поставщика BI решений и облачных сервисов, 94% респондентов из различных отраслей называют данные и аналитику важными элементами для роста бизнеса и цифровой трансформации. Опрошенные специалисты указали отсутствие знаний и подготовленных кадров одной из главных проблем эффективного использования аналитики наравне c конфиденциальностью данных и обеспечением их доступности.

Какие экспертизы оставить внутри организации, а какие можно вынести на аутсорсинг, оптимизируя затраты на аналитику?

Агентство Gartner приводит график, демонстрирующий эволюцию аналитических возможностей по мере развития технологий и автоматизации производственных процессов (рис. 1).

Рис. 1. Стадии зрелости аналитики данных

Понятно, что чем сложнее аналитическое решение, тем затратнее ресурс, который это решение развивает и поддерживает. Если размер компании не предусматривает широкое масштабирование полученного результата, то целесообразно рассматривать готовые продукты, которые обойдутся дешевле, чем развитие собственных.

Предлагаем пройти по стадиям зрелости аналитики данных и определить, какими компетенциями стоит обладать специалистам на каждом уровне, а также базовые требования для запуска аналитических проектов.

С чего начать внедрение аналитики данных

Основное требование для аналитических решений – это наличие качественных данных за несколько повторяющихся циклов, например, сезонных или производственных.

Одна из стратегических задач, которая упоминается экспертами, как приоритетная – это управление данными (Data Governance).

Подробнее о Data Governance можно ознакомиться в нашей статье по ссылке.

В зависимости от масштаба компании ответственность за внедрение процессов управления данными может возлагаться на ИТ отдел или рабочую группу с ответственным за внедрение, в отдельных случаях вводится новая должность директора по данным (CDO, Chief Data Officer).

Наш опыт общения с заказчиками показывает, что, как правило, ответственными за управление данными являются ИТ-директора при поддержке руководителей от бизнес-подразделений.

Внедрение аналитики в компании происходит с BI решений, которые позволяют визуализировать данные и внедрять диагностическую аналитику. Самые популярные продукты на рынке BI систем – это Power BI, Tableau, Qlik Sense. Эти сервисы работают с разными источниками данных, многофункциональны и предоставляются по подписке, стоимость зависит от количества пользователей. Например, стоимость подписки Power BI составляет 750 руб./месяц (с НДС) на одного пользователя.

Для настройки дашбордов в зависимости от требований бизнес-подразделений в штате компании рекомендуется иметь BI-аналитика, т. к. запросы от бизнеса на формирование аналитических отчетов могут поступать регулярно.

Минимальные требования к таким специалистам:

  • Уверенная работа c SQL
  • Опыт работы с BI системами
  • Хорошее знание Excel
  • Знание математической статистики и теории вероятностей

В зависимости от уровня ответственности и автономности такие специалисты в среднем по рынку обойдутся работодателю от 70,000 до 150,000 рублей с учетом налогов и выплат по заработной плате (в пенсионный и прочие фонды).

Наличие BI-аналитика не отменяет необходимость обучение персонала отделов, где наиболее востребованы аналитические решения, навыкам пользования BI-сервисами – это ускоряет процесс построения несложных отчетов и повышает аналитическую культуру в компании.

Освоение продвинутой аналитики

Несколько лет назад стал доступен инструментарий продвинутой аналитики в том числе с использованием больших данных, позволяющий предоставлять бизнесу важную информацию и увеличивать эффективность производственного процесса. Такую аналитику еще называют предсказательной или предиктивной аналитикой (Predictive Analytics) и предписывающей аналитикой (Prescriptive Analytics). Продвинутая аналитика основана на построении математических моделей методами машинного обучения (Machine Learning, ML).

Примерами решений в области продвинутой аналитики и искусственного интеллекта можно назвать:

  • различные задачи прогнозирования (спроса, закупок, сырья, смены персонала, оттока клиентов и пр.);
  • рекомендательные сервисы;
  • решения по оптимизации (цены, ассортимента, условий сделки, технологического процесса и пр.);
  • предиктивное обслуживание оборудования как частная задача прогнозирования;
  • решения с применением компьютерного зрения (распознавание товара, идентификация людей, присутствие/отсутствие персонала в контрольных зонах, наличие очередей и пр.);
  • решения с применением методов обработки естественного языка (Natural Language Processing, NLP) (интеллектуальные чатботы, информационный поиск, машинный перевод и пр.)

Внедрение подобных аналитических решений требует расширенной экспертизы аналитиков, а также привлечения архитекторов и разработчиков, которые запустят модели в промышленную эксплуатацию.

Частое упоминание в СМИ профессии Data Scientist и перспектив дохода, которые открываются перед обладателями навыков, позволяющих претендовать на эту должность, вызвало невероятную популярность программ ВУЗов и курсов по этой специальности и перегрев рынка от зарплатных ожиданий соискателей. Рынок обработки данных развивается и постепенно конкретизируется по направлениям специалистов. Для бизнеса, если это не такие корпорации, как Google или Facebook, не так актуальны исследования и наука (Data Science в чистом виде), как прикладные решения и внедрения продуктов. Такие специалисты называются ML инженерами (ML Engineer) и инженерами по данным (Data Engineer).

Инженеры по данным – это специалисты, которые проектируют и организуют хранилища данных, поддерживают ETL – процессы. Отдельная штатная позиция инженера по данным актуальна, если есть необходимость собирать из различных источников большие данные. Вырастить инженера по данным, если потребуется, можно из существующей команды ИТ-отдела. Например, если выбрать для развертывания хранилища данных облако Microsoft Azure, можно пройти обучение, сдать экзамены по курсам внедрения и проектирования решений по обработке данных (DP-200 и DP-201) и получить сертификацию Azure Data Engineer Associate.

ML инженеры, или в некоторых компаниях должность носит общее название Аналитик данных (Data Analytics), больше про математику и разработку решений продвинутой аналитики.

При проведении интервью на вакансию аналитика в команду Datanomics половину времени мы отводим на тестирование и опрос по математике: начиная от школьной программы, например, умение находить минимумы и максимумы элементарных функций, задач на комбинаторику, до проверки знаний в линейной алгебре, теории вероятностей, статистике. Отдельно проверяем знания алгоритмов машинного обучения и опыт их применения.

Самый распространённый язык программирования, который используют аналитики данных (и мы тоже отдаем предпочтение специалистам со знанием этого языка) – это Python. Помимо этого необходимо владение, как минимум, следующими библиотеками: numpy, pandas, matplotlib, sklearn. Плюсом для нас является знание фрейворков Dash, Flask.

Специализация аналитиков в компьютерном зрении или NLP потребует дополнительных знаний библиотек и фреймворков, таких как Tensorflow, OpenCV, Keras, PyTorch, NLTK и пр.

В текущей практике построения архитектур программного обеспечения завоевывает популярность микросервисный подход, поэтому специалистам необходимо владеть еще и такими инструментами, как Docker и Kubernetes.

Читайте также: Как микросервисный подход к реализации аналитических решений влияет на бизнес?

Как видно из описания навыков и знаний, которые потребуются современным аналитикам, традиционной статистикой при внедрении продвинутых решений обработки данных не обойтись.

Для поддержки собственной экспертизы потребуется руководитель разработки и команда как минимум из двух аналитиков или ML инженеров. Стоимость таких специалистов зависит от объема задач – будет ли это решение предиктивной аналитики или потребуются применение технологий компьютерного зрения или NLP.

Целесообразность развития собственного отдела, как уже писали, зависит от возможности масштабирования. В некоторых случаях компании предпочитают создавать отдел инноваций или иметь выделенного координатора по интеграции, который находит интересные аналитические решения на рынке и встраивает их в существующие корпоративные платформы.

Для того, чтобы компании могли оценить свой оптимальный путь для внедрения аналитики в бизнес-процессы, необходимо составить таблицу альтернативных подходов, отметить их достоинства и недостатки, посчитать бюджеты и сроки реализации. Но для начала надо определиться со стратегическими целями внедрения аналитики и списком приоритетных задач.

Дополнительно

Больше статей о подходах к аналитическим решениям вы найдете в нашем блоге:

Оставьте заявку и получите бюджет и план внедрения наших решений в ваш бизнес

Заполняя форму, Вы соглашаетесь с правилами обработки персональных данных.

Мы используем файлы cookies, чтобы получать статистику и делать наш сайт и другие сервисы удобными для вас. Продолжая дальнейшее использование сайта и/или его сервисов, вы соглашаетесь с этим. Более подробную информацию можно прочитать в «Политика обработки персональных данных» и в «Политика Cookies»