Аналитик данных, майнер данных, эксперт по машинному обучению, специалист по анализу данных, эксперт по искусственному интеллекту, инженер по данным, эксперт по бизнес-аналитике и так далее… все это перспективные и хорошо оплачиваемые профессии. 

Причины просты. Данных становится все больше и больше, и развитие компьютеров предоставляет все новые и новые способы их обработки и, как следствие, получения преимуществ. Так как же стать одним из них?

Наука о данных

Эти профессии связаны, но не одинаковы. Как и в случае с программистами, где есть люди, которые специализируются на фронтенд-разработке, бэкэнд-разработке, программировании распределенных систем и т.д.

В случае науки о данных и искусственном интеллекте можно разделить специализацию на 3 основных направления.

Специалист по отчетности и анализу

Его часто называют экспертом по бизнес-аналитике или программистом SQL.

Человек на этой должности использует данные, существующие в компании, для подготовки ценных для руководства отчетов в виде таблиц или графиков. Это могут быть статические диаграммы или интерактивные информационные панели.

Базовыми инструментами часто является аналитика данных на Python, R и инструменты визуализации данных — от Excel до Tableau или Power BI. Также следует эффективно использовать такие базы данных, как MySQL, Postgres, Oracle и иногда Hadoop.

Важны аналитические навыки и умение «делать» выводы из данных. Умение понимать требования таких отделов, как: 

  • маркетинг, 
  • продажи, 
  • финансы и т.д.

Специалисту этой сферы не нужно быть математиком, а скорее практичным и любознательным человеком.

Специалист по машинному обучению.

Эту должность часто называют экспертом по машинному обучению, майнером данных, а иногда и инженером по ИИ или экспертом по ИИ.

Люди на этих должностях несут ответственность за подготовку и реализацию алгоритмов, которые предсказывают, классифицируют или идентифицируют события. В отличие от специалиста по отчетности и анализу, они должны обладать знаниями и навыками в области алгоритмов, таких как деревья решений, регрессия, нейронные сети, SVM и т.д.

Роль гораздо больше связана с математикой, чем предыдущая, и здесь требуется научный склад ума.

Инженер по данным

Должность, которую часто называют Data Engineer и Big Data Engineer.

Человек на этой должности является специалистом в области обработки данных, который обеспечивает: 

  • очистку, 
  • фильтрацию, 
  • агрегирование данных, представленных в компании, и их размещение в базах данных таким образом, чтобы ранее описанные роли могли основывать на них свою работу.

Ему необходимо понимать структуру хранилища данных и темы Big Data, которые часто связаны с Hadoop и Spark. Основными языками программирования в этой области являются Python и Scala.

По сравнению с работой программиста, это back-end разработка, не требующая каких-либо знаний математики. Также ограничено взаимодействие с бизнес-подразделениями. Однако нужно быть эффективным программистом, который может оптимизировать обработку данных.