Рекламные интеграции блогеров с курсами по аналитике и data science - причина моего нервного тика номер один. Вторая - я сменила работу, столкнулась с реалиями этой распиаренный должности и утомлена потоком новой информации. С трудом вспоминаю, когда приходилось так много думать.
Иллюзий, что будни будут похожи на один большой TedTalks, не было: я в лучах софитов толкаю меняющие жизнь речи, основанные на результатах исследований и сенсационных открытиях, которые прятались в данных, а после беглого взгляда на построенные мной графики и таблички прибыль компаний бьет рекорды. Я имела представление на что иду, но все-таки некоторые вещи со стороны оставались неочевидны.
В онлайн-школах акцент делается на том, что для входа в профессию знание математики и навыки программирования не понадобятся. Не врут. Действительно, практическое применение data science требует умения выбрать правильные инструменты. Сложные формулы уже встроены в библиотеки Python, R, Excel и других инструментов. Нетехнический бэкграунд - проблема, но не ключевая.
Вот пара аспектов, о которых не помешает задуматься до того, как начнете инвестировать время и деньги в смену карьеры.
Никто не знает, что означает "Data Science"
На небе только и разговоров, как решения, основанные на данных, машинное обучение и искусственные интеллекты приносят компаниям миллионы долларов. По итогу бизнес стремится нанять дата саентистов, ожидая немедленного возврата инвестиций. Что невозможно. Прежде чем ощутимый результат от аналитики будет достигнут, потребуются месяцы проб и ошибок, но попробуйте это объяснить менеджеру.
К тому же, нет ни одного однозначного определения должности - data scientist. Это значит, что обязанности сотрудника и ожидания от компании к компании будут различаться. Проблемы, которые на самом деле можно решить без применения "умных" алгоритмов, часто ошибочно передаются в исполнение дата саентистам.
В идеальном мире, сначала вы определяете проблему, затем создаете инфраструктуру и только потом привлекаете специалистов по данным. Не наооборот.
Часто отсутствие результата - и есть результат работы
Последний месяц я потратила на поиск алгоритма сегментации временных рядов. 4 недели по 8 часов рабочего времени и еще пара дней личного искала способ разделить сигнал на части. Чтобы что? Чтобы прийти к выводу, что с текущим объемом данных достоверных результатов не достичь.
Часть задач дата саентистов не имеет шаблонных решений. Количество готовых библиотек сильно упрощает работу, но не всегда легко найти подходящую модель с ходу. Алгоритмы машинного обучения часто требуют настройки параметров и оптимизации для достижения желаемых результатов. Приходится экспериментировать с алгоритмами и подходами, исследования требуют долгих часов работы, а иногда решения может не существовать вовсе, но об этом вы узнаете только после того, как попробуете все.
Будьте готовы к неловким разговорам с руководством о том, почему то, на что вы потратили несколько месяцев, не может быть использовано.
Придется много говорить. Словами через рот.
Дата саенс — это не только технические навыки, но и способность работать с заинтересованными сторонами бизнеса, понимать запросы и проблемы, а также ясно и кратко излагать сложные концепции и результаты. За себя и идеи придется постоять. Критично управлять ожиданиями, устанавливая четкие цели, реалистичные сроки и регулярно обмениваясь информацией на протяжении проекта - объективно за неделю не изобретете алгоритм прогноза следующего тренда в тиктоке.
Думаете, что на работе будете строить искусственный интеллект, который изменит мир?
Возможно, но только после того, как закончите с рутиной.
Производительность модели ограничена качеством данных, которые использовались для ее создания, поэтому значительная часть рабочего процесса будет потрачена на сбор и подготовку данных.
Подготовка включает в себя проверку на наличие ошибок, отсутствующих значений и несоответствий, а также форматирование и организацию таким образом, чтобы они подходили для анализа. Этот процесс трудоемкий и требует внимания к деталям. Кроме того, может потребоваться повторить несколько раз по мере сбора новых данных или изменения хода анализа.
Ах да, а еще время и нервы будут потрачены на настройку библиотек под конкретный кейс.
ImportError?
Казалось бы гугли проблему, находи нужную библиотеку, импортируй и используй для своих задач. Однако, существует проблема, которая затрудняет установку и использование необходимых библиотек и компонентов. Ад зависимостей!
Вы попадаете в него, когда возникают конфликты или несоответствия между библиотеками и пакетами. Придется потратить много времени на устранение зависимостей, чтобы приступить к работе.
Прежде спросите себя: "А умею ли я гуглить?"
Один раз знакомый спросил, как стать аналитиком. Для ответа на вопрос пришлось приложить массу усилий...нет, не для того, чтобы собрать рекомендации в кучу, а чтобы не высказать: "Может не стоит становиться аналитиком, если настолько не умеешь гуглить?"
Да, на некоторые вопросы человек ответит лучше, чем поисковик, но часть отпадет после первой ссылки в выдаче. Способность использовать Интернет для поиска решений проблем и устранения ошибок имеет решающее значение для дата саентиста. Всё уже давно придумали, осталось только докопаться до правильной формулировки и найти нужную статью.
Интернет сэкономит время и усилия, позволит сосредоточиться на креативных и творческих задачах.
Сколько бы вы ни учились, всегда будет столько же и еще в два раза больше неизвестного
Сфера данных еще не преодолела пика популярности и продолжает развиваться, и оставаться в курсе инструментов, алгоритмов и лучших практик - нетривиальная задача.
Несмотря на удовольствие, которое доставляет освоение навыков, постоянная учеба требует умственных усилий и концентрации и со временем истощает когнитивные ресурсы мозга. Необходимость следить за активно меняющейся областью приводит к чувству выгорания, а страх упустить что-то важное вызывает стресс и тревогу.
Да, вакансий действительно много, да, бизнес решения, основанные на проверенных данных, лучше, чем на догадках, да, барьер для входа ниже**, чем для разработчиков, все так. Но это всего лишь очередная работа, шарм вокруг которой создал капитализм, читай, рыночек порешал. Аналитики отдела продаж проанализировали спрос, а маркетинговые аналитики выяснили, как и кому побольше продать таких курсов.
**Он все еще есть, нельзя проснуться и стать аналитиком.
Конечно, в этом нет ничего плохого, кому-то этот образовательный продукт поможет изменить жизнь, а кому-то поможет понять, что вообще-то этим ему заниматься и не хотелось.
Исследования говорят, что от 40% до 80% бросают онлайн-занятия. В Российском сегменте я нашла цифру 59% - средневзвешенный показатель доходимости до финала.
Итак, моя цель была дать вам несколько причин, почему вы НЕ хотите становиться аналитиком данных, даже если таргетированная реклама убеждает вас в обратном!
Но это мои личные выводы,
вы сами знаете лучше.