KotKot wrote:
Я написал что делаю в общем виде выше в ответе Физику-Лирику. Конкретно в SAS в основном использую
-Data steps - formatting, merging, etc
-Proc SQL
-Proc means, summary, freq, etc for reporting. Графики чаще всего рисую в экселе на основе получающихся таблиц.
-Macros and macro variables, arrays - иногда
-Proc univariate, corr и др. стат анализ - иногда
-Proc reg, proc logistic - реже
1) Язык, на котором Вы работаете сейчас, достаточно востребован. Даже у меня у самого есть сертификат
(сдал когда-то для интереса). В резюме хорошо выглядит. Делеко не все конторы работаю с опен соурсем.
Так что не следут Вашим ценным навыком пренебрегать. Очень пригодится.
2) У Вас классический набор бизнес-аналитика и это тоже ценно. С дескриптив статистикой далеко не уйдешь,
но ценится.
3) Какие биг дейта тулс знаете? Рекомендую Хадуп, Спарк (становится популярным), Пиг и Хайв. Т.к. сиквел
Вы знаете с Хавом проблем не будет. Пиг - достаточно несожный и приятный. Я бы рекомендовал с них и начать,
но придется Хадуп установить.
4) Далее, надо решить, будите ли двигаться в маш. обучение и статистику. Если да, то надо посмотреть
книжки. Я предпочитаю с оранжевыми обложками (люблю это издательство), но там много формул. Может имеет
смысл начать с вводных книг. Наверное, имеет смысл купить книги по маш. обучению на R (таких несколько,
легко найдете). Тогда сразу достигните двух целей.
5) Имеет смысл продолжить изучение инференциальной статистики. Это точечные оценки, интервальные оценки
и гипотезы. Для этого рекомендую книги по биостатистике (не смущайтесь названием, просто в них содержится
описание тестов типа т-теста, ановы, кай-скуаре, проерки гипотез, пи-валью и т.п.). Собственно маш. обучение
- это тоже инферециальная статистика (+ оптимизация).
6) Чтобы научиться вызывать правильные языковые функции (например, регрессию) для анализа потребуется
несколько недель/ месяцев. Зависит, сколько "функций" хотите освоить. Чтобы основательно выучить статистику
с маш. обучением - по крайней мере годик, а то и два. Практически все маш. обучение основано на решении
оптимизационных задач (с ограничениями) да еще с регуляризационным параметром, так что надо будет оптимизацию
повторять.
7) Нужна ли она вся эта "математика" - наверное нет. Большинство понятия не имеет. Лично много раз убеждался.
Не исключено, что достаточно освоить "функции" из языка и понимать, что они делают.