Думала SQL-ом, аналитическая функция (LAG etc), но потом подумалось что должен быть какой нибудь подходящий DS algoritm. Перекопала свои лекции по ML4BIZ, ничего подходящего не нашла. Решила спросить здешних датасатанистов
Есть timeseries records like
Code: Select all
ID timestamp col1 col2 col3. .....
abc1 ts1 val1 val2 val3
abc1 ts2 val1 val2 val3
abc3 ts3 val1 val2 val3
abc1 ts4 val1 val2 val3
abc1 ts5 val1 val2 val3
abc1 ts6 val1 val2 val3
abc3 ts7 val1 val2 val3
abc1 ts8 val1 val2 val3
Нужно извлечь insights like ...
- abc1 has the most changes in col1 over time, abc3 has the most changes in col3 over time
- col3 is the most frequently changed column in the last 24 hours
И все в таком духе.
Anybody ?