metaller wrote: ↑22 Nov 2017 02:43
Попробуйте без TEZ, может помочь. За мою недолгую (1.5 года) карьеру Big Data developer слово TEZ стало синонимом слова ГЛЮК
Ой на больной мозоль наступаете
! В смысле что Tez притащил тот самый девопсовый гай, который "лучше девелоперов знает что делать". Ну и сами понимаете стартап, то есть с кем работать тим не выбирает - кого дали, то бишь.
Меня еще одна вещь мучает ( точнее несколько
, но теперь уже задним числом).
Там кластер был сконфигурирован так:
- MASTER node,
- CORE node
- TASK node ( автоскейлится от 1 до 10).
Смущали следующие вещи:
1) Zeppelin был сконфигурирован так, что все ,запущенное в разных ноутбуках (разными девелоперами, пользующимися одним общим логином) проходило как один application ID. Логи трудно разгребать, все в куче. По моему это не самый эффективный способ конфигурировать notebook for multiple developers
2) В DAG видно что для некоторых задач запускаются десятки экзекьюторов, но все они почему то на CORE node, то есть IP core node, только порты разные. А почему TASK node(s) вообще не используется
? Это тоже не поняла ?
А почему ваша карьера big data engineer недолгая ? забросили , непонравилась ? или только начинаете ?