Есть тут кто из пользователей библиотеки ? Конкретно интеграция с Кафкой интересна - file sinks etc. Конкретных технических вопросов нет, чисто поболтать . Интересную штуку на работе имплементировала, а обсудить не с кем. Кроме коллег, но там уже все что можно обсудили и угол немного другой
Что конкретно интересно ?
-Какой режим используете batch or stream?
-Куда это все деплоиться ? Если в облако то в какое?
-Какие размеры данных и какой кластер под это пользуете ? Есть ли autoscaling?
-Если работаете со streaming, какое processing time window, как подбирали.
- смотрели ли вы на другие techstacks для решения той же самой задачи
Могу рассказать все симметрично про то как у нас
Spark Structured Streaming
-
- Уже с Приветом
- Posts: 19041
- Joined: 11 Jan 2012 09:25
- Location: CA
Spark Structured Streaming
https://www.youtube.com/watch?v=wOwblaKmyVw
-
- Уже с Приветом
- Posts: 1349
- Joined: 28 Nov 2008 17:50
Re: Spark Structured Streaming
сюда всего 5 человек заходят, причем выглядит что самому младшему далеко за 50. мне интересно кого из них вы заподозрили в связях со стримингом
зы. у нас на хадупе spark только батчи жует. строит data lake, прогоняет скоринги. jpmml либу в связке со spark, через mapPartitions() дергаем.
зыы. вспомнил, есть у нас джобы которые пишут спарком в кафку avro меседжи. причем пишут с участием confluent либы, котораяуказывает схему где-то в их Confluent Schema Registry
зы. у нас на хадупе spark только батчи жует. строит data lake, прогоняет скоринги. jpmml либу в связке со spark, через mapPartitions() дергаем.
зыы. вспомнил, есть у нас джобы которые пишут спарком в кафку avro меседжи. причем пишут с участием confluent либы, котораяуказывает схему где-то в их Confluent Schema Registry
-
- Уже с Приветом
- Posts: 19041
- Joined: 11 Jan 2012 09:25
- Location: CA
Re: Spark Structured Streaming
А что те кто за 50 не уважают стриминг ?iDesperado wrote: ↑07 Mar 2021 09:14 сюда всего 5 человек заходят, причем выглядит что самому младшему далеко за 50. мне интересно кого из них вы заподозрили в связях со стримингом
зы. у нас на хадупе spark только батчи жует. строит data lake, прогоняет скоринги. jpmml либу в связке со spark, через mapPartitions() дергаем.
зыы. вспомнил, есть у нас джобы которые пишут спарком в кафку avro меседжи. причем пишут с участием confluent либы, котораяуказывает схему где-то в их Confluent Schema Registry
Ну спасибо что предупредили, тогда пусть тема повисит в надежде что кто то из любителей стриминга тоже забредёт
https://www.youtube.com/watch?v=wOwblaKmyVw