Kafka stream processing

Сабина
Уже с Приветом
Posts: 19041
Joined: 11 Jan 2012 09:25
Location: CA

Kafka stream processing

Post by Сабина »

Достаточно интересная штуковина если вникать. Особенно если по работе приходится.
На самом деле очень нетривиально придумать грамотный алгоритм для окна стрима данных, особенно когда UAT делают subject matter experts.
Неожиданно откопала весьма толковую статью по предмету от самого Джея Крепса и решила поделится тут лишний раз
https://www.confluent.io/blog/introduci ... de-simple/
https://www.youtube.com/watch?v=wOwblaKmyVw
User avatar
Мальчик-Одуванчик
Уже с Приветом
Posts: 15526
Joined: 27 Sep 2007 22:53

Re: Kafka stream processing

Post by Мальчик-Одуванчик »

А где там про грамотные алгоритмы?
Сабина
Уже с Приветом
Posts: 19041
Joined: 11 Jan 2012 09:25
Location: CA

Re: Kafka stream processing

Post by Сабина »

Мальчик-Одуванчик wrote: 12 Jan 2018 21:39 А где там про грамотные алгоритмы?
Там скорее задача очерчена :).
А конкретика это наверное KStreams Windowing (KTable)
https://softwaremill.com/windowing-in-b ... afka-akka/

или HasOffsetRanges

Сейчас пока насколько я вижу нет golden standard грамотно процессить данные из стрима. В реальной жизни редко кто по одному рекорду процессит, сразу же когда тот приходит в стрим. То есть чаще нужен таки какой то batching при получении. И вопрос как это все организовать пока кмк не решен
https://www.youtube.com/watch?v=wOwblaKmyVw
Сабина
Уже с Приветом
Posts: 19041
Joined: 11 Jan 2012 09:25
Location: CA

Re: Kafka stream processing

Post by Сабина »

Вот это ну просто очень правильно сказано в статье

https://softwaremill.com/windowing-in-b ... afka-akka/
Many companies discovered that they don’t really have "big data" (the exact meaning of which was never defined precisely); but they might have several data streams coming their way, just waiting to be leveraged. That’s why some people are now talking about fast data instead of the now old-school big data.
https://www.youtube.com/watch?v=wOwblaKmyVw
Сабина
Уже с Приветом
Posts: 19041
Joined: 11 Jan 2012 09:25
Location: CA

Re: Kafka stream processing

Post by Сабина »

Кстати в этом юлоге очень много cool staff про КафкуЮ стриминг и вообще
https://softwaremill.com/blog/
https://www.youtube.com/watch?v=wOwblaKmyVw
User avatar
Мальчик-Одуванчик
Уже с Приветом
Posts: 15526
Joined: 27 Sep 2007 22:53

Re: Kafka stream processing

Post by Мальчик-Одуванчик »

Ну а роль Кафки во всем этом?
Из первой статьи мне показалось что это некий программируемый предварительный сортировщик потока данных.
XpoH
Уже с Приветом
Posts: 2136
Joined: 08 Nov 2013 22:33
Location: SFBA

Re: Kafka stream processing

Post by XpoH »

pro.kafka канал в телеграмме, ведет витя гамов из confluent, если есть вопросы то он на все ответит.
User avatar
Мальчик-Одуванчик
Уже с Приветом
Posts: 15526
Joined: 27 Sep 2007 22:53

Re: Kafka stream processing

Post by Мальчик-Одуванчик »

XpoH wrote: 14 Jan 2018 08:20 pro.kafka канал в телеграмме, ведет витя гамов из confluent, если есть вопросы то он на все ответит.
Не хотелось бы заморачиваться открытием аккаунта в телеграме чисто из праздного интнреса.
Вдруг здесь кому-то не влом будет ответить на вопросы общего плана - что такое кафка и с чем его едят.
Еще интересно почему её так интересно назвали, ведь Франц Кафка ассоциируется прежде всего с отчаянием и безысходностью и безуспешных попытках это преодолеть.
XpoH
Уже с Приветом
Posts: 2136
Joined: 08 Nov 2013 22:33
Location: SFBA

Re: Kafka stream processing

Post by XpoH »

название, на сколько я помню, из-за плодовитости (намек на то что в нее пишут много) Франца, и увлечения им одного из авторов, работающего тогда в линкедине.
XpoH
Уже с Приветом
Posts: 2136
Joined: 08 Nov 2013 22:33
Location: SFBA

Re: Kafka stream processing

Post by XpoH »

Мальчик-Одуванчик wrote: 14 Jan 2018 06:25 Ну а роль Кафки во всем этом?
Из первой статьи мне показалось что это некий программируемый предварительный сортировщик потока данных.
ну типа того.
это этакий ПАБ/САБ который позволяет передавать огромные объемы данных в реальном времени.
User avatar
Мальчик-Одуванчик
Уже с Приветом
Posts: 15526
Joined: 27 Sep 2007 22:53

Re: Kafka stream processing

Post by Мальчик-Одуванчик »

XpoH wrote: 14 Jan 2018 09:05 название, на сколько я помню, из-за плодовитости (намек на то что в нее пишут много) Франца, и увлечения им одного из авторов, работающего тогда в линкедине.
То есть продукт преподносится как приглашение с ним потрахаться в качестве лекарства от тоски и безысходности? :)
XpoH
Уже с Приветом
Posts: 2136
Joined: 08 Nov 2013 22:33
Location: SFBA

Re: Kafka stream processing

Post by XpoH »

Мальчик-Одуванчик wrote: 14 Jan 2018 09:12
XpoH wrote: 14 Jan 2018 09:05 название, на сколько я помню, из-за плодовитости (намек на то что в нее пишут много) Франца, и увлечения им одного из авторов, работающего тогда в линкедине.
То есть продукт преподносится как приглашение с ним потрахаться в качестве лекарства от тоски и безысходности? :)
а если зарегистрироваться в телеграмме (у приличного человека должен быть там аккаунт), то можно без регистрации и смс качнуть kafka definitive guide, и потрахаться вдоволь.
User avatar
Sergunka
Уже с Приветом
Posts: 34164
Joined: 03 Dec 2000 10:01
Location: Vladivostok->San Francisco->Los Angeles->San Francisco

Re: Kafka stream processing

Post by Sergunka »

"A patriot must always be ready to defend his country against his government." Edward Abbey
Сабина
Уже с Приветом
Posts: 19041
Joined: 11 Jan 2012 09:25
Location: CA

Re: Kafka stream processing

Post by Сабина »

Ну это то давно лежит в сети.

По теме .. Сегодня прослушивала очередной класс от Стефанчика и он там дает сравнительный анализ: Kafka streams vs Spark vs Flink vs Apache NiFi ...
Оказывается Kafka streams Единственный фреймворк где индивидуальный мессадж процесится по прибытию. У всех других - микробатчинг. И это все меняется as we speak. В общем молодцы Confluent взялись за свой продукт основательно.
https://www.youtube.com/watch?v=wOwblaKmyVw
User avatar
valchkou
Уже с Приветом
Posts: 4195
Joined: 27 Apr 2011 03:43
Location: Сергели ->Chicago

Re: Kafka stream processing

Post by valchkou »

Сабина wrote: 17 Jan 2018 05:06 Оказывается Kafka streams Единственный фреймворк где индивидуальный мессадж процесится по прибытию. У всех других - микробатчинг. И это все меняется as we speak. В общем молодцы Confluent взялись за свой продукт основательно.
можно привести конкретный пример когда и где это все меняет
Сабина
Уже с Приветом
Posts: 19041
Joined: 11 Jan 2012 09:25
Location: CA

Re: Kafka stream processing

Post by Сабина »

valchkou wrote: 17 Jan 2018 05:21
Сабина wrote: 17 Jan 2018 05:06 Оказывается Kafka streams Единственный фреймворк где индивидуальный мессадж процесится по прибытию. У всех других - микробатчинг. И это все меняется as we speak. В общем молодцы Confluent взялись за свой продукт основательно.
можно привести конкретный пример когда и где это все меняет
Я бы не знала где именно смотреть , если бы не взяла эти классы. А он очень хорошо разложил что есть latest and greatest и я потом с его наводки стала следить за определенными вещами - KTables, про то как Avro schema поперла за последние год полгода. Мне трудно это в паре предложений описать, попробуйте ту статью что я приводила раньше, она только в моей Линкедин ленте собрала кучу лайков и 600+ просмотров.
https://medium.com/@stephane.maarek/how ... 1b48a6ad85
https://www.youtube.com/watch?v=wOwblaKmyVw

Return to “Вопросы и новости IT”