Сначало пройдемся по вопросамvalchkou wrote: ↑09 Jan 2018 16:11в таком случае еще несколько вопросов:Sergunka wrote: ↑09 Jan 2018 06:23Просто кашка вроде как лучше интегрируется в нашем облаке https://www.predix.io/ cо спарком т.е. просто наша местная заморочкаvalchkou wrote: ↑09 Jan 2018 05:49понятно спасибо. А почему каффка, а не rabbitmq к примеру?Sergunka wrote: ↑09 Jan 2018 05:45Там типо загрузил в блобстор файло большое плюнул в кашку что кушать подано... прогнал плюнул что кушать подали надо агрегирорвать уже из касандры касандра агрегировала плюнул в кашку что результат такой. Результат такой подписчик поднял в вебсокет - вебсокет выдавил в дашбоарду.
Так же есть варианты если файло мекое в пределах разумного то льется сразу в кашку ну и тд.
1) кассандра-спарк от датастакс или опенсурс?
2) если опенсурс используете ли вендора для 24х7 суппорта кассандры, если да то можно контакт
3) прикручен ли какой нибудь SQL транслятор над спарком?
4) на каких языках написаны апы которые говорят со спарком и кассандрой?
поясню почему спрашиваю.
мы тоже строим iot.
некоторой время назад перевели несколько процессов с оракла на кассандру.
первое время использовали датастакс, но их сверх агрессивная ценовая политика вынудила нас перейти на опенсурс.
пока не имелось нужды натягивать спарк на кассандру, более менее большие запросы распарралеливаются самим приложением используя, java parallel streams, fork/join or BlockinqQ/CountdownLatch.
Но недавно появились более сложные задачи.
1) в моем случае работаем с Датастах
2) не знаю другие отдела возможно сидят на чистой кассандре - спрошу
3) в спарк мы так глубоко не залезли пока это проект размером в три четыре недели и дофига чего не работает
4) пока стараемся сидеть на яве, но есть проекты под скалой
Для сложных задач мы используем два кластера - кашка впереди и сзаду кассандра (как там чего организовано я не знаю не лазил) я учавствовал в эпическом тестинге это монстра показатели вроде такие
- 3 миллиона датапоинтс в секунду
- в сблокированных сообщениях порядка 20К до 300К в секунду в зависимости какими блоками посылать
детали по документации можно глянуть здесь к примеру
https://docs.predix.io/en-US/content/se ... es-service
Основная концепция местного облака базируется на двух базовых сервисах - Ассет сревис и сервис Временных рядов вместе их обозначают Цифровые Близнецы (Digital Twins)