Все таки какие ваши предпочтения для решения вашей задачи?Easbayguy wrote:С моей точки зрения, NoSQL хорош для хранения временных/нестурктурированных данных которые не требуют backup и не предполагают ананлитической обработки внутри базы. Которому не нужен контроль транзакций и как вы о своем приложении, перезаписывается каждые 5 дней, веб логи и так далее.crypto5 wrote: Очевидно что вы можете нарастить свой кластер, добавить в него нодов, если данные для вас ценны.
Везде где я видел данные компрессируются, ну и где вы предлагаете хранить данные если не в кассандре?
Для НоСкл применений много, та же real time аналитика (i.e. google analytics), где хочется смотреть сложную аналитику с sub-second latency, а для этого нужно считать много разных каунтеров, делать денормализации в real-time, или к примеру search engines, или вебмейл, или social network какой, анализ логов все таки делается без nosql, легче на hdfs писать и потом map reduce делать.
Транзакции тоже научились делать, например с помощью локов zookeeper: https://zookeeper.apache.org/doc/r3.1.2 ... haredLocks или copmare and swap в кассандре: http://www.datastax.com/dev/blog/lightw ... sandra-2-0 a некоторые проприетарные решения делают все это из коробки: http://research.google.com/pubs/pub38125.html ))
А в вашем кейсе (когда много tombstones in sstables, и много данных на ноде), стоит посмотреть на leveled compaction - она призвана помогать именно в таких ситуациях: http://www.datastax.com/dev/blog/levele ... -cassandra