Что же происходит на рынке IT-труда в США?
-
- Уже с Приветом
- Posts: 8628
- Joined: 22 Mar 2011 01:40
Re: Что же происходит на рынке IT-труда в США?
Нужно еще про такой knob, как управляемая consistence, не забывать.
От ее полного отсуствия (eventual consistence) до ее полного присутсвует (consistent read).
От ее полного отсуствия (eventual consistence) до ее полного присутсвует (consistent read).
-
- Уже с Приветом
- Posts: 4637
- Joined: 24 Oct 2009 01:38
- Location: Chicago ;-) -> SFBA!
Re: Что же происходит на рынке IT-труда в США?
Это все бородатые урбан мифы про то что кассандра тормозит на чтении и у нее неправильная консистенци.
In vino Veritas!
-
- Уже с Приветом
- Posts: 17281
- Joined: 07 Sep 2011 10:05
- Location: Seattle, WA
Re: Что же происходит на рынке IT-труда в США?
А разве кто-то говорит, что Кассандра тормозит на чтении?crypto5 wrote:Это все бородатые урбан мифы про то что кассандра тормозит на чтении и у нее неправильная консистенци.
-
- Уже с Приветом
- Posts: 4637
- Joined: 24 Oct 2009 01:38
- Location: Chicago ;-) -> SFBA!
Re: Что же происходит на рынке IT-труда в США?
Ок, говорит что она супербыстрая на запись а скорость чтения не так уж и важна.Интеррапт wrote:А разве кто-то говорит, что Кассандра тормозит на чтении?crypto5 wrote:Это все бородатые урбан мифы про то что кассандра тормозит на чтении и у нее неправильная консистенци.
In vino Veritas!
-
- Уже с Приветом
- Posts: 17281
- Joined: 07 Sep 2011 10:05
- Location: Seattle, WA
Re: Что же происходит на рынке IT-труда в США?
Ну да. Кассандру (из NoSQL решений) обычно выбирают по критериям скорости записи, а скорость чтения - уже вторичней.crypto5 wrote:Ок, говорит что она супербыстрая на запись а скорость чтения не так уж и важна.Интеррапт wrote:А разве кто-то говорит, что Кассандра тормозит на чтении?crypto5 wrote:Это все бородатые урбан мифы про то что кассандра тормозит на чтении и у нее неправильная консистенци.
-
- Уже с Приветом
- Posts: 9035
- Joined: 25 Oct 2011 19:02
- Location: SVO->ORD->SFO
Re: Что же происходит на рынке IT-труда в США?
Разница по скорости чтения с Mongo в наших тестах достигала одного порядка. Вверху была ссылка похожих тестов. Цифры одинаковые.Интеррапт wrote:А разве кто-то говорит, что Кассандра тормозит на чтении?crypto5 wrote:Это все бородатые урбан мифы про то что кассандра тормозит на чтении и у нее неправильная консистенци.
-
- Уже с Приветом
- Posts: 17281
- Joined: 07 Sep 2011 10:05
- Location: Seattle, WA
Re: Что же происходит на рынке IT-труда в США?
Вот довольно свежие бенчмарки.dotcom wrote:Разница по скорости чтения с Mongo в наших тестах достигала одного порядка. Вверху была ссылка похожих тестов. Цифры одинаковые.Интеррапт wrote:А разве кто-то говорит, что Кассандра тормозит на чтении?crypto5 wrote:Это все бородатые урбан мифы про то что кассандра тормозит на чтении и у нее неправильная консистенци.
http://www.datastax.com/wp-content/uplo ... abases.pdf
-
- Уже с Приветом
- Posts: 4637
- Joined: 24 Oct 2009 01:38
- Location: Chicago ;-) -> SFBA!
Re: Что же происходит на рынке IT-труда в США?
А как вы определили что "обычно"?Интеррапт wrote:Ну да. Кассандру (из NoSQL решений) обычно выбирают по критериям скорости записи, а скорость чтения - уже вторичней.crypto5 wrote:Ок, говорит что она супербыстрая на запись а скорость чтения не так уж и важна.Интеррапт wrote:А разве кто-то говорит, что Кассандра тормозит на чтении?crypto5 wrote:Это все бородатые урбан мифы про то что кассандра тормозит на чтении и у нее неправильная консистенци.
In vino Veritas!
-
- Уже с Приветом
- Posts: 17281
- Joined: 07 Sep 2011 10:05
- Location: Seattle, WA
Re: Что же происходит на рынке IT-труда в США?
Вот так вот взял и определил. Учитывая, что обычно слышу от людей (или читаю в блогах), что кассандра была выбрана среди других решений в освноном из-за high availability и write scalability.crypto5 wrote:А как вы определили что "обычно"?
-
- Уже с Приветом
- Posts: 9035
- Joined: 25 Oct 2011 19:02
- Location: SVO->ORD->SFO
Re: Что же происходит на рынке IT-труда в США?
Ну да, только компания продает консалтинг вокруг Cassandra. Удивительно, чтобы у них benchmark'и были хуже для оной.Интеррапт wrote: Вот довольно свежие бенчмарки.
http://www.datastax.com/wp-content/uplo ... abases.pdf
-
- Уже с Приветом
- Posts: 6906
- Joined: 20 Apr 1999 09:01
- Location: Seattle
Re: Что же происходит на рынке IT-труда в США?
Если отсеивать откровенный шлак об "очередном безусловном флагмане среди мобильников" или типа того, то сайт, как новостной, очень хороший. Например там идет целая серия постов о Curiosity на Марсе, новинки в технологиях обсуждаются, технологические тренды.Мальчик-Одуванчик wrote:А там, на хабре, попадается что-нибудь стоящее? В принципе ресурс выглядит заманчиво для меня как некий аналог самиздата, но с упором в компьютерные технологии. Как правильно говорят,статью стоит написать хотя бы для того чтобы лучше самому понять тему. Но не менее важно получить профессиональные комментарии. Вот с этим как дела обстоят?
-
- Уже с Приветом
- Posts: 4637
- Joined: 24 Oct 2009 01:38
- Location: Chicago ;-) -> SFBA!
Re: Что же происходит на рынке IT-труда в США?
Вот есть бенчмарки старой версии от неконсультантов. http://www.networkworld.com/cgi-bin/mai ... 63595.htmldotcom wrote:Ну да, только компания продает консалтинг вокруг Cassandra. Удивительно, чтобы у них benchmark'и были хуже для оной.Интеррапт wrote: Вот довольно свежие бенчмарки.
http://www.datastax.com/wp-content/uplo ... abases.pdf
In vino Veritas!
-
- Уже с Приветом
- Posts: 15242
- Joined: 01 Mar 2007 05:18
- Location: VVO->ORD->DFW->SFO->DFW->PDX
Re: Что же происходит на рынке IT-труда в США?
Без всякого ехидства... а когда это нужно? Ну просто не могу представить себе такую ситуациюИнтеррапт wrote:Да, в этом как-бы и основной поинт Кассандры, когда нужно супер-быстрая запись, а скорость чтения не так уж и важна.
Мат на форуме запрещен, блдж!
-
- Уже с Приветом
- Posts: 17281
- Joined: 07 Sep 2011 10:05
- Location: Seattle, WA
Re: Что же происходит на рынке IT-труда в США?
Например, для аналитики, когда у тебя миллионы мобильных инсталляций пуляют данные с логами (тут юзер нажал на эту кнопочку, тут на эту) - ты все это собираешь в базу на сервере, а потом уже (переодически) запускает какой-нибудь MapReduce job для анализа этих данных (в моей компании счет идет на миллиарды записей).АццкоМото wrote:Без всякого ехидства... а когда это нужно? Ну просто не могу представить себе такую ситуациюИнтеррапт wrote:Да, в этом как-бы и основной поинт Кассандры, когда нужно супер-быстрая запись, а скорость чтения не так уж и важна.
Или для банков, когда ты записываешь в базу миллионы транзакций, а вот чтение этих транзакций происходит намного реже.
-
- Уже с Приветом
- Posts: 15242
- Joined: 01 Mar 2007 05:18
- Location: VVO->ORD->DFW->SFO->DFW->PDX
Re: Что же происходит на рынке IT-труда в США?
Но мне же скорость записи для аналитики вообще не важна, нет? Ну запулили данные, пролежали они до записи в очереди аж цельных 5 минут - кому от этого плохо-то? Я, может, анализ вообще послезавтра запущуИнтеррапт wrote:Например, для аналитики, когда у тебя миллионы мобильных инсталляций пуляют данные с логами (тут юзер нажал на эту кнопочку, тут на эту) - ты все это собираешь в базу на сервере, а потом уже (переодически) запускает какой-нибудь MapReduce job для анализа этих данных.
Или для банков, когда ты записываешь в базу миллионы транзакций, а вот чтение этих транзакций происходит намного реже.
Мат на форуме запрещен, блдж!
-
- Уже с Приветом
- Posts: 17281
- Joined: 07 Sep 2011 10:05
- Location: Seattle, WA
Re: Что же происходит на рынке IT-труда в США?
Как это не важна, если к тебе каждую секунду приходит огромное кол-во записей?АццкоМото wrote: Но мне же скорость записи для аналитики вообще не важна, нет? Ну запулили данные, пролежали они до записи в очереди аж цельных 5 минут - кому от этого плохо-то? Я, может, анализ вообще послезавтра запущу
-
- Уже с Приветом
- Posts: 15242
- Joined: 01 Mar 2007 05:18
- Location: VVO->ORD->DFW->SFO->DFW->PDX
Re: Что же происходит на рынке IT-труда в США?
«Обычное утро в семье Евгения Гришковца…Интеррапт wrote:Как это не важна, если к тебе каждую секунду приходит огромное кол-во записей?
— Пап, подай соль.
— Вот, возьми соль… Ну как — соль… Просто белые крупицы, которые когда на язык сыпешь, они солоноватый привкус оставляют. Или в детстве, когда мама…
Выходит мама:
— Ну, как мама, просто женщина, которая проводит с тобой большую часть времени, которая любит тебя до беспамятства…
— Да ну тебя нафиг, я лучше в школе поем!»
Ну вот как огромное и каждую секунду? Пусть у нас 100 млн пользователей. И каждый нажимает на 10 кнопок в день. (и то и другое - ооооочень дофига). 1 ярд нажатий. Пусть у нас есть всего жалких 10 серверов и каждый репорт занимает сто байт. 10 гигов оперативки нужно на каждый сервер чтобы закэшировать ДЕНЬ работы при вообще не записывающей ничего дазе банных
Мат на форуме запрещен, блдж!
-
- Уже с Приветом
- Posts: 4637
- Joined: 24 Oct 2009 01:38
- Location: Chicago ;-) -> SFBA!
Re: Что же происходит на рынке IT-труда в США?
Я кассандру юзал для всякого machine learning-a, например есть набор текстов, скажем википедия, нужно вытащить из нее слова наиболее часто встречающиеся в одном документе и скорее всего как то связанные по смыслу, для этого для каждого документа нужно сделать все возможные пары слов(или их подмножество) и заинкрементить каунтер в БД для каждой пары, получается пару миллионов апдейтов на документ.АццкоМото wrote:«Обычное утро в семье Евгения Гришковца…Интеррапт wrote:Как это не важна, если к тебе каждую секунду приходит огромное кол-во записей?
— Пап, подай соль.
— Вот, возьми соль… Ну как — соль… Просто белые крупицы, которые когда на язык сыпешь, они солоноватый привкус оставляют. Или в детстве, когда мама…
Выходит мама:
— Ну, как мама, просто женщина, которая проводит с тобой большую часть времени, которая любит тебя до беспамятства…
— Да ну тебя нафиг, я лучше в школе поем!»
Ну вот как огромное и каждую секунду? Пусть у нас 100 млн пользователей. И каждый нажимает на 10 кнопок в день. (и то и другое - ооооочень дофига). 1 ярд нажатий. Пусть у нас есть всего жалких 10 серверов и каждый репорт занимает сто байт. 10 гигов оперативки нужно на каждый сервер чтобы закэшировать ДЕНЬ работы при вообще не записывающей ничего дазе банных
In vino Veritas!
-
- Уже с Приветом
- Posts: 15242
- Joined: 01 Mar 2007 05:18
- Location: VVO->ORD->DFW->SFO->DFW->PDX
Re: Что же происходит на рынке IT-труда в США?
Ммм... и почему скорость записи была важна? Ну и пусть себе пишутся апдейты три часа. Солдат спит, машин лёрнинг идет. Красота.crypto5 wrote:Я кассандру юзал для всякого machine learning-a, например есть набор текстов, скажем википедия, нужно вытащить из нее слова наиболее часто встречающиеся в одном документе и скорее всего как то связанные по смыслу, для этого для каждого документа нужно сделать все возможные пары слов(или их подмножество) и заинкрементить каунтер в БД для каждой пары, получается пару миллионов апдейтов на документ.
Мат на форуме запрещен, блдж!
-
- Уже с Приветом
- Posts: 4637
- Joined: 24 Oct 2009 01:38
- Location: Chicago ;-) -> SFBA!
Re: Что же происходит на рынке IT-труда в США?
Я например обрабатывал только 10% пар, и у меня процесс занимал неделю, т.е. если уменьшить throughput в 3 раза, то процесс займет 3 недели.АццкоМото wrote:Ммм... и почему скорость записи была важна? Ну и пусть себе пишутся апдейты три часа. Солдат спит, машин лёрнинг идет. Красота.crypto5 wrote:Я кассандру юзал для всякого machine learning-a, например есть набор текстов, скажем википедия, нужно вытащить из нее слова наиболее часто встречающиеся в одном документе и скорее всего как то связанные по смыслу, для этого для каждого документа нужно сделать все возможные пары слов(или их подмножество) и заинкрементить каунтер в БД для каждой пары, получается пару миллионов апдейтов на документ.
А еще мне очень хотелось бы заиметь кластер побольше и обрабатывать все пары.
Таких задач много например в поиске, таргетировании рекламы и некоторых других областях.
In vino Veritas!
-
- Уже с Приветом
- Posts: 15242
- Joined: 01 Mar 2007 05:18
- Location: VVO->ORD->DFW->SFO->DFW->PDX
Re: Что же происходит на рынке IT-труда в США?
Ок, спасибо. Более-менее понятно, что смысл в этом есть. Хотя детали не вполне ясны, ну да и доверимсяcrypto5 wrote:Я например обрабатывал только 10% пар, и у меня процесс занимал неделю, т.е. если уменьшить throughput в 3 раза, то процесс займет 3 недели.
А еще мне очень хотелось бы заиметь кластер побольше и обрабатывать все пары.
Таких задач много например в поиске, таргетировании рекламы и некоторых других областях.
Мат на форуме запрещен, блдж!
-
- Уже с Приветом
- Posts: 17281
- Joined: 07 Sep 2011 10:05
- Location: Seattle, WA
Re: Что же происходит на рынке IT-труда в США?
Да и никак это не будет по 10 гиг, а гораздо больше (кеш все-таки это не просто какие-то данные, а еще и сопутствующие метаданные для поддержания работы кеша).АццкоМото wrote: Ну вот как огромное и каждую секунду? Пусть у нас 100 млн пользователей. И каждый нажимает на 10 кнопок в день. (и то и другое - ооооочень дофига). 1 ярд нажатий. Пусть у нас есть всего жалких 10 серверов и каждый репорт занимает сто байт. 10 гигов оперативки нужно на каждый сервер чтобы закэшировать ДЕНЬ работы при вообще не записывающей ничего дазе банных
И то и другое - нифига не дофига ("Пусть у нас 100 млн пользователей. И каждый нажимает на 10 кнопок в день.") Возьмем Angry Birds (и это настоящий пример). Там никак не будет 10 нажатий в день, а очень даже больше, особенно в "час пик", когда выйдет новая версия. Тут тебе и энвайронмент зарепортить нужно и перескоки между уровнями и нажатиями кнопок на меню да и вообще много чего. А еще при этом на этих же серверах обрабатываем эвенты от парочки виджетов, предустановленных на большинстве T-Mobile телефонов. И еще с десяток клиентов/приложений с активной userbase. А что делать будем, если сервер вдруг грохнется - терять все эти закешированные десятки гигабайт данных? Ладно еще если это события аналитики, это будет очень неприятно, но несмертельно (хотя после нескольких потерь данных - клиенты начнут разбегаться). А если это финансовые транзакции? Да и не важно - кешируешь ты или нет, в какой-то момент все-равно из кешей нужно начинать скидывать в базу и желательно делать это быстрее, чем заполняется кеш.
-
- Уже с Приветом
- Posts: 15242
- Joined: 01 Mar 2007 05:18
- Location: VVO->ORD->DFW->SFO->DFW->PDX
Re: Что же происходит на рынке IT-труда в США?
Да ну. Какие там метаданные? Ойпишнег, с которого пришли данные (4 байта), да тамстемп (8 байт). Все остальное может лежать до обработки в том виде, в котором пришло.Интеррапт wrote: Да и никак это не будет по 10 гиг, а гораздо больше (кеш все-таки это не просто какие-то данные, а еще и сопутствующие метаданные для поддержания работы кеша).
Ну давай возьмем. Плей говорит - от 10 до 50 миллионов инсталляций для Star Wars. А там посчитан и я - который скачал, посмотрел, сказал "фигня" и снес нафиг. Уверен, я не уникум.Интеррапт wrote:И то и другое - нифига не дофига ("Пусть у нас 100 млн пользователей. И каждый нажимает на 10 кнопок в день.") Возьмем Angry Birds (и это настоящий пример).
ну это все на девайсе надо аггрегировать, а не тупо постить на сервер каждый пук пользователя. и упаковывать нормально, а не выдавать высеры типа {"event":"button_pressed", "which_button":"this big red button which is next to proceed to next level button"}Интеррапт wrote:Там никак не будет 10 нажатий в день, а очень даже больше, особенно в "час пик", когда выйдет новая версия. Тут тебе и энвайронмент зарепортить нужно и перескоки между уровнями и нажатиями кнопок на меню да и вообще много чего.
Ну блин! А если на этих серверах мы еще и считаем число Пи с рекордной точностью и ищем внеземной разум?Интеррапт wrote:А еще при этом на этих же серверах обрабатываем эвенты от парочки виджетов, предустановленных на большинстве T-Mobile телефонов. И еще с десяток клиентов/приложений с активной userbase.
Ой, велика ценность. И так от Rovio "клиенты" (лоботрясы на самом-то деле) разбегаются, просто потому что нельзя птичками-свинками кормить безнаказанно общественность 15 лет. Потеря статистики по нажатым кнопочкам аж за целый день аж на одном из нескольких серверов не повлияет ни на что и вообще никакИнтеррапт wrote:А что делать будем, если сервер вдруг грохнется - терять все эти закешированные десятки гигабайт данных? Ладно еще если это события аналитики, это будет очень неприятно, но несмертельно (хотя после нескольких потерь данных - клиенты начнут разбегаться).
Мат на форуме запрещен, блдж!
-
- Уже с Приветом
- Posts: 17281
- Joined: 07 Sep 2011 10:05
- Location: Seattle, WA
Re: Что же происходит на рынке IT-труда в США?
Ладно, убедил, не нужны базы данных, все нужно в кешах хранить. А мы то идиоты мучаемся.
А какие возражения по финансовым транзакциям буду - тоже ерунда?
Никак, кроме того, что клиенты могут выкатывать претензии или просто уходить к конкурентам.Потеря статистики по нажатым кнопочкам аж за целый день аж на одном из нескольких серверов не повлияет ни на что и вообще никак
А какие возражения по финансовым транзакциям буду - тоже ерунда?
А это здесь при чем? Это одна и та же задача и данные приходят одного и того же мобильного SDK. Просто клиенты разные.А если на этих серверах мы еще и считаем число Пи с рекордной точностью и ищем внеземной разум?
клиенты иной раз хотят schemaless данные.ну это все на девайсе надо аггрегировать, а не тупо постить на сервер каждый пук пользователя. и упаковывать нормально, а не выдавать высеры типа
{"event":"button_pressed", "which_button":"this big red button which is next to proceed to next level button"}
-
- Уже с Приветом
- Posts: 17281
- Joined: 07 Sep 2011 10:05
- Location: Seattle, WA
Re: Что же происходит на рынке IT-труда в США?
https://play.google.com/store/apps/deta ... irds&hl=enАццкоМото wrote:Ну давай возьмем. Плей говорит - от 10 до 50 миллионов инсталляций для Star Wars. А там посчитан и я - который скачал, посмотрел, сказал "фигня" и снес нафиг. Уверен, я не уникум.Интеррапт wrote:И то и другое - нифига не дофига ("Пусть у нас 100 млн пользователей. И каждый нажимает на 10 кнопок в день.") Возьмем Angry Birds (и это настоящий пример).
От 100 до 500 млн (а там еще есть разные версии).
Это не считая iOS девайсов.
Но не в этом суть.