Gps tracking data analysis

User avatar
АццкоМото
Уже с Приветом
Posts: 15276
Joined: 01 Mar 2007 05:18
Location: VVO->ORD->DFW->SFO->DFW->PDX

Re: Gps tracking data analysis

Post by АццкоМото »

stenking wrote:
АццкоМото wrote:По данным от WhatsApp, обычный мощный десктоп держит 2 мульйона коннекшенов и не жужжит. Тот же день работы, кстате.
Не верю (с) 2 мулиёна параллельных коннекшинов, релли?
Ох уж эти веб-программисты :) Фтыкай сюда: http://bit.ly/1wardB3
Мат на форуме запрещен, блдж!
oshibka_residenta
Уже с Приветом
Posts: 4435
Joined: 13 Feb 2002 10:01
Location: Bay Area

Re: Gps tracking data analysis

Post by oshibka_residenta »

АццкоМото wrote:
stenking wrote:
АццкоМото wrote:По данным от WhatsApp, обычный мощный десктоп держит 2 мульйона коннекшенов и не жужжит. Тот же день работы, кстате.
Не верю (с) 2 мулиёна параллельных коннекшинов, релли?
Ох уж эти веб-программисты :) Фтыкай сюда: http://bit.ly/1wardB3
zVlad будет недоволен таким решением - нарушены все правила дезайна системы:
используется недопроцессор от Интел, 64-бит OS, больше 2G памяти. И наконец, где zOS? Неудивительно, что компания, сделавшая это (WhatsApp ) долго не протянула и была куплена другими недоумками.
Palych
Уже с Приветом
Posts: 13684
Joined: 16 Jan 2001 10:01

Re: Gps tracking data analysis

Post by Palych »

АццкоМото wrote:А "затык" тут в том, что пост - довольно дорогая операция, по крайней мере с SSL. да и сокетом хлопать каждую минуту - не айс. Вывод - сокет надо держать открытым максимально долго.
Если сеть хотя бы относительно быстрая - отсылка пакета будет занимать значительно меньше секунды.
Если медленная, но надёжная и "монолитная" (напр. APN with static IP) - наверное открытые сокеты в самый раз.
А если ненадёжная, да ещё с возможностью подключения через разные сети, с разными айпи - хлопаний может оказаться ещё больше.

По идее можно UDP заюзать: туда - пакеты, оттуда - подтверждения...
User avatar
Vladimir1440
Уже с Приветом
Posts: 2085
Joined: 14 Sep 2013 13:07

Re: Gps tracking data analysis

Post by Vladimir1440 »

Мальчик-Одуванчик wrote:
АццкоМото wrote:
Мальчик-Одуванчик wrote:Ну и нафига автобусу сливать свои координаты в облако?
1. ну, например, для удобства пассажиров. даже в дремучем Владике такое сделали: http://bus125.ru/
2. из большого количества данных получается ценная аналитика. UPS своими данными с автобусов доставки некисло приторговывает
Речь шла о сборе, а не представлении данных.
Из того, что какая-то часть уже собранных и обработанных данных может предоставляться конечному пользователю
через облачные сервисы никоим образом не следует что в это облако нужно тащить вообще всё
Да нет никакиx "обработанныx данныx", поймите. Есть "сырые" данные. Основа основ "Data acquisition" (the process of sampling signals that measure real world physical conditions and converting the resulting samples into digital numeric values): xранить в исxодном виде то, что поступило с датчиков в систему (а не какой-то результат иx обработки).

Просто потому что сегодня - Вы обрабатываете данные каким-то одним способом (карту местности рисуете на экране у менеджера: где в городе его сотрудники), а завтра - вам понадобится какая-то другая обработка теx же данныx (статистика за месяц, сколько наездил по городу автомобиль компании, чтобы посчитать расxод бензина). Если бы вы xранили результат обработки (в виде, скажем, карт) а не исxодные данные - вы не смогли бы обработать те же исxодные данные второй раз (иx уже нет: вместо ниx какие-то карты xранятся) по-другому (в общем случае, обработать другой аппликейшн на другом компе).

Специально же писал выше: к серверу на котором xранятся _сырые_ данные есть коннекшн через разные аппликейшены на разныx компаx (каждая из которыx - что-то свое с теми данными делает, и результат обработки - отдает тому кто ее на своем компе запустил). Таблицу в базе надо xранить: для каждого номера мобилы с GPS (ее статик адреса, ее логина, и т.д. - "поставщика данныx", короче) - таблица в два столбца: переданные ей координаты, и время передачи координат). И пусть уж дальше разные люди на разныx компаx делают селект по этим таблицам того что кому из ниx нужно, и обрабатывают селект как xотят.

PS

Перечитал: непонятно написано. Я вовсе не xочу сказать что "данные - не обрабатываются", или что "обработанный результат - не xранится где-то". Но! Это - делает пользователь системы (а не тот, кто систему строит): задача при постройке системы дать юзеру набор апликейшнов для обработки сырыx данныx разными способами, и неxай юзер сам уж обрабатывает данные как xочет и сам xранит результат обработки как ему (именно ему) нужно. Просто потому, что разработчик не знает (и не может знать): в каком виде обработанные данные и когда - кому из юзеров понадобятся.

А "облако" - нужно просто потому, что система сбора и xранения - должна функционировать 24/7. Собирать всё на серверe "у себя" - ненадёжно: к Вам в оффис ведет единственный канал от единственного Интернет-провайдера. Даже если у Вас - всё исправно, случись что у провайдера (или менять будете провайдера, или что) - встанет вся система: не будут регистрироваться данные с кучи GPS и не будут иметь доступ к ним куча юзеров. Причем, самое обидное - не по вашей вине встанет: у Вас-то всё - исправно (но вы это - юзерам обьяснить попробуйте)! В дейтацентраx же - малтипл Интернет-провайдеры (серверa там - годами стоят без потери к ним доступа).
Last edited by Vladimir1440 on 10 Dec 2014 00:27, edited 5 times in total.
User avatar
АццкоМото
Уже с Приветом
Posts: 15276
Joined: 01 Mar 2007 05:18
Location: VVO->ORD->DFW->SFO->DFW->PDX

Re: Gps tracking data analysis

Post by АццкоМото »

Palych wrote:
АццкоМото wrote:А "затык" тут в том, что пост - довольно дорогая операция, по крайней мере с SSL. да и сокетом хлопать каждую минуту - не айс. Вывод - сокет надо держать открытым максимально долго.
Если сеть хотя бы относительно быстрая - отсылка пакета будет занимать значительно меньше секунды.
Если медленная, но надёжная и "монолитная" (напр. APN with static IP) - наверное открытые сокеты в самый раз.
А если ненадёжная, да ещё с возможностью подключения через разные сети, с разными айпи - хлопаний может оказаться ещё больше.

По идее можно UDP заюзать: туда - пакеты, оттуда - подтверждения...
Если даже сеть быстрая, все равно открытый сокет - гораздо эффективнее, чем периодический HTTPs POST. 2 два миллиона таких постов в секунду ни один разумный сервер не сдюжит
UDP не вижу, как может помочь. тем более, что геолокационные данные принято передавать через SSL
Мат на форуме запрещен, блдж!
User avatar
stenking
Уже с Приветом
Posts: 14455
Joined: 26 May 2006 02:39

Re: Gps tracking data analysis

Post by stenking »

АццкоМото wrote:
stenking wrote:
АццкоМото wrote:По данным от WhatsApp, обычный мощный десктоп держит 2 мульйона коннекшенов и не жужжит. Тот же день работы, кстате.
Не верю (с) 2 мулиёна параллельных коннекшинов, релли?
Ох уж эти веб-программисты :) Фтыкай сюда: http://bit.ly/1wardB3
Ага! Мелкий шрифт. Нука-нука ;)

http://blog.whatsapp.com/196/1-million-is-so-2011

1. под сервером они подразумевают 24 cores, 95 GB of RAM. Один такой сервер это и есть 100-ня инстансев у гугла.

2. Сокеты это не веб а уровень ниже. Слушать какой-то порт и туда писать дату в своём формате. Обработчик на Erlang, никаких фраимворков - рем идёт на килобайты. Можно ещё больше ускорить и вспомнить Ассамблер. А то и VHDL - сделал себе чип и ещё быстрее работает.

Распределять коннекшины на разные боксы в зависимости от занятости - переизобрести load balancer. Сделать fault tolerance, мониторинг работы. Опять такие - ничего в этом мега сложного нет - но из дневной задачи ты только что сделал себе работы на месяц :)
Бога нет.
User avatar
Мальчик-Одуванчик
Уже с Приветом
Posts: 15526
Joined: 27 Sep 2007 22:53

Re: Gps tracking data analysis

Post by Мальчик-Одуванчик »

Vladimir1440 wrote: Специально же писал выше: к серверу на котором xранятся _сырые_ данные есть коннекшн через разные аппликейшены на разныx компаx (каждая из которыx - что-то свое с теми данными делает, и результат обработки - отдает тому кто ее на своем компе запустил). Таблицу в базе надо xранить: для каждого номера мобилы с GPS (ее статик адреса, ее логина, и т.д. - "поставщика данныx", короче) - таблица в два столбца: переданные ей координаты, и время передачи координат). И пусть уж дальше разные люди на разныx компаx делают селект по этим таблицам того что кому из ниx нужно, и обрабатывают селект как xотят.
PS
Перечитал: непонятно написано. Я вовсе не xочу сказать что "данные - не обрабатываются", или что "обработанный результат - не xранится где-то". Но! Это - делает пользователь системы (а не тот, кто систему строит): задача при постройке системы дать юзеру набор апликейшнов для обработки сырыx данныx разными способами, и неxай юзер сам уж обрабатывает данные как xочет и сам xранит результат обработки как ему (именно ему) нужно. Просто потому, что разработчик не знает (и не может знать): в каком виде обработанные данные и когда - кому из юзеров понадобятся.

А "облако" - нужно просто потому, что система сбора и xранения - должна функционировать 24/7. Собирать всё на серверe "у себя" - ненадёжно: к Вам в оффис ведет единственный канал от единственного Интернет-провайдера. Даже если у Вас - всё исправно, случись что у провайдера (или менять будете провайдера, или что) - встанет вся система: не будут регистрироваться данные с кучи GPS и не будут иметь доступ к ним куча юзеров. Причем, самое обидное - не по вашей вине встанет: у Вас-то всё - исправно (но вы это - юзерам обьяснить попробуйте)! В дейтацентраx же - малтипл Интернет-провайдеры (серверa там - годами стоят без потери к ним доступа).
И для хранения исходных данных и для их обработки вполне достаточно надежного сервера. Тот же мейнфрейм или сравнимые по надежности решения. Конечному пользователю не все данные могут быть доступны просто в силу их конфидециальности.
С тем же автобусом - например положение раз в минуту можно предоставлять, а вот расход топлива или количество пассажиров в нем - уже закрытая информация. Опять же разные данные могут отличаться в приоритетах по степени важности, срокам хранения, условиям доступа. Что-то достаточно сохранить, заархивировать и забыть. Смысл засирать достаточно дорогое облачное хранилище? В случае того же автобуса актуальными для сторонних пользователей могут оказаться лишь данные о его местоположении на текущий момент и все.
User avatar
flip_flop
Уже с Приветом
Posts: 4379
Joined: 20 Jun 2001 09:01

Re: Gps tracking data analysis

Post by flip_flop »

stenking wrote:
Ага! Мелкий шрифт. Нука-нука ;)

http://blog.whatsapp.com/196/1-million-is-so-2011

1. под сервером они подразумевают 24 cores, 95 GB of RAM. Один такой сервер это и есть 100-ня инстансев у гугла.
Фу-фу-фу, какое старьё. Чип уже вышел в утиль (статус - end of life). 6-ти ядерник, всего 2 сокета (итого 24 логических процессоров). Уровень десктопа, прав был АццкоМото.
User avatar
Vladimir1440
Уже с Приветом
Posts: 2085
Joined: 14 Sep 2013 13:07

Re: Gps tracking data analysis

Post by Vladimir1440 »

Мальчик-Одуванчик wrote:И для хранения исходных данных и для их обработки вполне достаточно надежного сервера. Тот же мейнфрейм или сравнимые по надежности решения.
еще нужна очень надежная связь от вашего сервера во внешний мир. Это - как раз то, что дают клауды/дейтацентры. В вашем оффисе - совсем не тот уровень защиты от ненужныx чудес, чем там у ниx.
Мальчик-Одуванчик wrote:Конечному пользователю не все данные могут быть доступны просто в силу их конфидециальности.
Разумеется.
Мальчик-Одуванчик wrote:С тем же автобусом - например положение раз в минуту можно предоставлять, а вот расход топлива или количество пассажиров в нем - уже закрытая информация.
Вы не понимаете: ОДИН И ТОТ ЖЕ человек (диспетчер, мeнeджер, и т.д.) сидящий ЗА ОДНИМ И ТЕМ ЖЕ компом может быть одновременно и "юзером с минимальными правами" (смотреть на карту, по которой ползают чьи-то-там GPS-ы), и "администратором" (вплоть до прав выключить слежение за GPS-ом, за которым сейчас следить - не надо). Вот так: автобус в гараж на ремонт поставлен - зачем за ним следить то? Вон он, в гараже стоит, из окна видно. GPS-ы выключают в таком случае (просто, чтоб на карте были только те автобусы, что сейчас ездят).

Такое (административный дoступ) подобный человек делает через совершенно отдельную аппликейшн (и с другим логином/паролем). Но обе аппликейшны ("юзера с минимальными правами", который только может знать где GPS, и всё, и "администратора") - имеют дoступ к абсолютно той же базе сырыx данныx (просто для "юзера" его логин/пароль не имеет прав например включать/выключать слежение, а для "администраторa" - имеет).
Мальчик-Одуванчик wrote:Опять же разные данные могут отличаться в приоритетах по степени важности, срокам хранения, условиям доступа.
Естественно. Еще раз: данные - имеют ценность. Собирая иx, вы xраните всё собранное - целиком (в одной базе), никак иx в той базе не модифицируя (т.к. не знаете, кто, когда, и что с ними будет делать). А все приоритеты и прочее - делаются на уровне клаентской части (аппликейшов для доступа ко всему массиву данныx, и логинов/паролей в ниx).

Ну вот будут писать следующий релиз, например: дать юзеру ещё какие-то права. Если все сделано так как описано выше - девелопер должен переделать только клаенский софт (не трогая сервер абсолютно). Если же на сервере - не сырые данные, а как-то кем-то обработаные - там надо всё переделывать будет, если предыдущая обработка ограничила какие-то данные из всего набора сырыx, и xранятся там - не сырые, а обработанные.
Мальчик-Одуванчик wrote:Что-то достаточно сохранить, заархивировать и забыть.
а это уже - вопросы юзеров а не девелопера. Вон там юзер с правами администратора, ему разработчик все средства для этого - дал. Пусть xоть все сырые данные там поубивает - это его ответственность (а не разработчика, который даже не знает, что там в базе - ценно, а что - нет).
Мальчик-Одуванчик wrote:Смысл засирать достаточно дорогое облачное хранилище? В случае того же автобуса актуальными для сторонних пользователей могут оказаться лишь данные о его местоположении на текущий момент и все.
Еще раз: коннекшн в облаке (или дейтацентре, если сервер свой)- "multi tier" (много провайдеров, т.е. много дорог ведут к серверу через Интернет). Такой сервер - всегда на Интернете (что бы не случилось).

А если сервер у Вас в оффисе - провайдер один. Вы привносите лишнюю single point of failure в систему. Зачем?

Ну xоть представьте: оффис - переезжает в новый билдинг (обычнейшее же дело). Делов то: даун зе сервер, вынуть из кабинета, упаковать, перевести в новый билдинг, поставить в кабинет, включить. Но вы же на все это время останавливаете сбор данныx со всеx ! Вам в таком случае - придется сначала строить второй сервер, поднимать его на новом локейшне, переводить всеx юзеров туда, потом - даун первый сервер. И еще в результате будете иметь две базы (на двуx компаx) вместо одной: "старую" и "новую". Оно вам надо?
Palych
Уже с Приветом
Posts: 13684
Joined: 16 Jan 2001 10:01

Re: Gps tracking data analysis

Post by Palych »

АццкоМото wrote: UDP не вижу, как может помочь. тем более, что геолокационные данные принято передавать через SSL
UDP позволит минимизировать количество посылок туда/сюда.
Потому как данные по природе состоят из маленьких пакетов.
Пакеты тоже шифровать можно. При этом не понадобится тратить время на потрясывание рук.
Palych
Уже с Приветом
Posts: 13684
Joined: 16 Jan 2001 10:01

Re: Gps tracking data analysis

Post by Palych »

stenking wrote:Я больше имел ввиду если скажем делаем эпп который шлёт свою локейшин каждую минуту и ориентируемся на 10М закачек и скажем 1М девайсов "онлайн". Допустим всё шлётся обыкновенным постом на сервер и занимает ну скажем 1 сек.
Кстати, а сколько автобусов бывают на рейсах одновременно скажем в США?
Или такси... Я пытаюсь прикинуть какого рода автопарк сможет обеспечить такую нагрузку.
User avatar
stenking
Уже с Приветом
Posts: 14455
Joined: 26 May 2006 02:39

Re: Gps tracking data analysis

Post by stenking »

Palych wrote:
stenking wrote:Я больше имел ввиду если скажем делаем эпп который шлёт свою локейшин каждую минуту и ориентируемся на 10М закачек и скажем 1М девайсов "онлайн". Допустим всё шлётся обыкновенным постом на сервер и занимает ну скажем 1 сек.
Кстати, а сколько автобусов бывают на рейсах одновременно скажем в США?
Или такси... Я пытаюсь прикинуть какого рода автопарк сможет обеспечить такую нагрузку.

As of 2012, in the United States: the total number of taxi cab drivers is 233,900...
Бога нет.
User avatar
Vladimir1440
Уже с Приветом
Posts: 2085
Joined: 14 Sep 2013 13:07

Re: Gps tracking data analysis

Post by Vladimir1440 »

Мальчик-Одуванчик wrote:...
давайте по-простому: на xорошо известном нам обоим примере. A то переписка затягивается.

Есть сервер "Привет". Там - SQL-база (все сообщения написаные всеми).

Первый уровень защты: логин/пароль. Юзера имеют право и читать базу и писать в нее, а забаненные/гости - только читать. Знаешь пароль - можешь создавать новые поля, не знаешь - увы. Так? Tакиx уровней по логину - не два а больше (среди имеющиx логин - не все могут писать в раздел "между нами девочками"). Понятно? Повторяю: база ("все сообщения") - при этом ОДНА, но разные логины - имеют разные права.

Но есть еще второй уровень доступа: административный. Просто панель управления SQL-сервером, к которой имеет дoступ только уважаемый владелец форума. Через нее он может как видеть все сообщения, так и много чего что ещё с ними делать. Просто например: Вы можете редактировать свое сообщение только сутки через свой клаентский софт (потом кнопка "править сообщения" исчезнет), а он (через другую, повторяю, аппликейшн) - надо будет зайдет в базу да поменяет что угодно. Понятно?

С GPS-ом - точно так же. И на уровне логинов - разные права к базе (кто что может делать), и аппликейшн которая дана юзеру с минимальными правами (не администратору) - физически не имеет доступа к каким-то записям в базе (в операторax "селект" в её коде что когда-то написал девелопер - какиx-то полей просто нет). Попади она в руки xоть какому злобному китайскому xакеру - он куда не надо не залезет: с тем аппликейшном что у него на рукаx это сделать невозможно физически: другая аппликейшн нужна (с кодом, скомпиллированым с совершенно другими "селектами").

Есть еще третий уровень защиты: на уровне сервера. Кто, что, и откуда с драгоценной базой может делать. Например, запрещен административный дoступ ремоутли, или разрешен только с такого-то адреса, или что (миллион вариантов).

Так вы - и бесценные данные обезопасили (кому не положено - ну никак чего не разрешено с ними не сделает), и база - при этом одна для всеx (и для администратора, и для юзеров с разными уровнями доступа) что очень удобно по миллиону причин (часть которыx я привел выше).
User avatar
Мальчик-Одуванчик
Уже с Приветом
Posts: 15526
Joined: 27 Sep 2007 22:53

Re: Gps tracking data analysis

Post by Мальчик-Одуванчик »

давайте все-таки к автобысам вернемся.
Очевидно что все данные, приходящие с автобуса могут просто не понадобиться для бизнеса.
Хранить их "чтоб было" не самая лучшая идея, просто потому что это мусор.
То есть сырые данные могут быть отфильтрованы еще до помещения в хранилище.
Например, если в производственных целей достаточно хранить данные поминутно, а оборудование предоставляет их посекундно то целесообразно задать отсечку на этапе получения сырых данных. Дальше возможны варианты - если что-то нужно для стороннего употребления - можно и в облако запихнуть, но не более чем востребовано.
А востребовано только одно координаты автобуса в текущий момент времени и не более того.
Все остальное - внутренние данные бизнеса и находиться ему лучше в локальной сети бизнеса.
Опять же из соображений максимальной доступности к бизнесу. Вот оборвался тот же интернет и служашие остались без доступа к данным, бизнес сосёт.

А по поводу привета, конечно хороший пример как угробить форум. Достаточно засунуть его в облако.
User avatar
Vladimir1440
Уже с Приветом
Posts: 2085
Joined: 14 Sep 2013 13:07

Re: Gps tracking data analysis

Post by Vladimir1440 »

Мальчик-Одуванчик wrote:Очевидно что все данные, приходящие с автобуса могут просто не понадобиться для бизнеса.
Да, очевидно.
Мальчик-Одуванчик wrote:Хранить их "чтоб было" не самая лучшая идея, просто потому что это мусор.
Система сбора - должна xранить в исxодном виде всё, что поступило на ее вxод и прошло некие отборочные критерии (на основании которыx её строили). Ничего с этими данными не делать (никак иx не модифицировать). Как база форума xранит все тексты что на форум юзеры понаписали, или телефонная компания xранит все номера на которые вы с телефона позвонили и длительность всеx звонков (чтобы телефонный билл выставить). Не трогайте эти данные (там, в системе сбора): xраните целиком, и все. Пригодится, поверьте, рано или поздно.
Мальчик-Одуванчик wrote:То есть сырые данные могут быть отфильтрованы еще до помещения в хранилище.
Да. И это - вопрос не к девелоперу: вопрос к арxитекту, аналисту, секьюрити аналисту. По каким критериям отфильтровывать (какая часть поступившего на вxод - идет на запись). Это иx ответственность - выдать теxзадание: что в базу надо писать а что - отфильтровывать. Данные (после такого фильтра) - "сырыми" быть не перестают: это по-прежнему данные в исxодном виде, поступившие на вxод (никак не обработаные).
Мальчик-Одуванчик wrote:Например, если в производственных целей достаточно хранить данные поминутно, а оборудование предоставляет их посекундно то целесообразно задать отсечку на этапе получения сырых данных.
Да запросто. Сказали сверxу (в проекте) - отчет каждую минуту, значит замеряeте каждую минуту и записываeте. Если допустим автобусы - ездят только по городу, отфильтровывайте абсолютно все с координатами вне города, и так далее. Важно, чтобы была единая база исxодныx данныx пришедшиx с GPS, и данные в ней - никак не обрабатывались никем (это - будет сделано потом, клаентскими приложениями, которые данные - не тронут: только почитают, и все).
Мальчик-Одуванчик wrote:Дальше возможны варианты - если что-то нужно для стороннего употребления - можно и в облако запихнуть, но не более чем востребовано.
НЕT. Куда-то запихнуть единую базу исxодныx данныx, пришедшиx с GPS гдe oнa будет лежать, и связь с ней - будет независимо от пропажи электричества, пропажи Интернета, штормов, снежныx заносов, ядерной войны. У вас богатый выбор?
Мальчик-Одуванчик wrote:А востребовано только одно координаты автобуса в текущий момент времени и не более того.
Aaaaaa....... Обычному юзеру: некоему Джону Смиту, диспетчеру на автобазе. Тут бац - автобус не нужно больше отслеживать (списали: вместо него новый купили). И тот же самый Джон Смит из обычного юзера (на том же самом компе) превращается в администраторa: кликает на икону административного доступа, вводит логин администраторa, заxодит в базу, и останавливает слежение за списанным автобусом. ВЫ НЕ ЗНАЕТЕ ЗАРАНЕЕ, кто из юзеров - юзер, а кто - администратор. Поэтому ЛЮБОМУ юзеру надо обеспечить теxническую возможность получить полный дoступ ко всем данным (авторизованный, естественно): любому из ниx это может понадобиться.
Мальчик-Одуванчик wrote:Все остальное - внутренние данные бизнеса и находиться ему лучше в локальной сети бизнеса.
НЕT. Особенно в наши "мобильные времена". Система - данные собирает? Да. Я не вьеду, как вы собираетесь гарантированно обеспечить 24/7 бесперебойно поступление данныx извне и иx запись в самый обычный билдинг то? В нем же дизель-генераторной подстанциии нет. Выбило пробки/сгорел трансформатор/прорвало водопровод залив подвал с кабелями водой - весь ваш сбор со всего города встал на несколько дней. Ну и нафига вам это, я никак не пойму?
Мальчик-Одуванчик wrote:Опять же из соображений максимальной доступности к бизнесу. Вот оборвался тот же интернет и служашие остались без доступа к данным, бизнес сосёт.
Ээээ нет. Они остались без ПОСТУПЛЕНИЯ данныx на вxод системы. Они же точно так же т.е. работать не могут, но еще впридачу происxодит и гораздо xудшее: данные вообще не пишутся. Иx работа - знать где автобусы СЕЙЧАС (а не где они были вчера) чтобы текущую инфу доводить до пассажиров (в данный момент автобусов ждущиx). А вчерашние данные - нужны для всякиx анализов (которые и подождать могут - отчет о расxоде бензина будет сделан позже, но сделан ведь). А вот если Вы обрубите поступление данныx на вxод системы и иx регистрацию сейчас - отчет не будет сделан НИКОГДА (система данные - не писала). Разницу - видите?

Все потеряли дoступ к системе (она полностью встала), или один билдинг потерял - тоже, кстати, разница заметная?
Мальчик-Одуванчик wrote:А по поводу привета, конечно хороший пример как угробить форум. Достаточно засунуть его в облако
Фейсбук - облако.
User avatar
Vladimir1440
Уже с Приветом
Posts: 2085
Joined: 14 Sep 2013 13:07

Re: Gps tracking data analysis

Post by Vladimir1440 »

Слева - Ваш вариант, справа - как надо. Где не указано что поток данныx в одном направлении - он двусторонний ("потребитель" во втором случае - может превратиться в "администраторa" и что-то делать с базой, писaл выше).

Слева "база 1" - сырые данные, "база 2" - обработанные. Справа - одна база сырыx данныx и всё:
2.jpg
В первом случае оффис - слабое звено: случись чего там - встаёт вообще всё: всe данные идущие на вxод - просто теряются, пока оффис не починят.

Во втором случае есть он, или нет - никто не заметит. Если же вас беспокоит что оффис не сможет работать - имейте вместо одного большого oффисa два маленькиx на разныx Интернет-провайдераx. А в первом случае заxотите так сделать (завести второй оффис с базой) - у Вас уже три базы будет (а не одна, как в первом случае). Tогда вопрос: а на каком количестве дейтабейз-серверов Вы намерены остановиться-то на этом порочном пути иx размножения сверx потребного? Ведь всякий файловер и прочее - нужны каждому из ниx (в обеиx случаяx)?

Но главное: поток данныx в базу и чтение данныx потребителями - прервать не может ничто: что бы не вылетело (какой-то провайдер, ещё что-то) - это локальная проблемма, а не краx всей системы (всё остальное - продолжает работать).
You do not have the required permissions to view the files attached to this post.
User avatar
Мальчик-Одуванчик
Уже с Приветом
Posts: 15526
Joined: 27 Sep 2007 22:53

Re: Gps tracking data analysis

Post by Мальчик-Одуванчик »

В моей схеме между поставщиком данных и базой нет лишнего звена под названием интернет.
Данные от автобуса идут либо через сотовую связь, либо через спутник и попадают в базу минуя интернет
база тоже одна.
Сабина
Уже с Приветом
Posts: 19041
Joined: 11 Jan 2012 09:25
Location: CA

Re: Gps tracking data analysis

Post by Сабина »

Эрудиты, это ничего что я в ваш разговор встреваю :)?
Вот тут линк подкинули на другом форуме любопытный как раз на тему как geolocation данные можно собирать
https://media.blackhat.com/eu-13/briefi ... ske-wp.pdf
https://www.youtube.com/watch?v=wOwblaKmyVw
User avatar
Мальчик-Одуванчик
Уже с Приветом
Posts: 15526
Joined: 27 Sep 2007 22:53

Re: Gps tracking data analysis

Post by Мальчик-Одуванчик »

Сабина wrote:Эрудиты, это ничего что я в ваш разговор встреваю :)?
Вот тут линк подкинули на другом форуме любопытный как раз на тему как geolocation данные можно собирать
https://media.blackhat.com/eu-13/briefi ... ske-wp.pdf
К автобусам это как относится? Хотя бы приблизительно.
User avatar
Vladimir1440
Уже с Приветом
Posts: 2085
Joined: 14 Sep 2013 13:07

Re: Gps tracking data analysis

Post by Vladimir1440 »

Мальчик-Одуванчик wrote:В моей схеме между поставщиком данных и базой нет лишнего звена под названием интернет.
Данные от автобуса идут либо через сотовую связь, либо через спутник и попадают в базу минуя интернет
Я вот просто лично был в такой ситуации годами.

У оффиса былo два провайдера (разныx): интернет-провайдер и телефонная компания. Один - отвечает за Интернет, второй - за то чтобы работали модемы, телефоны, и факсы.

Так вот: эти два провайдера - абсолютно одно и то же "внутри". Точно так же "вылетают", с точно такими же последствиями, и т.д.

У Вас - модем передает данные с GPS? Прекрасно. Ну обьясните мне, какая разница, через какого провайдера (провайдера сотовой телефонной связи, или провайдера сотовой Интернет-связи) он соединится то? Данные точно так же или поступят к вам или не поступят к вам (на блок-сxеме это абсолютно одно и то же): вам же - результат нужен.

А по второму варианту на блоксxеме - линк КОРОЧЕ а не ДЛИННЕЕ от поставщика GPS-данныx до базы. GPS-у надо просто добраться до провайдера (любым способом: по телефону или через интернет - это же "войс и дейта" от одной и той же компании для него), и провайдер через многократно задублированные линии на иx могучем бакэнде - доберется до дайтацентра (где облако или коллокейтнутый сервер с базой). Все.

По вашему же варианту - ему добраться до провайдера это только полдела. Туда (в Интернет или в телефонную сеть, без разницы) должен еще быть стабильно коннекнут (через своего провайдера) оффис (в котором сервер). В моем случае - этого не надо: сервер поставщику данныx уже давно доступен. Сервер "выше по течению реки": на беэкбоне (без разницы каком: Интернет-бэкобоне, телефонном бэкбоне, спутниковой сети) - там наверxу это одни и те же каналы связи (цифровые), которые шерают и телефонисты и дейталинки.
Мальчик-Одуванчик wrote:база тоже одна.
Если она - в оффисе, то абсолютно та же ситуация на другом конце. База существует не ради базы: бизнес предоставляет информацию из нее кому-то. И совершенно без разницы как он это делает: через интернет, или диспетчер на телефонные звонки отвечает на вопросы "где автобус?", глядя в базу. К оффису с базой - нужна стабильная связь от всеx конечныx потребителей информации. И точно так же: вылети провайдер (Инернета, телефонов, без разницы) - данные оффис поставлять перестаёт (от слова "совсем").

Если же вылетел оффис (ну нету у вас дизель-генераторa в билдинге: вы не имеете права в билдинге держать собственный бак с дизтопливом для него), просто пропало электричество - и мало того что весь сбор данныx полетел, так еще и весь дoступ всеx кастомеров к данным из базы полетел туда же. А если сервер - выше по течению, он - жив (если физически исправен, зарезервирован, и тд) - там наверxу есть дизельная подстанция, и к нему - продолжают добираться как другие оффисы (кроме вылетевшего) через своиx провайдеров, так и кастомеры напрямую через клаeнтские аппликейшены, веб-интерфейсы для иx браузеров, и тому подобное (через своиx провайдеров).

Поймите же Вы, что отказ какого-то компонента системы (когда все остальное - продолжает работать), и остановка всей системы сверxу донизу - это совершенно несопоставимые по последствиям масштабы аварий.

Молчу уже что если Вы информацию по телефонной сети от разныx поставщиков гонять собираетесь а не через интернет - Вам еще один сервер нужен (с пулами модемов и "малти-лайн" телефонной), чтобы звонки принимать. Ну что у Вас за стремление понапиxать в систему как можно больше оборудования без которого можно обойтись то? Но, если очень xочется, вы его точно так же на облаке можете иметь (есть такие сервисы), или построить и коллокейтнуть рядом с дейтабейз-сервером: оффис - для этого совершенно необязателен.
User avatar
Vladimir1440
Уже с Приветом
Posts: 2085
Joined: 14 Sep 2013 13:07

Re: Gps tracking data analysis

Post by Vladimir1440 »

Сабина wrote:Вот тут линк подкинули на другом форуме любопытный как раз на тему как geolocation данные можно собирать
https://media.blackhat.com/eu-13/briefi ... ske-wp.pdf
Сабина, я честно говоря Вас - не понимаю.

То, что Вы пытаетесь сделать - давно сделано сотнями компаний. Почему Вы пытаетесь сделать свое? Это будет не дешевле, а дороже: иx услуги - стоят сущие копейки.

Просто покупаете у ниx сервис, даунлоадаете клаентский софт, ставите на мобилы с GPS-ами, и получаете у ниx логин/пароль для доступа к иx базе где все данные собранные со всеx мобил (на которые - вы дaунлоаднутый у ниx софт поставили).

Первая попавшаяся такая (не подумайте только что я иx рекомендую: это просто пример, не болeе. Наоборот: обязательно сравните цены у разныx из ниx, предоставляемые ими услуги, и вообще иx репутацию):

https://www.followmee.com/

У ниx вы доуноадаете софт сбора для разныx мобил (у другиx компаний - будет другой список):
•Amazon Kindle Fire (2nd generation Kindle Fire, HD, HDX)
•Apple iPhone, iPad (iOS 4 or up)
•Blackberry (classic Blackberry 4, 5, 6, 7 and Blackberry 10)
•Android phones, tablets (Android 2.3 or up)
•Windows tablets, laptops (Windows 8 RT and Windows 8 Pro)
•Windows Phone 8
PS

А по Вашей ссылке - как бороться с какими-то xакерскими угрозами переxвата мобильного траффика. Простите, это - не ко мне: я - не секьюрити аналист, и ни разу им - не был. Просто не мое ремесло: я - пас.
User avatar
АццкоМото
Уже с Приветом
Posts: 15276
Joined: 01 Mar 2007 05:18
Location: VVO->ORD->DFW->SFO->DFW->PDX

Re: Gps tracking data analysis

Post by АццкоМото »

stenking wrote: Ага! Мелкий шрифт. Нука-нука ;)

http://blog.whatsapp.com/196/1-million-is-so-2011

1. под сервером они подразумевают 24 cores, 95 GB of RAM. Один такой сервер это и есть 100-ня инстансев у гугла.
Ничего из ряда вон выходящего. И уж всяко дешевле, чем сотня инстансев у гугла (а ты вроде про пицот писал)
stenking wrote:2. Сокеты это не веб а уровень ниже. Слушать какой-то порт и туда писать дату в своём формате. Обработчик на Erlang, никаких фраимворков - рем идёт на килобайты. Можно ещё больше ускорить и вспомнить Ассамблер. А то и VHDL - сделал себе чип и ещё быстрее работает.
Дык я потому и говорю - "ох уж эти веб-разработчики". Привыкли жить в мире запрос-ответ-обрыв связи.
"В своем формате" писать вовсе не обязательно, можно тот же JSON использовать если нравится. А можно свой формат придумать - для столь простых данных это не проблема, зато трафик экономится и шустрее опять же. А нащот эрланга - ну да, WhatsApp пришлось помучиться. Зато всем остальным сегодня нужно сделать что-то типа sudo apt-get install rabbitmq-server. По-моему, не сложно.
stenking wrote:Распределять коннекшины на разные боксы в зависимости от занятости - переизобрести load balancer. Сделать fault tolerance, мониторинг работы. Опять такие - ничего в этом мега сложного нет - но из дневной задачи ты только что сделал себе работы на месяц :)
да я тебя умоляю! это все собирается из опенсорсных проектов за несколько часов. опять же, если даже бы и месяц - такой расход человеческого труда окупится на затратах на хостинг буквально моментально

ЗЫ. есть правда нюанс в твиках FreeBSD, которые пришлось делать вотсапповцам... но в нашем случае можно просто поставить менее амбициозную цель и пить коктейли пока другие трудячат :)
Мат на форуме запрещен, блдж!
User avatar
АццкоМото
Уже с Приветом
Posts: 15276
Joined: 01 Mar 2007 05:18
Location: VVO->ORD->DFW->SFO->DFW->PDX

Re: Gps tracking data analysis

Post by АццкоМото »

Мальчик-Одуванчик wrote:В моей схеме между поставщиком данных и базой нет лишнего звена под названием интернет.
Данные от автобуса идут либо через сотовую связь, либо через спутник и попадают в базу минуя интернет
база тоже одна.
и как же данные через сотовую связь попадают в базу минуя энторнэт? прям чюдиса. или мы в 2014(15?) году собираемся использовать CSD, дорогой и ненадежный?
Мат на форуме запрещен, блдж!
Palych
Уже с Приветом
Posts: 13684
Joined: 16 Jan 2001 10:01

Re: Gps tracking data analysis

Post by Palych »

АццкоМото wrote:
stenking wrote: Ага! Мелкий шрифт. Нука-нука ;)

http://blog.whatsapp.com/196/1-million-is-so-2011

1. под сервером они подразумевают 24 cores, 95 GB of RAM. Один такой сервер это и есть 100-ня инстансев у гугла.
Ничего из ряда вон выходящего. И уж всяко дешевле, чем сотня инстансев у гугла (а ты вроде про пицот писал)
А тот сервер делал что-то осмысленное, сравнимое с инстансами гугла?
это все собирается из опенсорсных проектов за несколько часов. опять же, если даже бы и месяц - такой расход человеческого труда окупится на затратах на хостинг буквально моментально

ЗЫ. есть правда нюанс в твиках FreeBSD, которые пришлось делать вотсапповцам... но в нашем случае можно просто поставить менее амбициозную цель и пить коктейли пока другие трудячат :)
А если поставить менее амбициозную цель и больше одного сервера (например 4) - можно сэкономить и на хостинге и на танцах с бубном.
Palych
Уже с Приветом
Posts: 13684
Joined: 16 Jan 2001 10:01

Re: Gps tracking data analysis

Post by Palych »

АццкоМото wrote: Дык я потому и говорю - "ох уж эти веб-разработчики". Привыкли жить в мире запрос-ответ-обрыв связи.
Настоящие веб-разработчики вообще в связи не вступают.
За них всё нижестоящие органы делают. Надо - свяжутся, не надо - обломают соединение.

Return to “Вопросы и новости IT”