Похоже на предсказание поведения сток маркета. Лучшие умы над этим бьются, а реально работающей модели так и нет. Потому что слишком много факторов, которые невозможно учесть. От погоды до терактов. А самый успешный инвестор - Баффет - вообще с компьютером не особо дружит, тем более с биг датой.Снежная Королева wrote: Да элементарная задача, точно предсказать потребление электричества каждые 5 минут в данной нетворк, имея данные по electricity demand based on smart meters, на этом можно очень хорошо заработать. А это и есть big data problem. Каждые 5 минут smart meters на 500,000 кастомеров генерируют 200МБ даты, а умножте на 2,628,000 потому что мне за последние 5 лет надо. А если кастомеров 10 миллионов?
Я так и не понял, как это все использовать...
-
- Уже с Приветом
- Posts: 1494
- Joined: 08 Mar 2002 10:01
- Location: NJ
Re: Я так и не понял, как это все использовать...
-
- Ник закрыт за хамство.
- Posts: 357
- Joined: 16 Feb 2014 18:34
Re: Я так и не понял, как это все использовать...
Сток маркет это теоретически некорректная задача.
А агрегация возможна когда знаешь, какую информацию можно без потерь выкинуть. А тут уже и мелочи могут приносить деньги...
А агрегация возможна когда знаешь, какую информацию можно без потерь выкинуть. А тут уже и мелочи могут приносить деньги...
-
- Уже с Приветом
- Posts: 6018
- Joined: 11 Mar 2011 05:36
Re: Я так и не понял, как это все использовать...
мда - давайте-ка по существуСнежная Королева wrote:Да элементарная задача, точно предсказать потребление электричества каждые 5 минут в данной нетворк, имея данные по electricity demand based on smart meters, на этом можно очень хорошо заработать. А это и есть big data problem. Каждые 5 минут smart meters на 500,000 кастомеров генерируют 200МБ даты, а умножте на 2,628,000 потому что мне за последние 5 лет надо. А если кастомеров 10 миллионов?DropAndDrag wrote:с Big Data пока не будет блестящей идеи, как использовать каждую конкретную мусорку, никакой прибыли не получить.
Наши уже полгода никак не родят инфраструктуру. Дата есть, моделей полно, инфраструктуры это всё запустить (Hadoop, Azure, или другое что, я не специалист) - нет.
- датчики. 200 МБ / 500 тыс = 400 Б; это 200 измерений за 5 минут или почти 1 измерение за секунду. что вы на этих данных конкретного мелкого потребителя предскажите? что они меньше подтрябляют в дневные и ночные часы в рабочее дни? так это и так ясно. Поставьте ОДИН датчик на каждый нейбохуд и этого достаточно
- я не знаю кто ваши, но наши давно занимаются ахинеей в этих делах, начиная от глобального маркета электричества (грубо говоря цена - это стоимости генерящей станции и доставки), кончая разными приспособами на концах (емкостей, солнечных батарей).
в конце концов посмотрите например. вот тут https://www.smartgrid.gov/files/VVO_Report_-_Final.pdf
да можно что-то съэкономить (если бы научились делать крутые батарии, то да - это было бы круто), но предсказывать практически нечего - все и так ясно и видно, как божий день
- так же добавлю, энергоемкие компании напрямую работают с генерящими компаниями и России (еще до перестройки), и тут .
-
- Уже с Приветом
- Posts: 1494
- Joined: 08 Mar 2002 10:01
- Location: NJ
Re: Я так и не понял, как это все использовать...
Вы не думаете, что там может быть принципиально непредсказуемый шум? Кондиционеры включаются в случайные моменты времени, люди включают плиты когда им заблагорассудится, поезда могут слегка отклоняться от графика. Вы учитываете планы работы заводов, расписание футбольных матчей и т.д. и т.п?Снежная Королева wrote: Ничего похожего на сток маркет. Потребление электричества практически постоянно given weather and seasonal variations. Ошибка только в прогнозе погоды. У меня уже 2-4% ошибка, а надо всего ничего, до 1% довести. Потом можно очень классную вещь замутить, demand management. Это когда все крупные но не критичные девайсы (домашние кондиционеры, например) подключаются напрямую, и их можно автоматом отключать на небольшое время, когда случается surge of demand. Но вначале надо знать, когда этот самый самый surge of demand случится.
-
- Уже с Приветом
- Posts: 6018
- Joined: 11 Mar 2011 05:36
Re: Я так и не понял, как это все использовать...
1. тариф в рабочее время выше, чем в нерабочее. но цена для частника не взлетает в 44 раза на 5 минут??? вы прикалываетесь?Снежная Королева wrote:Зачем мне датчики на нейбохуд ставить, когда у меня датчики на каждый дом по всему штату уже два года стоят. Дата вся есть, и я даже могу с ней поиграться, но мне надо модель в режиме реального времени тренировать, т.е каждые полчаса хотя бы.DropAndDrag wrote:мда - давайте-ка по существуСнежная Королева wrote:Да элементарная задача, точно предсказать потребление электричества каждые 5 минут в данной нетворк, имея данные по electricity demand based on smart meters, на этом можно очень хорошо заработать. А это и есть big data problem. Каждые 5 минут smart meters на 500,000 кастомеров генерируют 200МБ даты, а умножте на 2,628,000 потому что мне за последние 5 лет надо. А если кастомеров 10 миллионов?DropAndDrag wrote:с Big Data пока не будет блестящей идеи, как использовать каждую конкретную мусорку, никакой прибыли не получить.
Наши уже полгода никак не родят инфраструктуру. Дата есть, моделей полно, инфраструктуры это всё запустить (Hadoop, Azure, или другое что, я не специалист) - нет.
- датчики. 200 МБ / 500 тыс = 400 Б; это 200 измерений за 5 минут или почти 1 измерение за секунду. что вы на этих данных конкретного мелкого потребителя предскажите? что они меньше подтрябляют в дневные и ночные часы в рабочее дни? так это и так ясно. Поставьте ОДИН датчик на каждый нейбохуд и этого достаточно
- я не знаю кто ваши, но наши давно занимаются ахинеей в этих делах, начиная от глобального маркета электричества (грубо говоря цена - это стоимости генерящей станции и доставки), кончая разными приспособами на концах (емкостей, солнечных батарей).
в конце концов посмотрите например. вот тут https://www.smartgrid.gov/files/VVO_Report_-_Final.pdf
да можно что-то съэкономить (если бы научились делать крутые батарии, то да - это было бы круто), но предсказывать практически нечего - все и так ясно и видно, как божий день
- так же добавлю, энергоемкие компании напрямую работают с генерящими компаниями и России (еще до перестройки), и тут .
Мне надо датчики на каждый кондиционер, чтобы его отключать на пять минут, когда взлетает цена. У нас цена средняя на wholesale маркете 40, а может взлететь пару раз до 13,500. И изза таких пару раз средняя цена увеличивается до 44. Так вот если во время высокой цены на пять минут отключить 20% кондиционеров по всему штату, а потом отключать волной следующие 20%, и так далее, кастомеры почти не заметят, но скидку в 10% на общую стоимость электричества они очень даже приветствуют.
И таких задач очень много, они концептуально простые, но сложно имплементировать, ибо много даты.
2. если цена для частника не взлетает, то какого хрена штат может отключать кондиционеры частников? А давайте еще электроплиты отключим, а люди готовятся к попойке )))
3. выполнить такую систему отключения в каждом доме. Если счетчики подключены, то нужен хотя бы провод до между щетчиками и щитком, где автомат и специальный автомат. но вообще-то нужно тащить провод до конционера, чтобы он аккуратно отключался. Вы прикинули во что это выливается?
5. ну и кондионеры все одно будут лететь чаще. я надеюсь вы понимаете лишний стоп-старт - это удар по печени )))
играйтесь с данными, делайте модели ...
кстати, по поводу датчиков по всем штату. я тоже так думал, но мне сказали, что обходчики ходят и смотрят показания счетчиков. я отвечаю да ладно вам, ходят и смотрят раз в год или три. а мне говорят, а ты посмотри свои счета - они в разные дни сняты и именно в эти дни появлялись обходчики!
-
- Уже с Приветом
- Posts: 6018
- Joined: 11 Mar 2011 05:36
Re: Я так и не понял, как это все использовать...
+1.perasperaadastra wrote:Но ведь проще обрабатывать эти данные в реальном времени на смартфоне того же водителя. Зачем хранить raw data? На каждого водителя будет агрегированная информация в конце рабочего дня (превышение скорости + % резких торможений). Это в общем-то тоже форма БД, но без специальной инфраструктуры.Wolverene wrote:Ну на самом деле большие данные иногда используются. В чем фишка? Данных много, и надо иметь средства чтобы их сохранить, и средства чтобы их обработать. Вот в этом и есть явление Big Data. В частности в Убер сохраняют инфомрацию с гироскопа и GPS для того чтобы определить водителей, которые водят небезопасно. Сколько у них водителей? Много. А сколько из них водятлов?
А про анализ трафика с целью тайминга светофоров я бы согласился, но до сих пор я не видел удачного примера. Не знаю, может быть после подкрутки ситуация чуть-чуть улучшается, но как-то это совсем незаметно. Может, просто модели плохие...
я видел как в стендфорде или типа выпустили статью. как минимум значительная часть была посвещена движению машин по кругу с равным расстоянием между ними и одним светофором. светофор стал красным, собрал все машины и потом показывали динамический процесс как машины расползались по кругу. честно говоря я приторчал от времени расползания
-
- Уже с Приветом
- Posts: 20128
- Joined: 21 Feb 2009 22:55
- Location: Лох Онтарио
Re: Я так и не понял, как это все использовать...
Сурово в Австралии! Я, хоть и живу в холодной Канаде, но ни за что не позволил бы энергокомпании отключать кондиционер на пять минут, чтобы сэкономить $6 в месяц.
-
- Уже с Приветом
- Posts: 20128
- Joined: 21 Feb 2009 22:55
- Location: Лох Онтарио
Re: Я так и не понял, как это все использовать...
Ааа! Так это совсем другое дело! А то я себе уже такой энергетический концлагерь представил!Снежная Королева wrote:Как я уже сказала, в Кали это уже работает. "Отключить на пять минут", это было грубо сказано, но смысл именно такой, мгновенно, напрямую и ненадолго уменьшить потребление, при этом это почти незаметно людям.perasperaadastra wrote:Сурово в Австралии! Я, хоть и живу в холодной Канаде, но ни за что не позволил бы энергокомпании отключать кондиционер на пять минут, чтобы сэкономить $6 в месяц.
-
- Уже с Приветом
- Posts: 1494
- Joined: 08 Mar 2002 10:01
- Location: NJ
Re: Я так и не понял, как это все использовать...
Зачем же вы тогда следите за каждой конкретной старушкой? Все это туманно, честно говоря. Но флаг вам в рукиСнежная Королева wrote:Вот и моя свекровь удивлялась, как это я могу предсказать, когда старушка включит плиту. Я ей отвечала, что действия одной старушки я предсказать не могу, а действия сто тысяч старушек очень даже возможно. Law of Large Numbers называется.
-
- Уже с Приветом
- Posts: 192
- Joined: 01 Jul 2005 08:56
- Location: Нск, РФ -> Riverside, CA
Re: Я так и не понял, как это все использовать...
А, ну тогда это интерестнее - а то мне Эдисон предлагал такую установку поставить чтобы кондиционер на полчаса отключать - но у меня как раз днем дети и жена дома, и так температура выставлена на 78 градусов, так что он включается когда надо чтобы ее поддержать - а это значит что там уже 80 градусов достигла. И тут он берет и отключается, чтобы экономить энергию... Лучше я на час больше поработаю, зато весь месяц семья сможет нормально кондиционером пользоваться...Снежная Королева wrote: Что касается отключения кондиционеров, там все физически сложнее, его не отключают совсем, а переключают на lower capacity. Это уже работает в Калифорнии, гуглите SmartAC.
-
- Уже с Приветом
- Posts: 20128
- Joined: 21 Feb 2009 22:55
- Location: Лох Онтарио
Re: Я так и не понял, как это все использовать...
78 F! Это же жара! У меня стоит на 73 F и ни градусом больше!
-
- Уже с Приветом
- Posts: 13682
- Joined: 16 Jan 2001 10:01
Re: Я так и не понял, как это все использовать...
Для сглаживания взлётов не нужны хитромудрые вычисления и слежка за каждым чайником.Снежная Королева wrote:Если же иметь механизм по сглаживанию взлетов, то ретейлер мог бы намного дешевле купить эту страховку (hedging), а значит, всем его клиентам снизить общую цену.
Простая формула и алгоритм в 50 строк справится не хуже.
-
- Уже с Приветом
- Posts: 13682
- Joined: 16 Jan 2001 10:01
Re: Я так и не понял, как это все использовать...
Если нагрузка (усредненное значение за несколько минут) растёт и приближается к определённому значению - начинать ограничивать клиентов.Снежная Королева wrote:Поделитесь алгоритмом?Palych wrote:Для сглаживания взлётов не нужны хитромудрые вычисления и слежка за каждым чайником.Снежная Королева wrote:Если же иметь механизм по сглаживанию взлетов, то ретейлер мог бы намного дешевле купить эту страховку (hedging), а значит, всем его клиентам снизить общую цену.
Простая формула и алгоритм в 50 строк справится не хуже.
Тех которые могут/согласны.
В качестве примера можно посмотреть на любимый zVladом WLS. Но мне кажется даже это будет ненужным усложнением.
Кароче: "Взять всё и поделить!"
-
- Уже с Приветом
- Posts: 13682
- Joined: 16 Jan 2001 10:01
Re: Я так и не понял, как это все использовать...
Я откровенно не понимаю что значит предсказание в данном контексте.Снежная Королева wrote: модель на самом деле простая очень, в аккурат 50 строк и занимает. Вся сложность в том, что ее надо пересчитывать постоянно, используя самые свежие данные. Иначе она не будет точно предсказывать.
Что собственно предсказывается, зачем...
Видно не судьба.
-
- Уже с Приветом
- Posts: 15526
- Joined: 27 Sep 2007 22:53
Re: Я так и не понял, как это все использовать...
Монополистам отдельных сегментов рынка навроде Apple такое как раз в тему. Васе впарят по номиналу или даже выше, а для Пети придумают очередную завлекаловку типа "супер-лояльного приверженца торговой марки" и таки вынут из него сороковник.ALV00 wrote: Может так получиться, что все продавцы перейдут на это дело, потому что иначе они проиграют конкуренцию из-за своей неэффективности.
Можно порассуждать, что биг дата дает в плане экономики. Допустим, есть некий товар, его равновесная рыночная цена равна 50. Есть покупатель Вася, который может заплатить за этот товар максимум 60. Есть покупатель Петя, который может заплатить максимум 40. При старых рыночных отношениях продавец продал бы одну штуку товара Васе за 50, Вася сэкономил бы 10. Петя не купил бы этот товар. Теперь применяем индивидуальный прайсинг. Вася поставили цену 60, он купил так как заранее был согласен с такой ценой. Пете выставили цену 40, он тоже смог купить. В результате все довольны, продавец тоже, потому что он продал две штуки товара вместо одной и получил в среднем по 50 за штуку.
Правда, на первых порах конкуренция между продавцами будет ломать эту идиллию. Может найтись другой продавец, который согласится продать аналогичный товар Васе за 50. Но через какое-то время все продавцы поймут преимущества данной технологии. Богатые будут покупать дороже, бедные дешевле, производители больше производить. Наступит всеобщее счастье
-
- Уже с Приветом
- Posts: 20128
- Joined: 21 Feb 2009 22:55
- Location: Лох Онтарио
-
- Уже с Приветом
- Posts: 6018
- Joined: 11 Mar 2011 05:36
Re: Я так и не понял, как это все использовать...
мда ))) а вы случайно не в коммунизме живетеСнежная Королева wrote:Drag-n-Drop, цена wholesale взлетает. Она влияет на среднюю годовую цену. Чем больше таких взлетов, тем хуже всем. Чтобы защититься от таких взлетов, utility retailer делает hedging, что стоит приличных денег, и в целом увеличивает общую стоимость электричества. Грубо говоря, если в этом году ожидается средняя годовая цена 40, то ретейлер (а значит, все его клиенты) платит 50 на год вперед фиксированно, из них 10 плата за риск, чтобы его не брать. Если же иметь механизм по сглаживанию взлетов, то ретейлер мог бы намного дешевле купить эту страховку (hedging), а значит, всем его клиентам снизить общую цену.
Что касается отключения кондиционеров, там все физически сложнее, его не отключают совсем, а переключают на lower capacity. Это уже работает в Калифорнии, гуглите SmartAC.
давайте возьмем пример с солнечными батареями. сначала их толкали и давали скидки по таксам (может пока и еще дают), и принимают энергию назад. а теперь вот ретейлер говорят, что стало много таких умных потребители и наваривать бабла не на чем. Так что предлагают сделать минимальную фиксированную плату за подключение, а над ней уже играться с потребляемой энергией.
Так же будет и с wholesale. пиковых нагрузок достаточно вот они и гребут деньжат с тех, кто может платить. И скорее всего это не частный сектор, а компании. Уменьшатся пики - придумают другие варианты оплаты. Или вы думаете, что производители электроэнергии согласится получать меньше прибыли?
Можно было бы сказать, что для оборудования хорошо - не иметь всплесков и тогда можно уменьшить расходы. Честно говоря я сомневаюсь, что пойдут по этому пути и вот почему. Лет 10 назад были веерные отключения. Одна станция останавливалась, соседняя пыталсь восполнить и грохалась, так не могла столько произвести. В итоге были очень большие отключения по площади.
-
- Уже с Приветом
- Posts: 6018
- Joined: 11 Mar 2011 05:36
Re: Я так и не понял, как это все использовать...
определенное значение - это стоимость энергии в данный момент.Снежная Королева wrote:Я стесняюсь спросить, а как вы определите это "определенное значение"? А то оно разное совершенно, в зависимости от погоды, количества установленных солнечных батарей на крышах, времени дня, не идут ли ремонтные работы на коннекторе.Palych wrote:Если нагрузка (усредненное значение за несколько минут) растёт и приближается к определённому значению - начинать ограничивать клиентов.Снежная Королева wrote:Поделитесь алгоритмом?Palych wrote:Для сглаживания взлётов не нужны хитромудрые вычисления и слежка за каждым чайником.Снежная Королева wrote:Если же иметь механизм по сглаживанию взлетов, то ретейлер мог бы намного дешевле купить эту страховку (hedging), а значит, всем его клиентам снизить общую цену.
Простая формула и алгоритм в 50 строк справится не хуже.
Тех которые могут/согласны.
В качестве примера можно посмотреть на любимый zVladом WLS. Но мне кажется даже это будет ненужным усложнением.
Кароче: "Взять всё и поделить!"
Но вообще я согласна, модель на самом деле простая очень, в аккурат 50 строк и занимает. Вся сложность в том, что ее надо пересчитывать постоянно, используя самые свежие данные. Иначе она не будет точно предсказывать.
сомневаюсь, что при больших пиках подход с отключение кучи мелких потребителей будет работать.
-
- Уже с Приветом
- Posts: 64875
- Joined: 12 Jul 2002 16:38
- Location: г.Москва, ул. Б. Лубянка, д.2
Re: Я так и не понял, как это все использовать...
big data не нужна. Нужны хорошие затюненные нормализованные БД для метадаты, плюс файлопомойка для просто даты. Ну и не совсем тупая отлаженная бизнес-логика над всем этим.Снежная Королева wrote: Мне интересна big data и модели, IT инфраструктура чтобы модели работали. Есть у кого что сказать?
-
- Уже с Приветом
- Posts: 15526
- Joined: 27 Sep 2007 22:53
Re: Я так и не понял, как это все использовать...
Недавно столкнулся на ебэе с одной интересной ситуацией:perasperaadastra wrote:Взял на корсере курс введения в Большие Данные. У меня интерес в этом исключительно с точки зрения бизнеса. В курсе рассказали, какой хороший Hadoop, и как важно понимать, что такое Большие Данные. Забыли рассказать только одну вещь: а как это все использовать?
Выставлял на продажу вещь, причем название написал приблизительное. Интересное заключалось в том что система достаточно точно угадала вес по не совсем точному наименованию. Категорию товара указал, правда, достаточно точно.
-
- Ник закрыт за хамство.
- Posts: 357
- Joined: 16 Feb 2014 18:34
Re: Я так и не понял, как это все использовать...
Это скорее machine learning а не бигдатаМальчик-Одуванчик wrote:Недавно столкнулся на ебэе с одной интересной ситуацией:perasperaadastra wrote:Взял на корсере курс введения в Большие Данные. У меня интерес в этом исключительно с точки зрения бизнеса. В курсе рассказали, какой хороший Hadoop, и как важно понимать, что такое Большие Данные. Забыли рассказать только одну вещь: а как это все использовать?
Выставлял на продажу вещь, причем название написал приблизительное. Интересное заключалось в том что система достаточно точно угадала вес по не совсем точному наименованию. Категорию товара указал, правда, достаточно точно.
-
- Уже с Приветом
- Posts: 191
- Joined: 13 Mar 2006 19:01
- Location: Earth -> Moon -> Mars
Re: Я так и не понял, как это все использовать...
Вот видео, в котором Григорий Бакунов рассказывает про этот кейс (к сожалению, на русском), с 6 минуты и 42 секунды, здесь не отматывает на нужную метку почему-то.x.angie wrote:Больше подробностей не вспомню, но можно погуглить, история цитировалась лет пару назад как лютый вин Big Data
Вообще, Григорий - достаточно примечательный чувак, и видео стоит того, что бы посмотреть его всё. В конце, как бонус, пара слов про Alpha Go vs. какой-то кореец Ли Сидоль.
Bugfixing по фотографии. Дорого.