Там к сожалению надо больше иметь представление о моделировании как таковом и очень хорошо прочухать саму предметную область, чтоб модель тренировать. Этот процесс больше схож с постановкой экперимента у физиков. В общем физики там обычно в топе. Про С++ я тоже поржал когда почитал Владимираliamkin wrote: ↑16 Jan 2020 21:24Ну, это если выиграешь. А если проиграешь? Тотализатор какой-то!Sergunka wrote: ↑16 Jan 2020 21:04Там и деньги довольно часто неплохие бывают если выйграешь. Призовой фонд более 100К обычное явление.
P.S. Я помнится здесь открывал года два назад топик как играть на kaggle.com на самом деле вещь довольно увлекательная. У меня уже и дети подсели
Шучу.
Дело это хорошее. Сходить посмотреть надо. Если какой-то тухлый физик, с Питоном, и без знания плюсов, смог выиграть, то уж нам-то, обладателям Текметрикса, и сам Бог велел!
Прикольная история
-
- Уже с Приветом
- Posts: 34124
- Joined: 03 Dec 2000 10:01
- Location: Vladivostok->San Francisco->Los Angeles->San Francisco
Re: Прикольная история
"A patriot must always be ready to defend his country against his government." Edward Abbey
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Алгоритмы на питоне разрабатывать самое то - больше всего открытых библиотек. Плюсы нужны, чтобы потом алгоритмы внедрять в продакшн. Как на них можно ресерч двигать не очень понятно.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Ну вот например он один из авторов библиотеки albumentations, которая сейчас повсеместно используется для аугментации в компьютерном зрении и недавно была интегрирована в Pytorch.alex_127 wrote: ↑16 Jan 2020 07:35 Я не читал тогда. Ну что, молодец. Я сам немного олимпиадил - очень давно. Но это совсем не программирование. Я смотрю по людям которых я туда иногда скриню(как вы понимаете, ничего я в этом ml/AI не знаю, но моя задача другая). И пока непонятен вклад этого товарища - молод очень. Будем посматривать с годами.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Я думаю, что у людей из первой сотни рейтинга нет отбоя от предложений от рекрутеров. И это правильно. Там действительно серьёзные ребята. Можете глянуть на их модели вот здесь: https://kaggledb.com/solutionsСнежная Королева wrote: ↑16 Jan 2020 04:02 Приличные конторы на статус kaggle grandmaster не ведутся? Хочется надеяться.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Data science - это широкое понятие. И я готов поверить, что в вашей работе успехи на каггле особо не помогут, особенно если вы решаете более-менее стандартные бизнес-задачи. Однако, не соглашусь с тем, что достижения там random, особенно в deep learning. Многие из тех, кто там стабильно берут золотые медали, занимаются machine learning research и разрабатывают новые алгоритмы, а это существенно выше уровня среднего дата сайнтиста.Снежная Королева wrote: ↑18 Jan 2020 00:23 Зачем мне глядеть на их модели, я уже давно прошла период восторга от Kaggle. В свое время тоже им баловалась, лет 5 назад. Кое-что выучила, да.
Как статистику мне известно, что достижения в kaggle во многом random.
В реальной data science работе, построение и тюнинг модели - это 5% работы, и самые легкие и приятные причем (когда выучишь алгоритмы). 95% трудной работы - это политические игры для постановки задачи, data engineering и платформы, анализ и в конце таки extract business value.
Успех в Kaggle почти не коррелирует с успехом на работе. Что, в принципе, все уже давно знают.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Сколько у вас займёт в одиночку написать deep learning модель для GPU с кастомной архитектурой на плюсах? Понятно, что раньше люди и перфокартами пользовались, но это ещё не значит, что это самый эффективный способ в наши дни.Снежная Королева wrote: ↑18 Jan 2020 00:31 OpenCV на плюсах написан был, и ничего, computer vision как-то развивалось без питона, пока его не прикрутили.
Все зависит от всего. И на питоне внедряют в продакшн, и на плюсах делаю резерч. Зависит от legacy и от конкретных алгоритмов. Одна контора, где я работала, имеет патент на drowsiness algorithm, написанный на чистом C вообще.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Микрософт с вами не согласился и инвестировал 1 млрд долларов в OpenAI. Как Вы считаете - GPT2 стоит этих денег и принесёт value по сравнению с tf-idf?Снежная Королева wrote: ↑18 Jan 2020 01:34 Можете не соглашаться, мое мнение противоположное. Machine learning research звучит красиво, но в подавляющем большинтсве - это просто phd students. В лучшем случае post doc. Многие вообще не знают статистику, да и программировать в продакшн не умеют.
Новые алгоритмы не означают лучшего value, наоборот, подавляющее большинство новых методов или проигрывают или uplift не стоит денег, потраченных на разработку и внедрение, по сравнению со старым методом.
Жизнь весьма далека от Kaggle competition.
Я кстати специально привел ссылку на решения, чтобы было видно, что качество кода там очень неплохое.
Last edited by Chessplayer on 18 Jan 2020 01:54, edited 1 time in total.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Речь изначально шла про то на чём в наши дни делается ресерч в области ML. Основной прогресс сейчас происходит в deep learning и наиболее практично разрабатывать новые модели на питоне, поскольку есть необходимая инфраструктура, упрощающая этот процесс. Каггл собственно и заточен под то, чтобы генерировать новые идеи при помощи комьюнити и необязательно все они идут в продакшн. Кстати, например, XGBoost стали повсеместно применять только после того, как им стали выигрывать большинство табличных соревнований на каггле. То же самое произошло с UNet для сегментации картинок. Прогресс в Medical Imaging community тоже сильно ускорился благодаря Кагглу - посмотрите на пример Игловикова сверху. В прошлом году обкатали BERT и GPT2 NLP модели, сейчас идёт соревнование по Deepfake Detection с призовым фондом $1M, итд итп.Снежная Королева wrote: ↑18 Jan 2020 01:51Там вообще не было image or CV, и deep learning не использовался.Chessplayer wrote: ↑18 Jan 2020 00:55
Сколько у вас займёт в одиночку написать deep learning модель для GPU с кастомной архитектурой на плюсах? Понятно, что раньше люди и перфокартами пользовались, но это ещё не значит, что это самый эффективный способ в наши дни.
Вы кроме deep learning что-то еще знаете?
То что большинству бизнесов в наши дни нужен ETL и стандартные линейные модели вещь в общем-то понятная. Но никакой прогресс в этой области они не двигают, а готовые решения можно внедрять на любой, даже легаси, системе.
Last edited by Chessplayer on 18 Jan 2020 09:03, edited 2 times in total.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
GPT2 и BERT - это, кстати, не CV. Есть ещё RL. В традиционном ML после XGBoost-a вроде ничего нового за последние 10+ лет не придумали?
-
- Уже с Приветом
- Posts: 37986
- Joined: 14 Dec 2006 20:13
- Location: USA
Re: Прикольная история
По мне, тут бакланом выступил стартап и кагль. А чувак выиграл у обоих.Sergunka wrote: ↑15 Jan 2020 21:22Его забанили на кегле и индуский стартап его уволили наскоряк. В уголовной иерархии больше подходит баклан, но это слишком тонко для данного ресурса
А вообще я посмотрел.. кто то очень умный понял, что все равно там только методом _научного тыка_ можно двигаться, ну и устроил что то вроде эволюционного отбора на соревновании. А что, в целом то подход моделирует _природу_ - куча изменений, вдруг что то очень удачное - оно выживает и вытесняет остальных. Там тоже, берем кучу чайников и индусов, и на них тренируемся... в целом конечно все делают _случайные изменения_ (под разными научными соусами) но кому то повезет (скорее случайно) - и он вырвется, вот она и _эволюция_ . Природа таким макаром ажно человека изобрела, а тут какой то несчастный дип ленинг (распознание и прочее...). Я кстати и не знал что там такое активное бурление, хотя намеки были...
Last edited by StrangerR on 18 Jan 2020 09:56, edited 1 time in total.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Чувак довольно сильно подпортил себе репутацию. У него было имя в International Data Science Community, которое позволяло ему получать жирные контракты и предложения о работе. Также его постоянно приглашали выступать на конференциях. Теперь обо всем этом можно забыть, возможно, что и навсегда.
-
- Уже с Приветом
- Posts: 37986
- Joined: 14 Dec 2006 20:13
- Location: USA
Re: Прикольная история
Гмм, подпорить можно то что есть. А у него не было ничего, он создал себе репутацию и заработал деньги, теперь может взять любовницу и ехать жить на острове с пляжем в свое удовольствие. Ну или еще где подвизаться. ВОт если бы он был реально _ученым_ а потом решил улучшить результат читингом тогда да. А так у него был нуль репутации и нуль денег, стал не нуль денег и нуль репутации. Или он реально что то делал а потом уже решил _угадывать_?Chessplayer wrote: ↑18 Jan 2020 09:55Чувак довольно сильно подпортил себе репутацию. У него было имя в International Data Science Community, которое позволяло ему получать жирные контракты и предложения о работе. Также его постоянно приглашали выступать на конференциях. Теперь обо всем этом можно забыть, возможно, что и навсегда.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Он реально не глупый чувак и думаю, что большинство соревнований от затащил честно. Читил он не из-за денег (они там были небольшие и они их вернули), а потому что хотел подняться на первое место в рейтинге (был на 2-3 месте).StrangerR wrote: ↑18 Jan 2020 09:58 Гмм, подпорить можно то что есть. А у него не было ничего, он создал себе репутацию и заработал деньги, теперь может взять любовницу и ехать жить на острове с пляжем в свое удовольствие. Ну или еще где подвизаться. ВОт если бы он был реально _ученым_ а потом решил улучшить результат читингом тогда да. А так у него был нуль репутации и нуль денег, стал не нуль денег и нуль репутации. Или он реально что то делал а потом уже решил _угадывать_?
-
- Уже с Приветом
- Posts: 34124
- Joined: 03 Dec 2000 10:01
- Location: Vladivostok->San Francisco->Los Angeles->San Francisco
Re: Прикольная история
Я не знал, что они вернули деньги. Глупо, что они код свой тогда дали. Когда играешь есть всегда соблазн каты противника подсмотреть просто если подсмотрел и есть шанс, что всплывет лучше понятно выйгрыш не брать - остаться при своих.Chessplayer wrote: ↑18 Jan 2020 10:03Он реально не глупый чувак и думаю, что большинство соревнований от затащил честно. Читил он не из-за денег (они там были небольшие и они их вернули), а потому что хотел подняться на первое место в рейтинге (был на 2-3 месте).StrangerR wrote: ↑18 Jan 2020 09:58 Гмм, подпорить можно то что есть. А у него не было ничего, он создал себе репутацию и заработал деньги, теперь может взять любовницу и ехать жить на острове с пляжем в свое удовольствие. Ну или еще где подвизаться. ВОт если бы он был реально _ученым_ а потом решил улучшить результат читингом тогда да. А так у него был нуль репутации и нуль денег, стал не нуль денег и нуль репутации. Или он реально что то делал а потом уже решил _угадывать_?
Естественно это неприятный момент, что вся эта история всплыла и испортила атмосферу кегла прямо как допинговый скандал на олимпийских играх в Сочи
"A patriot must always be ready to defend his country against his government." Edward Abbey
-
- Уже с Приветом
- Posts: 34124
- Joined: 03 Dec 2000 10:01
- Location: Vladivostok->San Francisco->Los Angeles->San Francisco
Re: Прикольная история
Ага - "а мы цап-цапрап" (с)StrangerR wrote: ↑18 Jan 2020 09:46По мне, тут бакланом выступил стартап и кагль. А чувак выиграл у обоих.Sergunka wrote: ↑15 Jan 2020 21:22Его забанили на кегле и индуский стартап его уволили наскоряк. В уголовной иерархии больше подходит баклан, но это слишком тонко для данного ресурса
Мля, ну пряма развитой путинизм во всей красе
"A patriot must always be ready to defend his country against his government." Edward Abbey
-
- Уже с Приветом
- Posts: 607
- Joined: 17 Dec 2009 11:27
Re: Прикольная история
"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?
Я тоже сейчас изучаю нейронные сети. Самостоятельно. Есть мелкая задача по обработке медицинских снимков. Просто помощь хорошему человеку в докторской.
Но что потом делать с этими, если я не хочу -
1) уезжать из РФ
2) устраиваться куда-то на работу как сотрудник
Лет десять назад я изучил теорию по BI. Сделал все задачи по экзамену от MS. Сам этот экзамен не прошел. Переучил своих админов и сейчас они уже опытные BI-разработчики. Как команда работают на одного из крупнейших системных интеграторов. Профит.
Но вижу по опыту одной конторы - не идут у них проекты по DS и BD. Заказчики готовы взять людей только в штат.
Те они не нашли модель сотрудничества с заказчиком.
Я тоже хочу обучиться и обучить своих людей DS и BD. Но вот не понимаю что потом делать. Как на этом зарабатывать. Может в штатах эта модель вполне работает? В виде каких-то сервисов и тп.
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Яндекс, Мэйл.ру, Мапбокс, Сбербанк, Интел, Пятёрочка и пр. думаете чем пользуются? Он сам работал удаленно на западные стартапы...Andrey Strelnikov wrote: ↑23 Jan 2020 11:13"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?
-
- Уже с Приветом
- Posts: 607
- Joined: 17 Dec 2009 11:27
Re: Прикольная история
Ну первый путь немного не то. я выше писал про команду у которой не пошло. Им просто никто не хотел давать данные и тд.Chessplayer wrote: ↑24 Jan 2020 10:24Яндекс, Мэйл.ру, Мапбокс, Сбербанк, Интел, Пятёрочка и пр. думаете чем пользуются? Он сам работал удаленно на западные стартапы...Andrey Strelnikov wrote: ↑23 Jan 2020 11:13"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?
-
- Уже с Приветом
- Posts: 37986
- Joined: 14 Dec 2006 20:13
- Location: USA
Re: Прикольная история
Плюс военные в количествах неслабых, скорее всего.Chessplayer wrote: ↑24 Jan 2020 10:24Яндекс, Мэйл.ру, Мапбокс, Сбербанк, Интел, Пятёрочка и пр. думаете чем пользуются? Он сам работал удаленно на западные стартапы...Andrey Strelnikov wrote: ↑23 Jan 2020 11:13"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?
-
- Уже с Приветом
- Posts: 607
- Joined: 17 Dec 2009 11:27
Re: Прикольная история
Ну мне-то это все неинтересно. Мне интересно как заработать находясь снаружи проходной. Ну в лучшем случае допустят к данным. Или к тестовым данным.StrangerR wrote: ↑25 Jan 2020 07:11Плюс военные в количествах неслабых, скорее всего.Chessplayer wrote: ↑24 Jan 2020 10:24Яндекс, Мэйл.ру, Мапбокс, Сбербанк, Интел, Пятёрочка и пр. думаете чем пользуются? Он сам работал удаленно на западные стартапы...Andrey Strelnikov wrote: ↑23 Jan 2020 11:13"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?
-
- Уже с Приветом
- Posts: 545
- Joined: 07 Jan 2016 13:04
Re: Прикольная история
Слушайте, весь интернет в Вашем распоряжении. Уверяю Вас, там еще тысячи возможностей для заработка, о которых пока никто и ничего не знает. Просто не понятно чего Вы ждете, никто к Вам не придет и не попросит создать еще один P&L отчет, это Вам нужно идти и говорить клиенту какое бизнес-валью несет Ваше решение. Оно же что-то несет, правильно?Andrey Strelnikov wrote: ↑27 Jan 2020 13:23Ну мне-то это все неинтересно. Мне интересно как заработать находясь снаружи проходной. Ну в лучшем случае допустят к данным. Или к тестовым данным.
Просто у большинства DS стартапов большая проблема -- они не знают, что несут кроме макбука и смузи. )))
-
- Уже с Приветом
- Posts: 607
- Joined: 17 Dec 2009 11:27
Re: Прикольная история
В России в этой области беда в том что есть бюджеты. Но исполнитель и клиент пока не очень понимают что бы с этими бюджетами сделать Какое-то BI хоронилище строить и пристраивать научились. А вот как национальные проекты в области AI и BigData окучивать пока не научились...tessob wrote: ↑28 Jan 2020 19:36Слушайте, весь интернет в Вашем распоряжении. Уверяю Вас, там еще тысячи возможностей для заработка, о которых пока никто и ничего не знает. Просто не понятно чего Вы ждете, никто к Вам не придет и не попросит создать еще один P&L отчет, это Вам нужно идти и говорить клиенту какое бизнес-валью несет Ваше решение. Оно же что-то несет, правильно?Andrey Strelnikov wrote: ↑27 Jan 2020 13:23Ну мне-то это все неинтересно. Мне интересно как заработать находясь снаружи проходной. Ну в лучшем случае допустят к данным. Или к тестовым данным.
Просто у большинства DS стартапов большая проблема -- они не знают, что несут кроме макбука и смузи. )))
Где бы почитать всяких задач и решений (бизнес-валью несет Ваше решение) в области например управления финансами области, страны с использованием BigData ?
или прочих задач госуправления и тп.
-
- Уже с Приветом
- Posts: 3208
- Joined: 25 Jul 2000 09:01
Re: Прикольная история
Подождите. Вы предлагаете компаниям технологии, но не знаете зачем они им могут быть нужны, кроме освоения бюджета?Andrey Strelnikov wrote: ↑28 Jan 2020 20:40 Где бы почитать всяких задач и решений (бизнес-валью несет Ваше решение) в области например управления финансами области, страны с использованием BigData ?
или прочих задач госуправления и тп.
-
- Уже с Приветом
- Posts: 607
- Joined: 17 Dec 2009 11:27
Re: Прикольная история
Я изучаю Data Science чтобы в дальнейшем зарабатывать на этом. Понятно что если в штатах DS идет хорошо, то в России он тоже нужен. Но будущие клиенты и я не знают точно как:) Ситуация аналогична хранилищам данных.Lisa wrote: ↑28 Jan 2020 20:51Подождите. Вы предлагаете компаниям технологии, но не знаете зачем они им могут быть нужны, кроме освоения бюджета?Andrey Strelnikov wrote: ↑28 Jan 2020 20:40 Где бы почитать всяких задач и решений (бизнес-валью несет Ваше решение) в области например управления финансами области, страны с использованием BigData ?
или прочих задач госуправления и тп.
Сделали людям хранилища , показали как пользоваться сводными табилцами. Теперь они сами могут придумать себе в excel кучу нужных отчетов. Это скопировано из разных источников а не придумано на месте.
Та же электронная почта пришла в российский бизнес только через несколько лет после Запада.
Те я ищу примеры различных отраслевых решений с помощью Data Science. Может какие-то примеры на стороне вендоров и тп.
-
- Уже с Приветом
- Posts: 545
- Joined: 07 Jan 2016 13:04
Re: Прикольная история
С точки зрения РСБУ, НИОКР может иметь положительный экономический эффект или отрицательный. Вам, видимо, попросту нужно найти того человека у заказчика, который имеет офшорный счет и готов "разделить с вами успех". Никакие BigData & Artificial Intelligence вам вообще не нужны. Скорее вам нужен комплайнс консультант имеющий опыт работы в офшорных юрисдикциях.Andrey Strelnikov wrote: ↑28 Jan 2020 20:40В России в этой области беда в том что есть бюджеты. Но исполнитель и клиент пока не очень понимают что бы с этими бюджетами сделать Какое-то BI хоронилище строить и пристраивать научились. А вот как национальные проекты в области AI и BigData окучивать пока не научились...
Где бы почитать всяких задач и решений (бизнес-валью несет Ваше решение) в области например управления финансами области, страны с использованием BigData ?
или прочих задач госуправления и тп.
Если же вы планируете именно продавать решения подобного класса, то в первую очередь это предполагает наличие у вас экспертов в некоторой доменной области, которые превосходят внутреннюю экспертизу у заказчика. Например, если вы знаете, что план счетов это еще и направленный циклический граф, который обладает многими свойствами Марковского процесса, и знаете как использовать это знание с пользой для вашего клиента, то проблем у вас не возникнет. Если же ваши дата-сатанисты не сильны в корпоративных финансах, то вам просто нужно найти то, в чем они сильны.