Прикольная история

User avatar
Sergunka
Уже с Приветом
Posts: 34124
Joined: 03 Dec 2000 10:01
Location: Vladivostok->San Francisco->Los Angeles->San Francisco

Re: Прикольная история

Post by Sergunka »

liamkin wrote: 16 Jan 2020 21:24
Sergunka wrote: 16 Jan 2020 21:04
liamkin wrote: 16 Jan 2020 19:54 как-бы гроссмейстер говорите? неплохой титул
Там и деньги довольно часто неплохие бывают если выйграешь. Призовой фонд более 100К обычное явление.

P.S. Я помнится здесь открывал года два назад топик как играть на kaggle.com на самом деле вещь довольно увлекательная. У меня уже и дети подсели :D
Ну, это если выиграешь. А если проиграешь? Тотализатор какой-то!
Шучу.
Дело это хорошее. Сходить посмотреть надо. Если какой-то тухлый физик, с Питоном, и без знания плюсов, смог выиграть, то уж нам-то, обладателям Текметрикса, и сам Бог велел! :roll:
Там к сожалению надо больше иметь представление о моделировании как таковом и очень хорошо прочухать саму предметную область, чтоб модель тренировать. Этот процесс больше схож с постановкой экперимента у физиков. В общем физики там обычно в топе. Про С++ я тоже поржал когда почитал Владимира :D
"A patriot must always be ready to defend his country against his government." Edward Abbey
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

liamkin wrote: 16 Jan 2020 21:24 Ну, это если выиграешь. А если проиграешь? Тотализатор какой-то!
Шучу.
Дело это хорошее. Сходить посмотреть надо. Если какой-то тухлый физик, с Питоном, и без знания плюсов, смог выиграть, то уж нам-то, обладателям Текметрикса, и сам Бог велел! :roll:
Алгоритмы на питоне разрабатывать самое то - больше всего открытых библиотек. Плюсы нужны, чтобы потом алгоритмы внедрять в продакшн. Как на них можно ресерч двигать не очень понятно.
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

alex_127 wrote: 16 Jan 2020 07:35 Я не читал тогда. Ну что, молодец. Я сам немного олимпиадил - очень давно. Но это совсем не программирование. Я смотрю по людям которых я туда иногда скриню(как вы понимаете, ничего я в этом ml/AI не знаю, но моя задача другая). И пока непонятен вклад этого товарища - молод очень. Будем посматривать с годами.
Ну вот например он один из авторов библиотеки albumentations, которая сейчас повсеместно используется для аугментации в компьютерном зрении и недавно была интегрирована в Pytorch.
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

Снежная Королева wrote: 16 Jan 2020 04:02 Приличные конторы на статус kaggle grandmaster не ведутся? Хочется надеяться.
Я думаю, что у людей из первой сотни рейтинга нет отбоя от предложений от рекрутеров. И это правильно. Там действительно серьёзные ребята. Можете глянуть на их модели вот здесь: https://kaggledb.com/solutions
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

Снежная Королева wrote: 18 Jan 2020 00:23 Зачем мне глядеть на их модели, я уже давно прошла период восторга от Kaggle. В свое время тоже им баловалась, лет 5 назад. Кое-что выучила, да.

Как статистику мне известно, что достижения в kaggle во многом random.

В реальной data science работе, построение и тюнинг модели - это 5% работы, и самые легкие и приятные причем (когда выучишь алгоритмы). 95% трудной работы - это политические игры для постановки задачи, data engineering и платформы, анализ и в конце таки extract business value.

Успех в Kaggle почти не коррелирует с успехом на работе. Что, в принципе, все уже давно знают.
Data science - это широкое понятие. И я готов поверить, что в вашей работе успехи на каггле особо не помогут, особенно если вы решаете более-менее стандартные бизнес-задачи. Однако, не соглашусь с тем, что достижения там random, особенно в deep learning. Многие из тех, кто там стабильно берут золотые медали, занимаются machine learning research и разрабатывают новые алгоритмы, а это существенно выше уровня среднего дата сайнтиста.
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

Снежная Королева wrote: 18 Jan 2020 00:31 OpenCV на плюсах написан был, и ничего, computer vision как-то развивалось без питона, пока его не прикрутили.

Все зависит от всего. И на питоне внедряют в продакшн, и на плюсах делаю резерч. Зависит от legacy и от конкретных алгоритмов. Одна контора, где я работала, имеет патент на drowsiness algorithm, написанный на чистом C вообще.
Сколько у вас займёт в одиночку написать deep learning модель для GPU с кастомной архитектурой на плюсах? Понятно, что раньше люди и перфокартами пользовались, но это ещё не значит, что это самый эффективный способ в наши дни.
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

Снежная Королева wrote: 18 Jan 2020 01:34 Можете не соглашаться, мое мнение противоположное. Machine learning research звучит красиво, но в подавляющем большинтсве - это просто phd students. В лучшем случае post doc. Многие вообще не знают статистику, да и программировать в продакшн не умеют.

Новые алгоритмы не означают лучшего value, наоборот, подавляющее большинство новых методов или проигрывают или uplift не стоит денег, потраченных на разработку и внедрение, по сравнению со старым методом.

Жизнь весьма далека от Kaggle competition.
Микрософт с вами не согласился и инвестировал 1 млрд долларов в OpenAI. Как Вы считаете - GPT2 стоит этих денег и принесёт value по сравнению с tf-idf?

Я кстати специально привел ссылку на решения, чтобы было видно, что качество кода там очень неплохое.
Last edited by Chessplayer on 18 Jan 2020 01:54, edited 1 time in total.
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

Снежная Королева wrote: 18 Jan 2020 01:51
Chessplayer wrote: 18 Jan 2020 00:55
Сколько у вас займёт в одиночку написать deep learning модель для GPU с кастомной архитектурой на плюсах? Понятно, что раньше люди и перфокартами пользовались, но это ещё не значит, что это самый эффективный способ в наши дни.
Там вообще не было image or CV, и deep learning не использовался.

Вы кроме deep learning что-то еще знаете?
Речь изначально шла про то на чём в наши дни делается ресерч в области ML. Основной прогресс сейчас происходит в deep learning и наиболее практично разрабатывать новые модели на питоне, поскольку есть необходимая инфраструктура, упрощающая этот процесс. Каггл собственно и заточен под то, чтобы генерировать новые идеи при помощи комьюнити и необязательно все они идут в продакшн. Кстати, например, XGBoost стали повсеместно применять только после того, как им стали выигрывать большинство табличных соревнований на каггле. То же самое произошло с UNet для сегментации картинок. Прогресс в Medical Imaging community тоже сильно ускорился благодаря Кагглу - посмотрите на пример Игловикова сверху. В прошлом году обкатали BERT и GPT2 NLP модели, сейчас идёт соревнование по Deepfake Detection с призовым фондом $1M, итд итп.

То что большинству бизнесов в наши дни нужен ETL и стандартные линейные модели вещь в общем-то понятная. Но никакой прогресс в этой области они не двигают, а готовые решения можно внедрять на любой, даже легаси, системе.
Last edited by Chessplayer on 18 Jan 2020 09:03, edited 2 times in total.
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

Снежная Королева wrote: 18 Jan 2020 01:49 У вас что, кроме CV, ничего на свете нет?
GPT2 и BERT - это, кстати, не CV. Есть ещё RL. В традиционном ML после XGBoost-a вроде ничего нового за последние 10+ лет не придумали?
StrangerR
Уже с Приветом
Posts: 37986
Joined: 14 Dec 2006 20:13
Location: USA

Re: Прикольная история

Post by StrangerR »

Sergunka wrote: 15 Jan 2020 21:22
Мальчик-Одуванчик wrote: 15 Jan 2020 21:17
Sergunka wrote: 15 Jan 2020 08:14 Так как терпила выйграл и взял деньги то был вынужден отдать свое ядро на рассмотрение...
А почему он терпила если выиграл деньги?
Его забанили на кегле и индуский стартап его уволили наскоряк. В уголовной иерархии больше подходит баклан, но это слишком тонко для данного ресурса :lol:
По мне, тут бакланом выступил стартап и кагль. А чувак выиграл у обоих.

А вообще я посмотрел.. кто то очень умный понял, что все равно там только методом _научного тыка_ можно двигаться, ну и устроил что то вроде эволюционного отбора на соревновании. А что, в целом то подход моделирует _природу_ - куча изменений, вдруг что то очень удачное - оно выживает и вытесняет остальных. Там тоже, берем кучу чайников и индусов, и на них тренируемся... в целом конечно все делают _случайные изменения_ (под разными научными соусами) но кому то повезет (скорее случайно) - и он вырвется, вот она и _эволюция_ . Природа таким макаром ажно человека изобрела, а тут какой то несчастный дип ленинг (распознание и прочее...). Я кстати и не знал что там такое активное бурление, хотя намеки были...
Last edited by StrangerR on 18 Jan 2020 09:56, edited 1 time in total.
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

StrangerR wrote: 18 Jan 2020 09:46 По мне, тут бакланом выступил стартап и кегль. А чувак выиграл у обоих.
Чувак довольно сильно подпортил себе репутацию. У него было имя в International Data Science Community, которое позволяло ему получать жирные контракты и предложения о работе. Также его постоянно приглашали выступать на конференциях. Теперь обо всем этом можно забыть, возможно, что и навсегда.
StrangerR
Уже с Приветом
Posts: 37986
Joined: 14 Dec 2006 20:13
Location: USA

Re: Прикольная история

Post by StrangerR »

Chessplayer wrote: 18 Jan 2020 09:55
StrangerR wrote: 18 Jan 2020 09:46 По мне, тут бакланом выступил стартап и кегль. А чувак выиграл у обоих.
Чувак довольно сильно подпортил себе репутацию. У него было имя в International Data Science Community, которое позволяло ему получать жирные контракты и предложения о работе. Также его постоянно приглашали выступать на конференциях. Теперь обо всем этом можно забыть, возможно, что и навсегда.
Гмм, подпорить можно то что есть. А у него не было ничего, он создал себе репутацию и заработал деньги, теперь может взять любовницу и ехать жить на острове с пляжем в свое удовольствие. Ну или еще где подвизаться. ВОт если бы он был реально _ученым_ а потом решил улучшить результат читингом тогда да. А так у него был нуль репутации и нуль денег, стал не нуль денег и нуль репутации. Или он реально что то делал а потом уже решил _угадывать_?
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

StrangerR wrote: 18 Jan 2020 09:58 Гмм, подпорить можно то что есть. А у него не было ничего, он создал себе репутацию и заработал деньги, теперь может взять любовницу и ехать жить на острове с пляжем в свое удовольствие. Ну или еще где подвизаться. ВОт если бы он был реально _ученым_ а потом решил улучшить результат читингом тогда да. А так у него был нуль репутации и нуль денег, стал не нуль денег и нуль репутации. Или он реально что то делал а потом уже решил _угадывать_?
Он реально не глупый чувак и думаю, что большинство соревнований от затащил честно. Читил он не из-за денег (они там были небольшие и они их вернули), а потому что хотел подняться на первое место в рейтинге (был на 2-3 месте).
User avatar
Sergunka
Уже с Приветом
Posts: 34124
Joined: 03 Dec 2000 10:01
Location: Vladivostok->San Francisco->Los Angeles->San Francisco

Re: Прикольная история

Post by Sergunka »

Chessplayer wrote: 18 Jan 2020 10:03
StrangerR wrote: 18 Jan 2020 09:58 Гмм, подпорить можно то что есть. А у него не было ничего, он создал себе репутацию и заработал деньги, теперь может взять любовницу и ехать жить на острове с пляжем в свое удовольствие. Ну или еще где подвизаться. ВОт если бы он был реально _ученым_ а потом решил улучшить результат читингом тогда да. А так у него был нуль репутации и нуль денег, стал не нуль денег и нуль репутации. Или он реально что то делал а потом уже решил _угадывать_?
Он реально не глупый чувак и думаю, что большинство соревнований от затащил честно. Читил он не из-за денег (они там были небольшие и они их вернули), а потому что хотел подняться на первое место в рейтинге (был на 2-3 месте).
Я не знал, что они вернули деньги. Глупо, что они код свой тогда дали. Когда играешь есть всегда соблазн каты противника подсмотреть :mrgreen: просто если подсмотрел и есть шанс, что всплывет лучше понятно выйгрыш не брать - остаться при своих.

Естественно это неприятный момент, что вся эта история всплыла и испортила атмосферу кегла прямо как допинговый скандал на олимпийских играх в Сочи :sadcry:
"A patriot must always be ready to defend his country against his government." Edward Abbey
User avatar
Sergunka
Уже с Приветом
Posts: 34124
Joined: 03 Dec 2000 10:01
Location: Vladivostok->San Francisco->Los Angeles->San Francisco

Re: Прикольная история

Post by Sergunka »

StrangerR wrote: 18 Jan 2020 09:46
Sergunka wrote: 15 Jan 2020 21:22
Мальчик-Одуванчик wrote: 15 Jan 2020 21:17
Sergunka wrote: 15 Jan 2020 08:14 Так как терпила выйграл и взял деньги то был вынужден отдать свое ядро на рассмотрение...
А почему он терпила если выиграл деньги?
Его забанили на кегле и индуский стартап его уволили наскоряк. В уголовной иерархии больше подходит баклан, но это слишком тонко для данного ресурса :lol:
По мне, тут бакланом выступил стартап и кагль. А чувак выиграл у обоих.
Ага - "а мы цап-цапрап" (с)
Мля, ну пряма развитой путинизм во всей красе :mrgreen:
"A patriot must always be ready to defend his country against his government." Edward Abbey
Andrey Strelnikov
Уже с Приветом
Posts: 607
Joined: 17 Dec 2009 11:27

Re: Прикольная история

Post by Andrey Strelnikov »

Снежная Королева wrote: 14 Jan 2020 23:57 Мужик из РФ выучил нейронные сети :)) и ушел ...
"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?

Я тоже сейчас изучаю нейронные сети. Самостоятельно. Есть мелкая задача по обработке медицинских снимков. Просто помощь хорошему человеку в докторской.

Но что потом делать с этими, если я не хочу -
1) уезжать из РФ
2) устраиваться куда-то на работу как сотрудник

Лет десять назад я изучил теорию по BI. Сделал все задачи по экзамену от MS. Сам этот экзамен не прошел. Переучил своих админов и сейчас они уже опытные BI-разработчики. Как команда работают на одного из крупнейших системных интеграторов. Профит.

Но вижу по опыту одной конторы - не идут у них проекты по DS и BD. Заказчики готовы взять людей только в штат.

Те они не нашли модель сотрудничества с заказчиком.

Я тоже хочу обучиться и обучить своих людей DS и BD. Но вот не понимаю что потом делать. Как на этом зарабатывать. Может в штатах эта модель вполне работает? В виде каких-то сервисов и тп.
Chessplayer
Уже с Приветом
Posts: 345
Joined: 27 Nov 2007 05:33

Re: Прикольная история

Post by Chessplayer »

Andrey Strelnikov wrote: 23 Jan 2020 11:13
Снежная Королева wrote: 14 Jan 2020 23:57 Мужик из РФ выучил нейронные сети :)) и ушел ...
"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?
Яндекс, Мэйл.ру, Мапбокс, Сбербанк, Интел, Пятёрочка и пр. думаете чем пользуются? Он сам работал удаленно на западные стартапы...
Andrey Strelnikov
Уже с Приветом
Posts: 607
Joined: 17 Dec 2009 11:27

Re: Прикольная история

Post by Andrey Strelnikov »

Chessplayer wrote: 24 Jan 2020 10:24
Andrey Strelnikov wrote: 23 Jan 2020 11:13
Снежная Королева wrote: 14 Jan 2020 23:57 Мужик из РФ выучил нейронные сети :)) и ушел ...
"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?
Яндекс, Мэйл.ру, Мапбокс, Сбербанк, Интел, Пятёрочка и пр. думаете чем пользуются? Он сам работал удаленно на западные стартапы...
Ну первый путь немного не то. я выше писал про команду у которой не пошло. Им просто никто не хотел давать данные и тд.
StrangerR
Уже с Приветом
Posts: 37986
Joined: 14 Dec 2006 20:13
Location: USA

Re: Прикольная история

Post by StrangerR »

Chessplayer wrote: 24 Jan 2020 10:24
Andrey Strelnikov wrote: 23 Jan 2020 11:13
Снежная Королева wrote: 14 Jan 2020 23:57 Мужик из РФ выучил нейронные сети :)) и ушел ...
"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?
Яндекс, Мэйл.ру, Мапбокс, Сбербанк, Интел, Пятёрочка и пр. думаете чем пользуются? Он сам работал удаленно на западные стартапы...
Плюс военные в количествах неслабых, скорее всего.
Andrey Strelnikov
Уже с Приветом
Posts: 607
Joined: 17 Dec 2009 11:27

Re: Прикольная история

Post by Andrey Strelnikov »

StrangerR wrote: 25 Jan 2020 07:11
Chessplayer wrote: 24 Jan 2020 10:24
Andrey Strelnikov wrote: 23 Jan 2020 11:13
Снежная Королева wrote: 14 Jan 2020 23:57 Мужик из РФ выучил нейронные сети :)) и ушел ...
"Доктор, у меня вопрос" - А что в России он думал делать с нейронными сетями?
Яндекс, Мэйл.ру, Мапбокс, Сбербанк, Интел, Пятёрочка и пр. думаете чем пользуются? Он сам работал удаленно на западные стартапы...
Плюс военные в количествах неслабых, скорее всего.
Ну мне-то это все неинтересно. Мне интересно как заработать находясь снаружи проходной. Ну в лучшем случае допустят к данным. Или к тестовым данным.
tessob
Уже с Приветом
Posts: 545
Joined: 07 Jan 2016 13:04

Re: Прикольная история

Post by tessob »

Andrey Strelnikov wrote: 27 Jan 2020 13:23Ну мне-то это все неинтересно. Мне интересно как заработать находясь снаружи проходной. Ну в лучшем случае допустят к данным. Или к тестовым данным.
Слушайте, весь интернет в Вашем распоряжении. Уверяю Вас, там еще тысячи возможностей для заработка, о которых пока никто и ничего не знает. Просто не понятно чего Вы ждете, никто к Вам не придет и не попросит создать еще один P&L отчет, это Вам нужно идти и говорить клиенту какое бизнес-валью несет Ваше решение. Оно же что-то несет, правильно?

Просто у большинства DS стартапов большая проблема -- они не знают, что несут кроме макбука и смузи. )))
Andrey Strelnikov
Уже с Приветом
Posts: 607
Joined: 17 Dec 2009 11:27

Re: Прикольная история

Post by Andrey Strelnikov »

tessob wrote: 28 Jan 2020 19:36
Andrey Strelnikov wrote: 27 Jan 2020 13:23Ну мне-то это все неинтересно. Мне интересно как заработать находясь снаружи проходной. Ну в лучшем случае допустят к данным. Или к тестовым данным.
Слушайте, весь интернет в Вашем распоряжении. Уверяю Вас, там еще тысячи возможностей для заработка, о которых пока никто и ничего не знает. Просто не понятно чего Вы ждете, никто к Вам не придет и не попросит создать еще один P&L отчет, это Вам нужно идти и говорить клиенту какое бизнес-валью несет Ваше решение. Оно же что-то несет, правильно?

Просто у большинства DS стартапов большая проблема -- они не знают, что несут кроме макбука и смузи. )))
В России в этой области беда в том что есть бюджеты. Но исполнитель и клиент пока не очень понимают что бы с этими бюджетами сделать :) Какое-то BI хоронилище строить и пристраивать научились. А вот как национальные проекты в области AI и BigData окучивать пока не научились...

Где бы почитать всяких задач и решений (бизнес-валью несет Ваше решение) в области например управления финансами области, страны с использованием BigData ?
или прочих задач госуправления и тп.
Lisa
Уже с Приветом
Posts: 3208
Joined: 25 Jul 2000 09:01

Re: Прикольная история

Post by Lisa »

Andrey Strelnikov wrote: 28 Jan 2020 20:40 Где бы почитать всяких задач и решений (бизнес-валью несет Ваше решение) в области например управления финансами области, страны с использованием BigData ?
или прочих задач госуправления и тп.
Подождите. Вы предлагаете компаниям технологии, но не знаете зачем они им могут быть нужны, кроме освоения бюджета?
Andrey Strelnikov
Уже с Приветом
Posts: 607
Joined: 17 Dec 2009 11:27

Re: Прикольная история

Post by Andrey Strelnikov »

Lisa wrote: 28 Jan 2020 20:51
Andrey Strelnikov wrote: 28 Jan 2020 20:40 Где бы почитать всяких задач и решений (бизнес-валью несет Ваше решение) в области например управления финансами области, страны с использованием BigData ?
или прочих задач госуправления и тп.
Подождите. Вы предлагаете компаниям технологии, но не знаете зачем они им могут быть нужны, кроме освоения бюджета?
Я изучаю Data Science чтобы в дальнейшем зарабатывать на этом. Понятно что если в штатах DS идет хорошо, то в России он тоже нужен. Но будущие клиенты и я не знают точно как:) Ситуация аналогична хранилищам данных.
Сделали людям хранилища , показали как пользоваться сводными табилцами. Теперь они сами могут придумать себе в excel кучу нужных отчетов. Это скопировано из разных источников а не придумано на месте.
Та же электронная почта пришла в российский бизнес только через несколько лет после Запада.

Те я ищу примеры различных отраслевых решений с помощью Data Science. Может какие-то примеры на стороне вендоров и тп.
tessob
Уже с Приветом
Posts: 545
Joined: 07 Jan 2016 13:04

Re: Прикольная история

Post by tessob »

Andrey Strelnikov wrote: 28 Jan 2020 20:40В России в этой области беда в том что есть бюджеты. Но исполнитель и клиент пока не очень понимают что бы с этими бюджетами сделать :) Какое-то BI хоронилище строить и пристраивать научились. А вот как национальные проекты в области AI и BigData окучивать пока не научились...

Где бы почитать всяких задач и решений (бизнес-валью несет Ваше решение) в области например управления финансами области, страны с использованием BigData ?
или прочих задач госуправления и тп.
С точки зрения РСБУ, НИОКР может иметь положительный экономический эффект или отрицательный. Вам, видимо, попросту нужно найти того человека у заказчика, который имеет офшорный счет и готов "разделить с вами успех". Никакие BigData & Artificial Intelligence вам вообще не нужны. Скорее вам нужен комплайнс консультант имеющий опыт работы в офшорных юрисдикциях. :wink:

Если же вы планируете именно продавать решения подобного класса, то в первую очередь это предполагает наличие у вас экспертов в некоторой доменной области, которые превосходят внутреннюю экспертизу у заказчика. Например, если вы знаете, что план счетов это еще и направленный циклический граф, который обладает многими свойствами Марковского процесса, и знаете как использовать это знание с пользой для вашего клиента, то проблем у вас не возникнет. Если же ваши дата-сатанисты не сильны в корпоративных финансах, то вам просто нужно найти то, в чем они сильны.

Return to “Работа и Карьера в IT”