Основы нейросетей
Константин Константинович Берлинский
Цель этой книги – максимально быстро научиться применять нейросети (НС) для решения задач. Вы научитесь: создавать и обучать НС; обрабатывать изображения, цифры и тексты; встраивать НС в реальное приложение через REST API; выбирать архитектуру НС: число слоев, нейронов, функции активации, оптимизаторы, коэффициенты скорости обучения, функции ошибки, эпохи, батчи; работать с НС на основе многослойного перцептрона, свёрточными и рекуррентными; и даже сделать НС без ML-библиотек на чистом C#!
1 Где можно поучиться AI?
Чтож. Теперь, когда пассивный доход от издания книг (это еще не сарказм) сделал избыточной работу в найме (а вот и он), приступаю ко 2-му этапу диджитал-трансформации.
Посоветуйте, где лучше поучиться AI, ML, нейронным сетям, обработке BigData, AR/VR, компьютерному зрению и всему такому. Самостоятельно изучать тему неэффективно – быстро выгораю, становится скучно, нужен надсмотрщик с плеткой.
Интересуют практические знания. Чтобы после курса уметь писать приложения вида PRISM или MSQRD. Ну или которые смогут отличить кошку от собаки, написать новую шутку или предсказать курс $ на неделю вперед.
В любом случае интересны проекты, основанные на легко доступных больших данных. Это данные в личном смартфоне (звонки, микрофон, геопозиция, камера), на своем ПК (файлы, почта, интересы), Интернет (вики, карты, анекдоты, ютуб, соцсети?), массовая литература. Какие еще открытые бигдата есть?
Что точно не интересно – делать проект, заточенный под данные или API определенной компании. Это телекомы, банки, логистика, магазины, интернет-холдинги или соцсети.
Бигдата у них, конечно, есть, но:
1) Фиг они ими поделятся (если это вообще законно – выдавать наружу данные, даже обезличенные).
2) Фиг они что-то у тебя купят. Как-то не принято это здесь. Да и бизнес-смысла в этом нет. Проще тупо украсть наработки, сделать свой велосипед или максимум предложить работу команде. Даже в случае успешного пилота с корпорацией это довольно слабая переговорная позиция – когда данные у компании, а у тебя лишь обученная на их основе нейросеть (алгоритм обработки данных) и проведенный кастдев. Они без тебя жить смогут, а ты без них нет.
Есть конечно кейс – знать, что нужно большой компании, сделать это на стороне и продать наработки компании. Бобук говорил, что он так сделал механизм распознавания людей на фотках и продал это VK/OK. Им это нужно чтобы автоматически тэгать людей. Это повышает вовлечение юзеров и время зависания на сайте. Но это скользкий путь:
1) Неясно, что нужно корпам.
2) Не факт, что они прямо сейчас не делают такую штуку.
3) Не факт, что эту штуку сможешь сделать ты.
4) Не факт, что готовое решение купит корп. Они любят тянуть время (приходите через год, на сегодня все бюджеты освоены).
Думаю, по деньгам у Григория получилось так. Команда 5 чел, ЗП 4 тыс $/мес, делать такую штуку ~10 мес. Себестоимость 200 тыс $. Продать корпорации с премией 3-5х можно за 0.6-1 млн $.
Какие курсы по data science и нейронным сетям нагуглил и рассматриваю:
1) Машинное обучение и анализ данных – Яндекс, МФТИ, Курсера, 5500 руб/мес, 250 часов.
2) Data science – SkillFactory, 120 тыс руб, 12 мес.
3) Data scientist – Нетология, 200 тыс руб, 8 мес.
4) Введение в машинное обучение – Яндекс, ВШЭ, Курсера, бесплатно, 35 часов.
5) Introduction to Machine Learning – Google, бесплатно, 15 часов.
https://developers.google.com/machine-learning/crash-course (https://developers.google.com/machine-learning/crash-course)
6) Ваш вариант?
Месяца 4 назад начинал проходить курс #5 от Гугл, но через 2 недели бросил. Все-таки, мне нужен кто-то, кто будет пинать и мотивировать продолжать обучение.
Что посоветуете?
Источник фото (https://ru.m.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D0%BB:AI-ML-DL.png)
Источник фото (https://commons.wikimedia.org/wiki/File:Artificial_neural_network_image_recognition.png)
Источник фото (https://en.wikipedia.org/wiki/File:Ai_integration.jpg)
Также, см. https://en.wikipedia.org/wiki/Applications_of_artificial_intelligence (https://en.wikipedia.org/wiki/Applications_of_artificial_intelligence)
Источник фото (https://ru.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D0%BB:Gartner_Hype_Cycle_for_Emerging_Technologies.gif)
2 Венчурная аналитика AI-проектов
Насчет выбора курса по AI (см. предыдущий пост). При выборе темы учебного проекта, думаю, стоит ориентироваться на AI-проекты, получившие инвестиции в последнее время. Ниже последние AI-проекты ФРИИ, YC, 500 Startups и TechStars.
Т.к. дальше будет лонгрид и много описаний проектов, вынесу наверх мысли насчет проектов YC:
1) США новый Вавилон. В последнем наборе Summer 2019 – 175 компаний 27 стран. США, Европа, Азия, ЛатАм, даже Африка. России нет, но есть Украина. Никаких других центров стартапов как-будто нет.
2) Идея брать 7% за $120К от 175 потенциально прорывных компаний каждые полгода может быть невероятно прибыльной. Чисто по статистике 3-5 единорогов у них получится. Похоже, у YC нет никаких проблем со сбором $$$ на финансирование очередного набора фонда. Возможно в РФ с венчуром проблема не в рынке, недостатке инвесторах, политике и др, а тупо просто нет столько людей-предпринимателей кто хочет сделать свой проект.
3) Похоже, венчур в России в глубокой ж. 11 vs 175 стартапов (ФРИИ vs YC) в последнем наборе. Много стартапов во ФРИИ – унылые локальные проекты без полета фантазии, которые никогда не выйдут на внешний рынок и не станут единорогами. Онлайн ГИБДД, Помощник в исполнении 149-ФЗ по безопасности данных, оборудование для соляных пещер :-( Зачем это вообще?
4) Очень крутые проекты YC с миллионной выручкой, понятной бизнес-моделью, не боятся испачкать руки. Многие проекты для узкой аудитории – мигранты-айтишники, венесуэльцы, наркоманы, женщины, секс-фетишисты, гики.
5) В YC классные описания проектов. В одном абзаце донесена суть, главные цифры, команда, перспективы. Можно за час прочитать описание всех 175 проектов в наборе и принять инвестиционное решение.
6) AI не волшебная пилюля. Во многих проектах AI упомянута только для галочки. Весь цимес в хорошем удовлетворении реального спроса, бизнес-модели и перспективах (растущие тренды, взрывной рост какой-либо характеристики 1-10 тыс раз).
7) Главное в стартапах YC – бабло, а не красивая идея или хайповый набор технологий. Клеить танчики умеют многие, важно осознанно и к месту их клеить.
8) Блин, какие они крутые! Проекты по продаже марихуаны через дроны, создание новых лекарств, VR для хирургов, запись инфо в ДНК, запуск орбитальных спутников – легко. Начитались, твари, Жюль Верна, никаких тормозов! Походу Илон Маск там еще не самый упоротый :-)
Итак, AI-проекты ведущих акселераторов.
1) ФРИИ набор #19, 3 Октября 2019 (11 проектов):
https://www.iidf.ru/media/articles/accelerator/19-nabor-akseleratora/ (https://www.iidf.ru/media/articles/accelerator/19-nabor-akseleratora/)
Leveli.ng (Казань) – AI-сервис для автоматизации работы с отзывами пользователей в интернете. Сервис автоматически обрабатывает, генерирует и публикует ответы на отзывы по разным сценариям: нивелирование негатива, нейтрализация отзыва, работа с постоянными клиентами.
2) ФРИИ набор #18, 1 Июля 2019 (19 проектов):
https://www.iidf.ru/media/articles/accelerator/v-18-nabor-akseleratora/ (https://www.iidf.ru/media/articles/accelerator/v-18-nabor-akseleratora/)
Clover Group (Москва) – разработчик решений в области прогнозного обслуживания для промышленных предприятий с применением технологий искусственного интеллекта, машинного обучения и предиктивной аналитики.