- PVSM.RU - https://www.pvsm.ru -

Хабр посоветуй: как выиграть олимпиаду НТИ для школьников по профилю «Большие данные»

image

Когда я сдавал экзамены в универе, я всегда садился готовиться на ближайшую к преподу парту и никогда не шел первым, а пропускал вперед 8-10 человек. Тем самым я успевал «подслушать» дополнительные вопросы и, частично, ответы на них.

И тут у меня возникла идея, как сделать подсказки по олимпиаде для тех старшеклассников, которые читают Хабр (что говорит о том, что у них действительно продвинутые мозги [1]). Я нашел тех ребят, которые показали отличные результаты на предыдущих олимпиадах НТИ и поспрашивал их, какие дополнительные материалы могут помочь разобраться в теме лучше и дадут дополнительные преимущества на завершающем практическом этапе.

Прием заявок на олимпиаду идет до 22 октября [2], а там есть еще время подготовиться.

Коротко про олимпиаду НТИ

Группа студентов посмотрели на то, что у нас твориться с образованием и решили приложить усилия, чтобы это исправить. Что творится? А то, что родители многих школьников не разрешают в гараже строить беспилотник или ходить на курсы по построению спутников, «потому что надо сдавать ЕГЭ». Так вот, наши инициативные товарищи решили создать движуху, что талантливые школьники смогут получать баллы за ЕГЭ и поступать в вузы не при помощи тестов, а поработав руками и головой. И теперь у школьников есть отмазка, зачем он кошке всверлил в мозг [1] электроды — «к олимпиаде готовлюсь».

Я считаю, что это важно и достойно. Да и к олимпиадам отношусь с уважением.

Мои отчеты, как проходила олимпиада в 2016 году

Сами организаторы олимпиады вот что пишут про требования к знаниям и умениям участников:

  • понимание основных концепций в области машинного обучения и нейросетей;
  • программирование на языках, сочетающих скорость разработки с возможностью использовать современные инструменты для работы с данными (например Python);
  • умение быстро находить решения, разбираться в них и адаптировать под свои потребности в интернете на специализированных ресурсах (stackexchange и пр.);
  • умение эффективно работать с большими данными, писать алгоритмы эффективно; умение вести тестирование, отладку;

А вот рекомендуемые «официальные материалы для подготовки»:

Как происходит олимпиада по «Большим данным»:

image

Во время проведения заключительного этапа финалисты работают над выявлением заданной информации из массивы данных, для этого участникам необходимо написать свою программу, используя набор текстов для обучение. Рабочее место — стол, ноутбук, подключенный к интернету.

image

Команда работает в режиме “каждый за своим ноутбуком”, время от времени обсуждая что-то друг с другом. Для проверки заданий ведущий запускает программу команды-участницы с набором случайных текстов и оценивает результат анализа данных.

Советы «бывалых»

Анонимус1111 советует.

Чтобы затащить конкретно последний этап в «машинке», то что-то вот такое:

Но для того, чтобы понять, что мужик говорит:

Анонимус2222 советует.

Общие рекомендации:

  • начинать не с нейронных сетей, а с более простых методов
  • играть с реальными данными
  • использовать Python в Jupyter Notebook

Конкретные ресурсы:

Анонимус3333 рекомендует.

О нейронках.

О tensorflow.

Простой математический курс о машинном обучении с векторами, тервером и базовым алгоритмам.

Совет от меня лично.
Надо всеми силами постараться дружить с проектом GoTo [30], потому что там есть и качественные курсы и преподаватели, которые готовы всегда отвечать на вопросы и тусить с учениками в Яндексе по выходным. Для самых хитрых есть гранты [31]. На крайний случай, можно вступить в группу в ВК [32] и у всех спрашивать советы.

Что бы вы посоветовали старшеклассникам, чтобы они повысили свой скилл в области Больших данных?

Автор: MagisterLudi

Источник [33]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/big-data/265506

Ссылки в тексте:

[1] мозги: http://www.braintools.ru

[2] Прием заявок на олимпиаду идет до 22 октября: http://nti-contest.ru/

[3] Всероссийская инженерная олимпиада для старшеклассников: Космические системы: https://geektimes.ru/post/276432/

[4] Всероссийская инженерная олимпиада для старшеклассников: BigData и Интеллектуальные энергетические системы: https://habrahabr.ru/post/283430/

[5] Задачи за 2015/16 учебный год: http://nti-contest.ru/wp-content/uploads/7-%D0%91%D0%94.pdf

[6] Задания всех этапов профиля «Большие данные и машинное обучение» 2017: https://drive.google.com/file/d/0B0X30BfOmpvzMnBMeUhhSEN5RjA/view

[7] Подготовка к Олимпиаде НТИ (на основе задач 2015/16 года): https://stepik.org/course/1296/

[8] Программирование на Python : https://stepik.org/course/67/

[9] Алгоритмы: теория и практика. Методы: https://stepik.org/course/217/

[10] Дискретные структуры: https://stepik.org/course/83/

[11] Основы статистики: https://stepik.org/course/76/

[12] Теория вероятностей для начинающих: https://www.coursera.org/learn/probability-theory-basics

[13] «Обучение на размеченных данных»: https://www.coursera.org/learn/supervised-learning

[14] «Введение в машинное обучение»: https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie

[15] «Поиск структуры в данных»: https://www.coursera.org/learn/unsupervised-learning

[16] Нужно уметь в jupyter *это прямо вообще плюс*: http://devpractice.ru/python-lesson-6-work-in-jupyter-notebook/

[17] Вот тут за 13 минут можно хотя бы понять что да как: https://www.coursera.org/learn/bioinformatika

[18] Нужно хорошо уметь в sklearn, numpy: https://www.coursera.org/learn/python-machine-learning

[19] Введение: https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471

[20] Стандартный курс: https://www.coursera.org/learn/machine-learning

[21] Стандартная библиотека: http://scikit-learn.org/stable/tutorial/

[22] И книга по ней: http://shop.oreilly.com/product/0636920030515.do

[23] Вводная задача: https://www.kaggle.com/c/titanic

[24] Как работает внутри: https://github.com/eriklindernoren/ML-From-Scratch

[25] Сборник ссылок: https://unsupervisedmethods.com/over-150-of-the-best-machine-learning-nlp-and-python-tutorials-ive-found-ffce2939bd78

[26] Журнал: https://distill.pub/

[27] Hacker's guide to Neural Networks: http://karpathy.github.io/neuralnets/

[28] Understanding LSTM Networks: http://colah.github.io/posts/2015-08-Understanding-LSTMs/

[29] Канал: https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A

[30] GoTo: https://goto.msk.ru/

[31] гранты: https://goto.msk.ru/camp_autumn/grants/

[32] группу в ВК: https://vk.com/goto_msk

[33] Источник: https://habrahabr.ru/post/339050/