- PVSM.RU - https://www.pvsm.ru -

Что почитать и посмотреть для старта в Data Science: книги, словари и курсы

Подборка ресурсов по математике, статистике и программированию для начинающих Дата Сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.

Технический английский

Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.

Что почитать и посмотреть для старта в Data Science: книги, словари и курсы - 1
Cambridge Dictionary

Математика

В первую очередь научитесь быстро осваивать любые математические концепции. В этом поможет обучающий ролик How to Learn Mathematics Fast
Прокачайте математическое мышление [4] и изучите:

Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature [10].

Дополнительная теория и практика по математике

Освежить в памяти базовые понятия математики помогут следующие ресурсы:

Что почитать и посмотреть для старта в Data Science: книги, словари и курсы - 2
Курс «Теория вероятностей» на Coursera

Задание со звездочкой. Чтобы еще больше прокачать знания по матричной алгебре, пройдите сложный курс Linear Algebra [18] от MIT.

Статистика

Для обучения на курсе Нетологии Data Scientist, достаточно базовых знаний статистики. Их можно получить из раздела Statistics and probability [19] в «Академии Хана». Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master [20]. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.
Что почитать и посмотреть для старта в Data Science: книги, словари и курсы - 3 [21]
Курс Data Scientist в Нетологии

Задание со звездочкой. Дополнительно стоит пройти курс Statistics for Applications [22] от MIT, но для этого нужно понимать:

  • что такое выборка и генеральная совокупность;
  • меры центральной тенденции и изменчивости;
  • сравнение средних.

Программирование

Студенты курса Data Scientist пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:

Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для анализа данных».
Что почитать и посмотреть для старта в Data Science: книги, словари и курсы - 4 [28]

Базы данных

Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса [29] от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:

Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».
Что почитать и посмотреть для старта в Data Science: книги, словари и курсы - 5 [37]

Резюмируем: ключевые рекомендации

  • Если вы планируете освоить профессию Data Scientist на курсах, прокачайте технический английский. Это понадобится для изучения дополнительных материалов и документации.
  • Изучите или освежите в памяти основы математики, статистики, Python и SQL.
  • Читайте гайды, смотрите обучающие лекции и выполняйте практические задания для закрепления информации.

Автор: blognetology

Источник [38]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/python/329755

Ссылки в тексте:

[1] Cambridge Dictionary: https://dictionary.cambridge.org/ru/

[2] Подборка аббревиатур: https://www.datasciencecentral.com/profiles/blogs/acronyms-of-big-data-analytics-from-a-to-z

[3] Словарь терминов: http://www.sldonline.ru/article/slovar-sovremennykh-terminov-data-science-i-mashinnogo-obucheniia/

[4] мышление: http://www.braintools.ru

[5] Introduction to Mathematical Thinking: https://www.amazon.com/Introduction-Mathematical-Thinking-Keith-Devlin/dp/0615653634/ref=as_li_ss_tl?ie=UTF8&linkCode=sl1&tag=chrisalbon-20&linkId=1ad40fdc98aca9e7d32f2c3d183f65d0

[6] How to Develop a Mindset for Math: https://betterexplained.com/articles/how-to-develop-a-mindset-for-math/

[7] Learning to Learn: Math Abstraction: https://betterexplained.com/articles/learning-to-learn-math-abstraction/

[8] How do math geniuses understand extremely hard math concepts so quickly?: https://www.quora.com/How-do-math-geniuses-understand-extremely-hard-math-concepts-so-quickly

[9] What is conceptual understanding?: https://www.maa.org/external_archive/devlin/devlin_09_07.html

[10] Mathematics: the language of nature: http://www.worldscienceu.com/courses/master_class/master-class-edward-frenkel

[11] урок Derivatives introduction: https://www.khanacademy.org/math/old-ap-calculus-ab/ab-derivative-intro

[12] курс по линейной алгебре: https://www.coursera.org/learn/algebra-lineynaya

[13] уроки Vectors: https://www.khanacademy.org/math/precalculus-2018/vectors-precalc

[14] уроки из раздела Matrices: https://www.khanacademy.org/math/precalculus-2018/precalc-matrices

[15] задания из раздела Trigonometry: https://www.khanacademy.org/math/trigonometry

[16] курс по теории вероятности: https://www.coursera.org/learn/probability-theory-basics

[17] задания из раздела Probability: https://www.khanacademy.org/math/probability/probability-geometry

[18] Linear Algebra: https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/

[19] раздела Statistics and probability: https://www.khanacademy.org/math/statistics-probability

[20] The 10 Statistical Techniques Data Scientists Need to Master: https://medium.com/cracking-the-data-science-interview/the-10-statistical-techniques-data-scientists-need-to-master-1ef6dbd531f7

[21] Image: https://netology.ru/programs/data-scientist?utm_source=blog&utm_medium=1492&utm_campaign=bds_ds_ou_habr_11092019resursy_ds

[22] курс Statistics for Applications: https://ocw.mit.edu/courses/mathematics/18-650-statistics-for-applications-fall-2016/

[23] Beginner Python3 Tutorials: https://www.udemy.com/course/beginner-python3-tutorials/

[24] Learning Python: From Zero to Hero: https://www.freecodecamp.org/news/learning-python-from-zero-to-hero-120ea540b567/

[25] Google's Python Class: https://developers.google.com/edu/python/

[26] Pythontutor: http://pythontutor.ru/

[27] обзор библиотеки Pandas: https://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html

[28] Image: https://netology.ru/programs/python-for-analytics?utm_source=blog&utm_medium=1492&utm_campaign=bds_pydp_ou_habr_11092019resursy_ds

[29] курса по основам анализа данных для бизнеса: https://www.coursera.org/learn/data-analytics-business

[30] SQL Exercises: https://en.wikibooks.org/wiki/SQL_Exercises

[31] SQL Movie-Rating Query Exercises;: https://lagunita.stanford.edu/courses/DB/SQL/SelfPaced/courseware/ch-sql/seq-exercise-sql_movie_query_core/

[32] SQL Movie-Rating Query Exercises Extras;: https://lagunita.stanford.edu/courses/DB/SQL/SelfPaced/courseware/ch-sql/seq-exercise-sql_movie_query_extra/

[33] SQL Social-Network Query Exercises;: https://lagunita.stanford.edu/courses/DB/SQL/SelfPaced/courseware/ch-sql/seq-exercise-sql_social_query_core/

[34] SQL Social-Network Query Exercises Extras;: https://lagunita.stanford.edu/courses/DB/SQL/SelfPaced/courseware/ch-sql/seq-exercise-sql_social_query_extra/

[35] SQL Movie-Rating Modification Exercises;: https://lagunita.stanford.edu/courses/DB/SQL/SelfPaced/courseware/ch-sql/seq-exercise-sql_movie_mod/

[36] SQL Social-Network Modification Exercises: https://lagunita.stanford.edu/courses/DB/SQL/SelfPaced/courseware/ch-sql/seq-exercise-sql_social_mod/

[37] Image: https://netology.ru/programs/sql-lessons?utm_source=blog&utm_medium=1492&utm_campaign=bds_sql_ou_habr_11092019resursy_ds

[38] Источник: https://habr.com/ru/post/467011/?utm_source=habrahabr&utm_medium=rss&utm_campaign=467011