Статьи

Як швидко вивчити Python для аналізу даних

У відгуках на курс "Програмування глибоких нейронних мереж на Python" деякі пишуть, що курс хороший, але вони не знають Python. Насправді Python дуже просту мову, його цілком можна вивчити самостійно. Крім того, зараз Python стає найбільш популярною мовою для аналізу даних. Тому дуже бажано його вивчити, якщо ви хочете аналізувати дані.

У цій статті я розповім про чотири ресурсах, за допомогою яких можна швидко вивчити Python для цілей аналізу даних. Всі ресурси відрізняє практичний підхід: короткі і зрозумілі теоретичні лекції та багато практичних завдань.

  • сайт pythontutor.ru . Відмінний ресурс для початківців вивчати Python і програмування в цілому. Я використовую цей сайт для занять зі школярами. На сайті є уроки з базових тем: введення-виведення, оператори (if, for, while), функції та структури даних (списки, множини, словники). Всі матеріали російською мовою.

    Основна перевага сайту - визуализатор, який дозволяє запускати і налагоджувати програми на Python прямо в браузері.

    Основна перевага сайту - визуализатор, який дозволяє запускати і налагоджувати програми на Python прямо в браузері

    По кожній темі є багато завдань, які можна вирішувати в візуалізаторі. Рішення перевіряються автоматично.

    При всьому різноманітті можливостей, істотний недолік сайту - дуже обмежений набір навчальних матеріалів. Немає нічого про роботу з файлами, виключення, об'єктно-орієнтоване програмування.

  • Мобільний додаток SoloLearn "Вчимо Python". компанія SoloLearn робить цікаві навчальні курси з різних мов і технологій програмування, в тому числі і по Python. На відміну від pythontutor.ru, курси SoloLearn можна вивчати через зручний мобільний додаток.

    Тим набагато більше, ніж в pythontutor.ru: є файли, виключення, об'єктно-орієнтоване і функціональне програмування. Заняття розбиті на невеликі теми, по кожній темі є теоретичний матеріал (як правило, поміщається на один екран) і практичне завдання. Є інтерпретатор, який дозволяє запустити код Python прямо на смартфоні. Інтерпретатор не надто зручний, але для коротких навчальних задачок цілком підходить.

    Важливе значення - курс по Python є російською мовою.

    Мобільний додаток зручно для тих, хто вже знає будь-якої мова програмування. Можна швидко познайомитися з основними особливостями Python, навіть якщо ви перебуваєте далеко від комп'ютера. Але я не впевнений, що за допомогою цієї програми можна вивчити Python з нуля. Починати краще з pythontutor.ru, і після вивчення основ переходити до додатка SoloLearn.

    Крім мобільного додатка є і Web-версія курсу .

  • Курс Udacity " Anaconda and Jupyter Notebooks ". Короткий курс по інструментах Python, дуже корисним для аналізу даних.

    Anaconda - дистрибутив Python з великою кількістю пакетів для аналізу даних. В курсі розглядається, як працювати з цим дистрибутивом, як використовувати менеджер пакетів conda (саме цим менеджером пакетів зручно встановлювати Theano і Keras для виконання практик по курсу "Програмування глибоких нейронних мереж на Python" ), Як застосовувати оточення (environment) для установки різного набору пакетів, необхідних в різних проектів, без конфліктів.

    Jupyter Notebook - це Web-додаток, що дозволяє писати код на Python та іншими мовами в браузері. При цьому результати роботи програми, в тому числі і візуалізація, показуються також в браузері. Дуже зручно для інтерактивного аналізу даних.

    У програму можна робити вставки на Markdown, в яких пояснюється, що відбувається. Через це файли стають більш зрозумілими. Особливо приємно, що можна писати математичні формули, використовуючи нотацію TeX.

    Орієнтовний час вивчення курсу 2-3 години (включно з виконанням практичних завдань).

    Мова курсу англійська.

  • Курс Udacity " Intro to Data Analysis ". Це вступний курс, на якому розглядаються різні стадії аналізу даних і їх призначення. Як інструмент використовується Python. Крім чистого Python, розглядається застосування бібліотеки ефективних обчислень NumPy і бібліотеки аналізу даних Pandas . Обидві ці бібліотеки часто використовуються в практичній роботі при аналізі даних.

    Цей курс складніше попередніх, але і значно цікавіше. Замість навчальних завдань ви будете аналізувати реальні дані про навчання студентів Udacity (час роботи на сайті, успішна і неуспішна здача проектів і т.п.). Будуть надані приклади і заготовки програм на Python, які потрібно буде змінити, щоб вирішити завдання, поставлене в курсі. Працювати можна в Jupyter Notebook або в редакторі Python на сайті Udacity. Виконання завдань перевіряється автоматично.

    Виконання завдань перевіряється автоматично

    Цей курс варто починати тільки після того, як ви розберетеся з основами Python. В курсі пояснюються деякі просунуті концепції Python, а також особливості внутрішнього устрою і роботи бібліотек NumPy і Pandas. Також даються посилання на зовнішні ресурси з описом особливостей Python, які будуть корисні для вирішення поточної задачі. Але без базових знань Python все одно не обійтися.

    Курс, як і попередній від Udacity, тільки на англійській мові.

    Час виконання сильно залежить від того, які у вас базові навички Python і програмування в цілому. Він декількох днів до місяця.

Ресурсів з навчальними курсами по Python дуже багато. Я описав тільки чотири, щоб можна було швидше розібратися з Python і перейти до вивчення роботи нейронних мереж і експериментів з ними . Якщо ви знаєте ще корисні ресурси, які допомагають швидко вивчити Python саме для цілей аналізу даних, то напишіть про них у коментарях!

Новости