Instructor Notes
Набір даних
Дані, використані в цьому уроці, — це трохи очищена версія результатів опитування SAFI, доступна на GitHub. Оригінальні дані знаходяться на figshare.
У цьому уроці використовується SAFI_clean.csv. Пряме
посилання для завантаження файлу даних: https://raw.githubusercontent.com/datacarpentry/r-socialsci/main/episodes/data/SAFI_clean.csv.
Плани уроків
Урок містить значно більше матеріалу, ніж можна охопити за один день. Інструкторам потрібно обрати відповідну підмножину епізодів для стандартного одноденного курсу.
Рекомендований план для курсу на пів дня:
- Перед тим як почати
- Введення до R
- Починаємо з даних
Пропонований шлях для повноцінного курсу:
- Перед тим як почати
- Введення до R
- Починаємо з даних
- Маніпулювання даними за допомогою пакету dplyr
- (ДОДАТКОВО) Маніпулювання даними за допомогою пакету tidyr
- Візуалізація даних за допомогою ggplot2
Для дводенного семінару можливо охопити всі епізоди. Зворотний зв’язок від спільноти щодо успішних планів уроків завжди цінний!
Технічні поради та рекомендації
Покажіть, як використовувати кнопку «Zoom», щоб збільшувати графіки без постійної зміни розміру вікон.
Іноді пакет не встановлюється. Ви можете спробувати інше дзеркало CRAN:
- Tools > Global Options > Packages > CRAN Mirror
Або можна завантажити пакет з CRAN і встановити його з ZIP-файлу:
- Tools > Install Packages > встановити ‘from Zip/TAR’
Часто легше переконатися, що всі потрібні пакети встановлені одразу, ніж постійно розв’язувати ці проблеми. Дивіться розділ “Setup instructions (Інструкції з налаштування)” на головній сторінці курсу для інструкцій зі встановлення пакетів.
| символ на іспанських клавіатурах: на
іспанській клавіатурі Mac немає клавіші |. Цей символ можна
створити за допомогою:
`alt` + `1`
Інші ресурси
Якщо під час семінару у вас виникнуть проблеми, не соромтеся звертатися до підтримки електронною поштою або відкривати issue.
Для глибшого вивчення тем семінару можна прочитати книгу “R for Data Science” авторів Хедлі Вікем (Hadley Wickham) та Гаррета Гролемунда (Garrett Grolemund).
Перед тим як почати
Instructor Note
- Основна мета цього епізоду - допомогти слухачам комфортно почуватися під час користування інтерфейсом RStudio.
- У епізоді “Початкове налаштування” виконуйте усі етапи дуже
повільно. Переконайтеся, що всі учасники встигають за ходом заняття
(нагадайте їм користуватися наліпками для зворотного зв’язку). На цьому
етапі домовтеся з помічниками, щоб вони ходили по аудиторії та
допомагали учасникам. Дуже важливо впевнитися, що всі працюють у
правильному робочому каталозі та створили підкаталог
data(усі літери малі).
Введення до R
Instructor Note
- Основна мета - познайомити користувачів з різними об’єктами в R, від елементарних типів до створення власних об’єктів.
- Хоча цей розділ є базовим, будьте обережні, щоб не “загрузнути в деталях”, адже різноманіття типів і операцій може бути надто складним для новачків — особливо до того, як вони зрозуміють, як усе це вписується у їх власний “робочий процес”.
Починаємо з даних
Instructor Note
Дві основні цілі цих уроків:
- Переконатися, що учасники впевнено працюють із датафреймом і можуть використовувати дужки для вибору рядків і стовпців.
- Виставити учнів як фактори. Їхня поведінка не завжди інтуїтивно зрозуміла, тому важливо, щоб учасників супроводжували під час роботи з ними вперше. The content of the lesson should be enough for learners to avoid common mistakes with them.
Маніпулювання даними за допомогою пакету dplyr
Instructor Note
- Цей урок буде зрозумілішим, якщо використовувати графіки, які наочно демонструють роботу команд dplyr. Ви можете змінити цю презентацію Google Slides та використати для свого семінару.
- Для цього уроку переконайтеся, що учні впевнено користуються оператором pipe (%>%).
- Також іноді виникає деяка плутанина щодо того, якими мають бути
аргументи
group_by, а також коли використовуватиfilter ()таselect ().
Маніпулювання даними за допомогою пакету tidyr
Візуалізація даних за допомогою ggplot2
Instructor Note
- Цей епізод є загальним оглядом ggplot2 і зосереджується на: (1) ознайомленні з системою шарів у ggplot2, (2) використанні аргументу group у функції aes(), (3) базовому налаштуванні графіків.
- Епізод залежить від даних, створених в епізоді “Маніпулювання даними за допомогою tidyr”. Якщо ви не дійшли або не пройшли увесь епізод про tidyr, ви можете надати учасникам доступ до даних, завантаживши їх або швидко створивши за допомогою наведеного нижче коду tidyr. Ймовірно, ви захочете скопіювати код в Etherpad.
- Якщо ви пропустили епізод про tidyr, ви можете перейти до розділу експорт даних у тому епізоді.
Getting started with R Markdown (Optional)
Instructor Note
- This is an optional lesson intended to introduce learners to R Markdown.
- While it is listed after the core lessons, some instructors may prefer to teach it early in the workshop, depending on the audience.
Обробка даних JSON (необов'язково)
Instructor Note
- Цей урок необов’язковий і призначений для ознайомлення з даними у форматі JSON, зокрема з тим, як зчитувати JSON у R та конвертувати ці дані у датафрейм або масив.
- Зауважте, що урок був створений спільнотою і досі знаходиться у процесі доопрацювання. Тому він може покращитися завдяки відгукам викладачів та/або учасників семінару.