Перед тим як почати


  • Використовуйте RStudio для створення та запуску програм R.
  • Використовуйте install.packages() для встановлення пакетів (бібліотек).

Введення до R


  • Access individual values by location using [].
  • Access arbitrary sets of data using [c(...)].
  • Use logical operations and logical vectors to access subsets of data.

Починаємо з даних


  • Використовуйте read_csv для читання табличних даних у R.
  • Використовуйте фактори для представлення категоріальних даних у R.

Маніпулювання даними за допомогою пакету dplyr


  • Use the dplyr package to manipulate dataframes.
  • Use select() to choose variables from a dataframe.
  • Use filter() to choose data based on values.
  • Use group_by() and summarize() to work with subsets of data.
  • Use mutate() to create new variables.

Маніпулювання даними за допомогою пакету tidyr


  • Використовуйте пакет tidyr, щоб змінювати структуру датафреймів.
  • Використовуйте pivot_width() для переходу від довгого до широкого формату.
  • Використовуйте pivot_longer() для переходу від широкого до довгого формату.

Візуалізація даних за допомогою ggplot2


  • ggplot2 є гнучким та корисним інструментом для створення графіків у R.
  • Набір даних і систему координат можна визначити за допомогою функції ggplot.
  • Додаткові шари, включно з geoms, додаються за допомогою оператора +.
  • Boxplot (коробковий графік) корисний для візуалізації розподілу числової змінної.
  • Barplot (стовпчастий графік) зручний для візуалізації категоріальних даних.
  • Faceting (фасетування) дозволяє створювати кілька графіків на основі категоріальної змінної.

Getting started with R Markdown (Optional)


  • R Markdown is a useful language for creating reproducible documents combining text and executable R-code.
  • Specify chunk options to control formatting of the output document

Обробка даних JSON (необов'язково)


  • JSON is a popular data format for transferring data used by a great many Web based APIs
  • The complex structure of a JSON document means that it cannot easily be ‘flattened’ into tabular data
  • We can use R code to extract values of interest and place them in a csv file