R для соціологів
- Використовуйте RStudio для створення та запуску програм R.
- Використовуйте
install.packages() для встановлення
пакетів (бібліотек).
- Access individual values by location using
[].
- Access arbitrary sets of data using
[c(...)].
- Use logical operations and logical vectors to access subsets of
data.
- Використовуйте read_csv для читання табличних даних у R.
- Використовуйте фактори для представлення категоріальних даних у
R.
- Use the
dplyr package to manipulate dataframes.
- Use
select() to choose variables from a dataframe.
- Use
filter() to choose data based on values.
- Use
group_by() and summarize() to work
with subsets of data.
- Use
mutate() to create new variables.
- Використовуйте пакет
tidyr, щоб змінювати структуру
датафреймів.
- Використовуйте
pivot_width() для переходу від довгого
до широкого формату.
- Використовуйте
pivot_longer() для переходу від широкого
до довгого формату.
-
ggplot2 є гнучким та корисним інструментом для
створення графіків у R.
- Набір даних і систему координат можна визначити за допомогою функції
ggplot.
- Додаткові шари, включно з geoms, додаються за допомогою оператора
+.
- Boxplot (коробковий графік) корисний для візуалізації розподілу
числової змінної.
- Barplot (стовпчастий графік) зручний для візуалізації категоріальних
даних.
- Faceting (фасетування) дозволяє створювати кілька графіків на основі
категоріальної змінної.
- R Markdown is a useful language for creating reproducible documents
combining text and executable R-code.
- Specify chunk options to control formatting of the output
document
- JSON is a popular data format for transferring data used by a great
many Web based APIs
- The complex structure of a JSON document means that it cannot easily
be ‘flattened’ into tabular data
- We can use R code to extract values of interest and place them in a
csv file