Обзор фрейма данных R

Кадры данных представляют собой список векторов одинаковой длины. Однако различие между кадрами матрицы и данных состоит в том, что кадры данных принимают различные типы данных. (Символьные, числовые и т. Д.). В этой теме мы собираемся узнать о R Data Frame.

Преимущества использования фреймов данных

  • Распределенный сбор данных и организованный.
  • У этого есть лучшие оптимизации по сравнению с реляционной базой данных.
  • Содержит различные данные, которые неоднородны.

Создание фрейма данных в R

Мы создаем data_frame. Ниже приведен пример объявления фрейма данных.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

В приведенном выше примере мы не определили переменные. Давайте теперь посмотрим, как мы присваиваем значения переменным и сохраняем их во фрейме данных.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Выход:

Номер альфа логическое

1 2 х ИСТИНА

2 3 года ИСТИНА

3 4 z ЛОЖЬ

Структура фрейма данных

Когда мы хотим знать структуру конкретного фрейма данных. Мы можем использовать функцию ниже.

Звезда ()

str(Data_frame)

Выход:

Номер: номер 2 3 4

альфа: фактор с 3 уровнями «x», «y», «z»: 1 2 3

Booleans: logi TRUE TRUE FALSE

Извлечение определенных данных из фрейма данных

1. Использование имени столбца

Мы можем извлечь определенный набор данных из фрейма данных.

Из приведенного выше примера давайте выделим только первый столбец из фрейма данных Number.

Data_ frame <- data. Frame(Number)

Выход:

номер

1 2

2 3

3 4

2. Использование строк

Мы можем извлечь данные из строк, как показано в примере ниже.

Предположим, мы хотим напечатать только две строки столбца Number.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Выход:

Номер альфа логическое

1 2 х ИСТИНА

2 3 года ИСТИНА

3 4 z ЛОЖЬ

------------

Номер альфа логическое

1 2 х ИСТИНА

2 3 года ИСТИНА

Мы можем наблюдать разницу в первом и втором выходах.

3. Печать определенных строк и столбцов

Мы также можем напечатать определенные строки и столбцы.

В приведенном ниже примере мы печатаем 1- ю и 2- ю строки, столбцы

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Выход:

Номер альфа логическое

1 2 х ИСТИНА

2 3 года ИСТИНА

3 4 z ЛОЖЬ

-------------

Номер альфа

1 2 х

2 3 года

4. Добавление еще одного столбца во фрейм данных

Мы можем добавить еще один столбец вместе со значениями во фрейм данных.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Выход:

Номер альфа логического класса

1 2 x ИСТИНА А

2 3 года TRUE B

3 4 z FALSE C

5. Добавление строки во фрейм данных

Мы используем функцию rbind, чтобы добавить новую строку в существующий фрейм данных.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Выход:

Номер альфа логического класса

1 2 x ИСТИНА А

2 3 года TRUE B

3 4 z FALSE C

4 5 x ЛОЖЬ D

6. Объединение обоих фреймов данных

Мы также можем объединить два фрейма данных для получения одного вывода.

Чтобы объединить два фрейма данных, нам нужен один и тот же столбец для фреймов данных.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Выход:

Номер альфа логическое
1 2 х ИСТИНА
2 3 года ИСТИНА
3 4 z ЛОЖЬ
--------------
Номер альфа логическое
1 4 х ИСТИНА
2 5 лет ИСТИНА
3 6 z ЛОЖЬ

--------------

Номер альфа логическое
1 2 х ИСТИНА
2 3 года ИСТИНА
3 4 z ЛОЖЬ
4 4 х ИСТИНА
5 5 лет ИСТИНА
6 6 z ЛОЖЬ

Проверка фреймов данных

Ниже приведены различные способы проверки фрейма данных, а также информация о фрейме данных, аналогичная приведенной выше функции звездочки.

1. Имена - Предоставляет имена переменных в кадре данных.

Синтаксис : names(data frame name)

пример

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

Вывод : (1) «Число» «Альфа» «Булево»

2. Сводка - Предоставляет статистику фрейма данных.

Синтаксис: summary(data frame name)

пример

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Выход:

Номер альфа логическое
Минимум : 2.0 x: 1 Режим: логический
1st Qu.:2.5 y: 1 FALSE: 1
Медиана: 3, 0 z: 1 ИСТИНА: 2
Среднее значение: 3, 0: 0
3 кв. 3, 5
Максимум. : 4, 0

3. Head- Предоставляет данные для первых нескольких строк.

Синтаксис: Head( name of the data frame)

пример

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Выход:

Номер альфа логическое
1 2 х ИСТИНА
2 3 года ИСТИНА
3 4 z ЛОЖЬ
4 5 ИСТИНА
5 6 b ЛОЖЬ
6 7 c ЛОЖЬ

4. Хвост - печать последних нескольких строк во фрейме данных.

Синтаксис: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Выход:

Номер альфа логическое
5 6 b ЛОЖЬ
6 7 c ЛОЖЬ
7 8 d ЛОЖЬ
8 9 F FALSE
9 10 г ЛОЖЬ
10 11 J ЛОЖЬ

Вывод

Кадры данных являются важной концепцией в R-программировании. Это легко, но мощно в создании наборов данных, которые могут быть легко изменены и доступны. Подобно матрице, к наборам данных можно получить доступ через имена строк и столбцов, что позволяет легко добавлять и удалять данные.

Рекомендуемые статьи

Это руководство по R Data Frame. Здесь мы обсудим создание фрейма данных в R со структурой и извлечение конкретных данных из фрейма данных. Вы также можете взглянуть на следующие статьи, чтобы узнать больше -

  1. Типы данных в C
  2. Data Science Career
  3. Технологии больших данных
  4. Data Science Platform
  5. Java Booleans