Фреймы данных в R - Как извлечь данные из фреймов данных в R?

Содержание:

Anonim

Введение в фреймы данных в R

Фрейм данных - это двумерная (двумерная) массивоподобная структура, в которой принимаются разные типы данных, такие как символы, цифры и т. Д. Кадр данных является подмножеством списка, каждый компонент которого имеет одинаковую длину. По сути, фрейм данных представляет собой таблицу, в которой каждый столбец содержит значения одной переменной, а каждая строка содержит один набор значений из каждого столбца.

Есть некоторые характеристики фрейма данных.

  • Имя столбца обязательно
  • Имена строк должны быть уникальными
  • Количество элементов в каждом столбце должно быть одинаковым

Шаги для создания фреймов данных в R

Давайте начнем с создания фрейма данных, который объясняется ниже,

Шаг 1: Создайте фрейм данных класса в школе.

Код:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Когда мы запустим этот код, мы получим фрейм данных, подобный этому.

Выход:

Здесь, в нашем примере, фрейм данных очень мал, но в реальной жизни при решении проблемы у нас много данных. Таким образом, чтобы понять структуру данных, мы передаем функцию Str ().

Шаг 2: Мы добавляем строку ниже в наш код.

Код:

Str(tenthclass)

Когда мы запустим весь код, мы получим вывод.

Выход:

Приведенный выше вывод означает, что у нас есть 5 наблюдений за 3 переменными. Затем он объясняет тип данных каждой переменной. Как и в нашем примере, номер броска - целое число, имя - символ, а знаки пронумерованы.

Как только мы поймем структуру данных, мы передадим приведенный ниже код для более статистического понимания данных.

Шаг 3: Теперь мы будем использовать функцию summary ()

Код:

summary(tenthclass)

Выход:

Резюме обеспечивает лучшее понимание наших данных. Это скажет нам, чтобы означать, медиана, квартиль, Макс и Мин. Эти вещи помогут нам принять лучшее решение.

Как извлечь данные из фреймов данных в R?

Здесь мы продолжим описанный выше случай. Предположим, мы хотим знать имя ученика в десятом классе, просто имя. Так как же мы будем добывать?

Наш фрейм данных выглядит следующим образом.

roll_number Имя Метки

1 1 Иоанна 77

2 2 Сэм 87

3 3 Кейси 45

4 4 Рональд 68

5 5 Мэтью 95

Чтобы просто получить имя в качестве вывода, мы передадим следующий код.

Код:

onlyname = tenthclass$Name
print(onlyname)

Выход:

Здесь, если мы нарушаем код, мы просто помещаем знак доллара между именем нашего фрейма данных и именем переменной, которую мы хотим вывести.

Теперь рассмотрим ситуацию, учитель хочет знать все о броске № 2, например, как его зовут и сколько он набрал.

Здесь нам нужно все о ролике № 2, поэтому мы передадим приведенный ниже код.

Код:

result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)

Выход:

Развернуть в фреймах данных

Фрейм данных можно увеличивать и уменьшать в размере, добавляя или удаляя столбцы и строки.

1. Добавить строку

У нас есть два кадра данных. Один фрейм данных принадлежит десятому разделу класса A, а другой фрейм данных принадлежит десятому разделу класса B. Теперь эти различные разделы объединяются в один класс.

Пример № 1: класс 10 А

Код:

tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)

Выход:

Пример № 2: класс 10 B

Код:

tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)

Выход:

Пример № 3: функция rbind ()

Теперь мы должны объединить оба этих класса в один класс. Мы будем использовать функцию rbind () здесь. Единственное ограничение при добавлении новой строки - это то, что нам нужно ввести новые строки в той же структуре, что и существующий фрейм данных.

Код:

new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)

Выход:

2. Добавить столбец

Теперь рассмотрим случай, когда мы должны добавить данные о группе крови каждого учащегося в классе 10. Мы добавим для него новый столбец и назовем его «Blood_group».

Наш фрейм данных выглядит следующим образом.

Код:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Выход:

Код:

tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)

Выход:

Удалить строку и столбец из фрейма данных

Для удаления строки и столбца из фрейма данных мы используем следующую реализацию кода.

1. Удалить столбец

Код:

print(tenthclass)

Выход:

В этом кадре данных, если нам нужно удалить переменную группы крови (крайний правый столбец), мы передадим приведенный ниже код.

Код:

tenthclass$Blood_group = NULL
print(tenthclass)

Выход:

Обойдя команду NULL, мы можем напрямую удалить переменную из нашего фрейма данных.

2. Удалить строку

Код:

print(tenthclass)

Выход:

Теперь рассмотрим ситуацию, когда нам не нужны метки Джона, поэтому мы должны удалить самый верхний ряд.

Код:

tenthclass = tenthclass(-1, ) print(tenthclass)

Выход:

Обновить данные в фрейме данных

Код:

print(tenthclass)

Выход:

Давайте предположим, что Сэм набрал 98 баллов, но согласно нашим оценкам фрейма данных - 87. Таким образом, мы можем передать приведенный ниже код, чтобы исправить это.

Код:

tenthclass$Marks(2) = 98
print(tenthclass)

Выход:

Вывод

Фреймы данных - очень распространенная форма постановки задачи. Это список переменных с одинаковым количеством строк с уникальными идентификаторами строк. Эта статья помогает нам узнать, как мы можем добавить строку, добавить столбец, удалить строку, удалить столбец фрейма данных, а также рассказывает, как мы можем обновить данные в фрейме данных.

Рекомендуемые статьи

Это руководство по фреймам данных в R. Здесь мы обсуждаем различные шаги для создания фреймов данных и как извлечь данные из фреймов данных в R. Вы также можете посмотреть следующие статьи, чтобы узнать больше:

  1. Топ 5 типов данных в R
  2. Список полезных пакетов R
  3. R CSV Files
  4. Функции программы R - Важность
  5. Фактор в R с преимуществами