Введение в фреймы данных в R
Фрейм данных - это двумерная (двумерная) массивоподобная структура, в которой принимаются разные типы данных, такие как символы, цифры и т. Д. Кадр данных является подмножеством списка, каждый компонент которого имеет одинаковую длину. По сути, фрейм данных представляет собой таблицу, в которой каждый столбец содержит значения одной переменной, а каждая строка содержит один набор значений из каждого столбца.
Есть некоторые характеристики фрейма данных.
- Имя столбца обязательно
- Имена строк должны быть уникальными
- Количество элементов в каждом столбце должно быть одинаковым
Шаги для создания фреймов данных в R
Давайте начнем с создания фрейма данных, который объясняется ниже,
Шаг 1: Создайте фрейм данных класса в школе.
Код:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Когда мы запустим этот код, мы получим фрейм данных, подобный этому.
Выход:
Здесь, в нашем примере, фрейм данных очень мал, но в реальной жизни при решении проблемы у нас много данных. Таким образом, чтобы понять структуру данных, мы передаем функцию Str ().
Шаг 2: Мы добавляем строку ниже в наш код.
Код:
Str(tenthclass)
Когда мы запустим весь код, мы получим вывод.
Выход:
Приведенный выше вывод означает, что у нас есть 5 наблюдений за 3 переменными. Затем он объясняет тип данных каждой переменной. Как и в нашем примере, номер броска - целое число, имя - символ, а знаки пронумерованы.
Как только мы поймем структуру данных, мы передадим приведенный ниже код для более статистического понимания данных.
Шаг 3: Теперь мы будем использовать функцию summary ()
Код:
summary(tenthclass)
Выход:
Резюме обеспечивает лучшее понимание наших данных. Это скажет нам, чтобы означать, медиана, квартиль, Макс и Мин. Эти вещи помогут нам принять лучшее решение.
Как извлечь данные из фреймов данных в R?
Здесь мы продолжим описанный выше случай. Предположим, мы хотим знать имя ученика в десятом классе, просто имя. Так как же мы будем добывать?
Наш фрейм данных выглядит следующим образом.
roll_number Имя Метки
1 1 Иоанна 77
2 2 Сэм 87
3 3 Кейси 45
4 4 Рональд 68
5 5 Мэтью 95
Чтобы просто получить имя в качестве вывода, мы передадим следующий код.
Код:
onlyname = tenthclass$Name
print(onlyname)
Выход:
Здесь, если мы нарушаем код, мы просто помещаем знак доллара между именем нашего фрейма данных и именем переменной, которую мы хотим вывести.
Теперь рассмотрим ситуацию, учитель хочет знать все о броске № 2, например, как его зовут и сколько он набрал.
Здесь нам нужно все о ролике № 2, поэтому мы передадим приведенный ниже код.
Код:
result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)
Выход:
Развернуть в фреймах данных
Фрейм данных можно увеличивать и уменьшать в размере, добавляя или удаляя столбцы и строки.
1. Добавить строку
У нас есть два кадра данных. Один фрейм данных принадлежит десятому разделу класса A, а другой фрейм данных принадлежит десятому разделу класса B. Теперь эти различные разделы объединяются в один класс.
Пример № 1: класс 10 А
Код:
tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)
Выход:
Пример № 2: класс 10 B
Код:
tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)
Выход:
Пример № 3: функция rbind ()
Теперь мы должны объединить оба этих класса в один класс. Мы будем использовать функцию rbind () здесь. Единственное ограничение при добавлении новой строки - это то, что нам нужно ввести новые строки в той же структуре, что и существующий фрейм данных.
Код:
new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)
Выход:
2. Добавить столбец
Теперь рассмотрим случай, когда мы должны добавить данные о группе крови каждого учащегося в классе 10. Мы добавим для него новый столбец и назовем его «Blood_group».
Наш фрейм данных выглядит следующим образом.
Код:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Выход:
Код:
tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)
Выход:
Удалить строку и столбец из фрейма данных
Для удаления строки и столбца из фрейма данных мы используем следующую реализацию кода.
1. Удалить столбец
Код:
print(tenthclass)
Выход:
В этом кадре данных, если нам нужно удалить переменную группы крови (крайний правый столбец), мы передадим приведенный ниже код.
Код:
tenthclass$Blood_group = NULL
print(tenthclass)
Выход:
Обойдя команду NULL, мы можем напрямую удалить переменную из нашего фрейма данных.
2. Удалить строку
Код:
print(tenthclass)
Выход:
Теперь рассмотрим ситуацию, когда нам не нужны метки Джона, поэтому мы должны удалить самый верхний ряд.
Код:
tenthclass = tenthclass(-1, ) print(tenthclass)
Выход:
Обновить данные в фрейме данных
Код:
print(tenthclass)
Выход:
Давайте предположим, что Сэм набрал 98 баллов, но согласно нашим оценкам фрейма данных - 87. Таким образом, мы можем передать приведенный ниже код, чтобы исправить это.
Код:
tenthclass$Marks(2) = 98
print(tenthclass)
Выход:
Вывод
Фреймы данных - очень распространенная форма постановки задачи. Это список переменных с одинаковым количеством строк с уникальными идентификаторами строк. Эта статья помогает нам узнать, как мы можем добавить строку, добавить столбец, удалить строку, удалить столбец фрейма данных, а также рассказывает, как мы можем обновить данные в фрейме данных.
Рекомендуемые статьи
Это руководство по фреймам данных в R. Здесь мы обсуждаем различные шаги для создания фреймов данных и как извлечь данные из фреймов данных в R. Вы также можете посмотреть следующие статьи, чтобы узнать больше:
- Топ 5 типов данных в R
- Список полезных пакетов R
- R CSV Files
- Функции программы R - Важность
- Фактор в R с преимуществами