Введение в гистограмму в R

В этой статье мы начнем с базовой гистограммы в реализации и настройках R. Гистограмма играет важную роль в анализе данных для визуализации данных. R-программирование - это особая среда для статистических вычислений и основы науки о данных. В программировании R наборы данных и функции группируются в виде пакетов. Большинство программ визуальной аналитики используют гистограммы и устанавливают ширину бина по умолчанию. Они позволяют быстро понять данные, которые играют главную роль в науке о данных. Здесь мы построим гистограмму, используя R команд.

Что такое гистограмма?

Гистограмма представляет собой графическое представление распределения набора данных, с помощью которого мы можем легко проанализировать, какой фактор имеет больший объем данных и наименьшее количество данных. Другими словами, гистограмма позволяет делать кумулятивные частотные графики по осям X и Y. На самом деле гистограммы принимают как сгруппированные, так и разгруппированные данные. Для сгруппированных данных гистограмма строится с учетом границ классов, тогда как для несгруппированных данных необходимо формировать сгруппированное распределение частот. Они помогают эффективно анализировать диапазон и местоположение данных. Некоторая общая структура гистограмм применяется как нормальная, наклонная, скала во время распределения данных.

В отличие от столбца, гистограмма графика не имеет промежутков между столбцами, и столбцы здесь называются столбцами, с которыми данные представлены через равные интервалы. Гистограмма принимает непрерывную переменную и разбивает на интервалы, необходимо выбрать правильную ширину бина. Основное различие между гистограммой и гистограммой состоит в том, что первая использует для построения номинальные наборы данных, а гистограмма - непрерывные наборы данных. R использует функцию Hist () для создания гистограмм. Эта функция hist () использует вектор значений для построения гистограммы. Гистограмма состоит из диапазона непрерывных значений по оси X, по оси Y - частые значения данных по оси X с полосами изменения высоты.

Синтаксис:

Синтаксис для создания гистограммы

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Создание гистограммы в R

Для анализа целевая гистограмма требует некоторого встроенного набора данных для импорта в R. R, и его библиотеки имеют множество графических пакетов и функций. Здесь мы используем данные швейцарских и воздушных пассажиров. Для вычисления гистограммы для заданного значения данных используется функция hist () вместе со знаком $ для выбора определенного столбца данных из набора данных для создания гистограммы.

В следующем примере вычисляется гистограмма значения данных в столбце Проверка набора данных с именем Swiss.

Пример 1: Давайте создадим простую гистограмму

Код:

hist (swiss $Examination)

Выход:

Хист создан для набора данных швейцарских с экспертизой столбца. это просто строит корзину с частотой и осью X.

Пример 2: гистограмма с большим количеством аргументов

Чтобы лучше понять гистограммы, нам нужно добавить больше аргументов в функцию Hist, чтобы оптимизировать визуализацию диаграммы. Изменение меток x и y на диапазон значений аргументов xlim и ylim добавляются в функцию.

Пример:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Выход:

Выше кода строит гистограмму для значений из набора данных «Воздушные пассажиры», дает заголовок как «Гистограмма для большего количества аргументов», метку оси X как «Список имен», с зеленой рамкой и желтым цветом для столбцов, ограничивая значение от 100 до 600, значения напечатаны на оси Y на 2, а ширина ячейки равна 5.

Добавление двух разных цветов в панель

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Выход:

Добавление большего количества баров к гистограмме

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Выход:

Пример 3: гистограмма в R возвращает значение

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Выход:

Пример 4: Использование аргумента разрыва для изменения ширины корзины

Чтобы иметь больше точек останова между шириной, предпочтительно использовать значение в функции c ().

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Выход:

Приведенный выше график принимает ширину полосы через значения последовательности.

Пример 5: Реализация кривой нормального распределения в гистограмме

Мы будем использовать набор данных «швейцарский» для значений данных, чтобы нарисовать график. Здесь кривая функции () используется для отображения линии распределения.

Код:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Выход:

Пример 6: Распределение вероятности построения

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Создание графиков плотности в гистограмме в R

Распределение переменной создается с помощью функции density (). Ниже приведен пример с набором данных mtcars. Графики плотности помогают в распределении формы.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Выход:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Следующая гистограмма в R отображает высоту в виде исследования по оси x, а плотность отображается на оси y.

Выход:

Вывод

Это все о гистограмме, и именно гистограмма - самый простой способ понять данные. Как мы видели с гистограммой, мы могли рисовать одну, несколько диаграмм, используя ширину ячейки, коррекцию оси, изменение цвета и т. Д. Гистограмма помогает визуализировать различные формы данных. Наконец, мы увидели, как гистограмма позволяет анализировать наборы данных, а средние точки используются в качестве меток класса. Гистограмма помогает в изменении интервалов для получения расширенного описания данных и работает, особенно с числовыми данными. гистограммы являются более предпочтительными в анализе из-за их преимущества отображения большого набора данных. На основании результатов мы могли визуально исказить данные и легко сделать некоторые предположения.

Рекомендуемые статьи

Это было руководство по гистограмме в R. Здесь мы обсудили концепцию, синтаксис и как создать гистограмму в R с примерами. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. Примеры гистограмм
  2. Карьера в R программировании
  3. Диаграмма Ганта в Таблице
  4. Карьера в компьютерном программировании
  5. Как создать линейный график в R?