Введение в Scatterplot в R

  • R - это язык программирования с открытым исходным кодом, используемый для статистики данных и анализа данных. С ростом популярности науки о данных, R также приобрел популярность. В основном он используется статистиками и майнерами данных для извлечения ценной информации из данных. R является интерпретируемым языком и имеет интерфейс командной строки, но есть много графических пользовательских интерфейсов, доступных для облегчения работы разработчика. R предлагает большое разнообразие библиотек для реализации статистики и графических методов. R предлагает статическую графику; это позволяет пользователю построить многоуровневый граф. Таким образом, он создает графики качества публикации и обеспечивает лучшее представление информации.
  • R предлагает огромный набор библиотек для графической реализации, но самым популярным является «ggplot2». GGPlot2 - реализация «Грамматики графики», которая делает создание сложных графов простым. Он предоставляет программный интерфейс для указания переменных, их положения, цвета графика, типов графика и других свойств визуализации. Это позволяет создавать графики шаг за шагом, позволяя создавать слои для большей гибкости и качества публикации.
  • Одним из таких типов графиков является Scatterplot в R. Scatterplot в R, также называемая точечной диаграммой, которая представляет собой тип графика, который показывает корреляцию между двумя переменными. Он показывает данные точек в виде точек. Его можно нарисовать между непрерывной независимой переменной и другой переменной, которая зависит от предыдущей переменной или двух непрерывных независимых переменных. Корреляция может быть положительной, отрицательной или нулевой. Если наклон графика от нижнего левого до верхнего правого, корреляция положительна. Если наклон от левого верхнего до нижнего правого, корреляция отрицательная или, другими словами, увеличение значения одной переменной будет уменьшаться в значении другой переменной.

Синтаксис: Существует множество пакетов в R для графов, поэтому есть много функций для создания диаграммы рассеяния в R. Самая простая и простая функция

сюжет (х, у)

где

х обозначает горизонтальную ось или независимую непрерывную переменную.

у обозначает вертикальную ось или зависимую переменную.

Есть много других параметров для построения графика, чтобы сделать график более простым для понимания.

Ниже приведены некоторые с определением:

  • main: добавляет заголовок к графику
  • xlab: добавить метку к оси x
  • ylab: добавляет метку к оси Y
  • xlim: указывает диапазон оси X
  • ylim: указывает диапазон оси Y
  • pch: указывает форму точек на точечной диаграмме
  • cex: указывает размер очков
  • col: определяет цвет точек

Scatterplot в R также может быть создан с использованием пакета ggplot2. Для этого нам сначала нужно установить и загрузить пакет ggplot2. После добавления пакета в текущий сеанс ниже команда может быть использована для создания Scatterplot в R.

ggplot (набор данных, aes (x, y, цвет, форма)) + geom_poin () + labs (x, y, название)

где

  • набор данных - это набор данных, для которого необходимо создать диаграмму рассеяния.
  • aes () - это эстетическое отображение в графе. Он описывает, как переменные отображаются на графике.
  • х - горизонтальная ось или независимая непрерывная переменная.
  • у - вертикальная ось или зависимая переменная.
  • Цвет - это добавление цвета к точкам на основе переменной группировки.
  • форма используется для установки формы на основе переменной группировки.
  • Знак + означает, что команда продолжается.
  • geom_point () - это функция для точечной диаграммы.
  • labs (x, y, title): добавить метку x, метку y и заголовок на график.

Создать Scatterplot In R

Чтобы создать график рассеяния в R, нам сначала нужно загрузить набор данных. Здесь мы используем набор данных (mtcars), предоставленный R. Сначала загрузите набор данных в текущий сеанс, используя команду ниже

данные (радужная оболочка)

После загрузки набора данных просмотрите данные, чтобы получить общее представление о типе данных и столбцах в нем, используя команду ниже.

радужная оболочка

Получив базовое представление о данных, давайте создадим простую диаграмму рассеяния, используя функцию plot

график (радужная оболочка $ Sepal.Length, радужная оболочка $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Добавление меток, чтобы сделать график читабельным

график (радужная оболочка $ Sepal.Length, радужная оболочка $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = «длина Sepal», ylab = «ширина Sepal», main = «ширина» против длины »)

Добавление еще одного параметра, чтобы сделать график более привлекательным

график (радужная оболочка $ Sepal.Length, радужная оболочка $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = «длина Sepal», ylab = «ширина Sepal», main = «ширина» против длины », pch = 8, cex = 1, 5, col = 6)

Помимо этих 2-D графиков, матрицы R. и 3-D графики также могут быть созданы в R.

Матрицы рассеяния

Если в наборе данных имеется более двух переменных, и мы хотим найти корреляцию каждой переменной со всеми другими переменными, то используется матрица диаграммы рассеяния. Самая простая и простая команда для матрицы рассеяния:

пары (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris, main = ”Matrix Sclotplot Matrix”)

Приведенный выше график показывает корреляцию между весом, миль на галлон, dsp и цил.

Scatterplot 3D

Иногда 3-мерный график дает лучшее понимание данных. Для этого R предоставляет несколько пакетов, один из которых «scatterplot3d». Ниже приведены команды для установки «scatterplot3d» в рабочее пространство R и загрузки его в текущем сеансе.

install.packages ( «scatterplot3d»)

библиотека (scatterplot3d)

После загрузки библиотеки выполнение приведенных ниже команд создаст трехмерную диаграмму рассеяния.

прикрепляются (ирис)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = «3D Scatterplot»)

Помимо этого, есть много других способов создания 3-мерных. Пользователи также могут добавлять детали, такие как цвет, заголовки, чтобы сделать график лучше. Пользователь также может создать интерактивную трехмерную диаграмму рассеяния с помощью функции plot3D (x, y, z), предоставляемой пакетом «rgl». Эта функция создает вращающуюся трехмерную диаграмму рассеяния, которую можно вращать с помощью мыши. Таким образом, давая полное представление о корреляции между переменными.

Вывод

R является одним из самых известных языков для реализации графических методов, используемых учеными данных. Он предоставляет широкий спектр пакетов и библиотек для графики и лучшего понимания данных. «Gglpot2», «ggvis», «rgl», «plot3d», «lattice», «animation», «gganimate», «cairo» - некоторые из пакетов, предоставляемых R.

Точечный график - это самый простой способ лучше понять данные. Используя эту визуализацию, пользователь может узнать, как переменные связаны друг с другом, как изменение значения одной переменной изменит значение других переменных и т. Д. Наклон графика говорит о положительном и отрицательном отношении между переменными.

Рекомендуемые статьи

Это руководство по Scatterplot в R. Здесь мы обсуждаем введение, матрицы scatterplot, scatterplot 3D, как создать scatterplot? вместе с соответствующими примерами. Вы также можете просмотреть наши другие предлагаемые статьи, чтобы узнать больше -

  1. Что такое GraphQL
  2. Scrum Framework
  3. R Интервью Вопросы
  4. Введение в биномиальное распределение в R