Введение в список пакетов R

Пакет на языке программирования R - это модуль, который обеспечивает необходимые функциональные возможности, которые можно использовать, загружая его в среду R. Список пакетов R похож на библиотеку на C, C ++ или Java. Итак, по сути, пакет может иметь множество функций, таких как функции, константы и т. Д., Которые мы позволим пользователю использовать их в контексте конкретной проблемы. В R необходимый пакет может быть загружен с помощью функции library (). Если пакет отсутствует, его можно установить с помощью функции install.packages (). Пакеты облегчают, казалось бы, сложные задачи благодаря готовым функциям.

Что такое пакеты R?

В R существует множество пакетов, и выбор пакета зависит от его применения. Хотя есть определенные пакеты, которые широко используются из-за предоставляемых ими функциональных возможностей, другие пакеты менее важны. Различные пакеты имеют разные цели; некоторые связаны со статистическими методами, некоторые относятся к визуализации и т. д.

В следующем разделе мы рассмотрим некоторые важные пакеты в R:

1. Автомобиль

Этот пакет является дополнением к прикладной регрессии. Это большой пакет, который предоставляет различные функции для статистического анализа. При импорте этого пакета в среду R импортируются другие связанные пакеты, такие как MASS, статистика, графика и т. Д. Некоторые из функций в пакете включают Anova, avPlots, Boxplot, carPalette, графики плотности, infIndexPlot, линейную гипотезу, логит, тест на выбросы, qqPlot, остаточные графики, диаграммы рассеяния, матрицы графиков рассеяния и т. д. Обширные возможности пакета можно оценить по количеству функций, которые он предоставляет.

2. Corpplot

Пакет обеспечивает графическое отображение корреляционной матрицы и доверительного интервала. Пакет также предоставляет алгоритмы для переупорядочения матрицы. Многочисленные опции включают выбор необходимых цветов, текстовых меток, цветовых меток, макета и т. Д. Различные методы визуализации или методы параметров в пакете corrplot: «круг», «квадрат», «эллипс», «число», «оттенок», «цвет» и «пирог». Функция corrplot, включающая различные параметры, дает визуально привлекательное представление корреляции между различными переменными, которые, в противном случае, в обычных обстоятельствах, таких как числа, трудно интерпретировать. Положительные корреляции отображаются синим цветом, а отрицательные - красным. Интенсивность цвета и размер круга пропорциональны коэффициентам корреляции.

3. DataExplorer

Этот пакет занимается автоматизированным исследованием и обработкой данных. Он обеспечивает автоматизированный процесс исследования данных, предназначенный для аналитических задач и прогнозного моделирования. Это очень важно, поскольку позволяет пользователю понимать данные и извлекать информацию. Каждая переменная в анализе сканируется и анализируется пакетом. Кроме того, пакет предоставляет функциональные возможности для визуализации этих переменных с использованием типичных графических методов. Он также предоставляет общие методы обработки данных для обработки и форматирования данных.

4. Гмодели

Пакет gmodels предоставляет различные инструменты в R для вывода данных. Он содержит различные функции, такие как glh.test, который используется для проверки, печати или обобщения общей линейной гипотезы для регрессионной модели. Функция делает. контрасты преобразуют удобочитаемые контрасты в форму, которая требуется R для вычислений. Матрица, возвращаемая make.contrasts, может использоваться в качестве аргумента для аргумента контрастов модельных функций. Функция coefFrame подбирает модель для каждой подгруппы, определенной с помощью , затем возвращает фрейм данных с одной строкой для каждого соответствия и одним столбцом для каждого параметра. Оценочная функция вычисляет и проверяет контрасты и другие оцениваемые линейные функции коэффициентов модели для lm, glm и т. Д. Функция fit.contrast вычисляет и проверяет произвольные контрасты для объектов регрессии.

5. Gplots

Этот пакет предоставляет функции визуализации с помощью разнообразных инструментов программирования. Функции в пакете работают над концепцией расчета и построения графиков. Графические возможности пакета демонстрируются различными функциями, такими как участок графика, boxplot2, col2hex, ci2d, hist2d, текстовый график, график приемника, всплывающее окно, plotCI, средство построения графика и т. Д. Эти функции позволяют работать с настройками, связанными с цветом, текст и другие сложные графические аспекты визуализации. Они также имеют дело со сложными элементами, участвующими в визуализации на основе статистики, например, lmplot2, функции вычетов, которые позволяют пользователю проводить детальную диагностику регрессии с помощью диагностических графиков. Если необходимо построить несколько данных в одной и той же области, но с разными осями, это возможно с помощью функции перерисовки в пакете.

6. Ggplot2

Это один из очень известных пакетов в R, который предоставляет широкие визуальные возможности и представляет результаты даже сложных статистических и математических методов. Многочисленные функциональные возможности, предоставляемые пакетом, позволяют аналитику получать информацию на основе данных наиболее интерактивным способом. Описание функции для R - это «система декларативного создания графики, основанная на грамматике графики». Эта графическая грамматика означает, что пользователь должен сказать «ggplot2» о том, как переменные должны отображаться в эстетику, так что это, по сути, означает, что указание того, какие графические аспекты использовать, и ggplot2 будет работать соответственно на основе деталей.

7. Lubridate

Этот пакет R облегчает работу с датами и временем. Пакет lubridate позволяет легко манипулировать данными даты и времени. Он анализирует число и дает подходящее расположение данных, фактически, функции синтаксического анализа в пакете обрабатывают широкий спектр форматов и разделителей, что упрощает процесс анализа. Одна из примечательных особенностей заключается в том, что пакет предоставляет функции для обработки дат с разными часовыми поясами.

8. Hmisc

Названный Harrell Miscellaneous, пакет Hmisc содержит множество функций, которые можно использовать для анализа данных, высокоуровневой графики и служебных операций. Он также включает функции для вычисления размера и мощности выборки, импорта и аннотирования наборов данных, определения отсутствующих значений, обеспечения расширенных функциональных возможностей таблиц, кластеризации переменных, манипулирования строкой символов, преобразования объектов R в код HTML и т. Д.

9. Решетка

Пакет предлагает систему визуализации данных высокого уровня, которая была вдохновлена ​​графикой Trellis. Он делает акцент на многомерных данных. Мощные возможности визуализации пакета обеспечивают необходимое графическое решение. Некоторые из примечательных функций в пакете: B_07_cloud, который помогает создать трехмерный график рассеяния и каркасный график поверхности; D_level. colors - функция для вычисления ложных цветов, представляющих числовую или категориальную переменную; B_06_levelplot, функция, которая генерирует графики уровня и графики контура; A_01_Lattice, функция, которая обеспечивает графические возможности решетки. B_09_tmd - это функция, которая генерирует среднее значение по Тьюки - разностный график; B_11_oneway, функция, которая подходит для односторонней модели. Таким образом, пакет предоставляет широкие функциональные возможности для визуализации с помощью различных функций.

10. MatrixModels

Этот пакет позволяет моделировать с разреженными и плотными матричными матрицами. Для этого он использует модульное предсказание и ответ, модульные классы. Все функции, предоставляемые пакетом, одинаково важны, некоторые из которых являются lm.fit.sparse, который является функцией подгонки для разреженных линейных моделей, solveCoef, который решает для коэффициентов и приращения коэффициентов модель. Матрица, которая строит возможно разреженные матрицы дизайна или модели, glm4, которая подходит для обобщенных линейных моделей.

11. Мульткомп

Пакет позволяет проводить множественные сравнения k групп в обобщенных линейных моделях. Список из девяти стандартных процедур, а именно. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott и Tetrade предоставляются пользователю, и пользователь выбирает сравнения на основе требований. В дополнение к этому предоставляется бесплатный интерфейс ввода для контрастной матрицы, который позволяет проводить специальные сравнения. Примечательной особенностью является то, что сами сравнения не ограничиваются каким-либо конкретным дизайном, таким как сбалансированный или простой, скорее программы разрабатываются таким образом, что они подходят для множественных сравнений в рамках общей линейной модели, которая допускает ковариации, коррелированные средние значения, пропущенные значения, и т.д.

12. OpenMx

Этот пакет в основном касается расширенного моделирования структурных уравнений. Он предоставляет функциональные возможности для создания моделей структурных уравнений. Этими моделями можно управлять с помощью программирования. Модели могут быть указаны с матрицами или путями, такими как LISREL или RAM. Некоторые из типов моделей включают несколько групп, подтверждающий фактор, распределение смеси, категориальный порог, дифференциальные функции соответствия и т. Д.

13. Плыр

Это очень важный пакет, который предоставляет функциональные возможности для манипулирования данными. Он предоставляет инструменты для разделения, применения и объединения данных. Он поставляется с набором инструментов, который помогает решить общий набор проблем. Например, иногда нам может понадобиться разбить большую задачу на более мелкие задачи, которыми можно управлять, затем мы работаем над каждой из частей, а затем, наконец, соединяем все части вместе.

14. Qcc

Пакет приобретает значение благодаря различным функциональным возможностям анализа качества, которые он предоставляет. Он предоставляет графики контроля качества Shewhart для непрерывных, атрибутов и подсчета данных. Среди других важных диаграмм - диаграммы Cusum и EWMA и кривые рабочих характеристик. Он также предлагает функции анализа возможностей процесса. Диаграмма Парето, причинно-следственная диаграмма и многовариантные контрольные диаграммы являются полезными инструментами, предоставляемыми пакетом.

15. RandomForest

Как следует из названия, этот пакет используется для построения алгоритма случайного леса. Пакет реализует алгоритм случайного леса Бреймана, основанный на оригинальном коде Фортрана Беймана и Катлера. Алгоритм используется для классификации и регрессии. Пакет также можно использовать в режиме без присмотра для оценки близости между точками данных.

16. псих

Это пакет, предназначенный для специального назначения. Пакет предоставляет процедуру для психологических, психометрических и личностных исследований. Функции предназначены в первую очередь для многомерного анализа с использованием различных многомерных статистических методов.

Заключение-список пакетов R

В R имеется множество пакетов, и применение пакета зависит от требований. Сообщество List of R Packages растет очень быстро, и каждый день добавляется пакет. Несколько пакетов могут предоставлять схожие функции, но выбор пакета должен основываться на его тщательном изучении.

Рекомендуемые статьи

Это руководство к списку пакетов R. Здесь мы обсуждаем введение в пакеты R и некоторые важные пакеты R. Вы также можете просмотреть другие наши предлагаемые статьи, чтобы узнать больше -

  1. Пакеты Java
  2. Что такое JNDI в Java?
  3. JColorChooser
  4. R Программирование против Python