Введение в пакеты R

Пакет представляет собой набор функций и наборов данных. Пакеты помогают расширить функциональность в языке программирования. Если мы хотим хранить и обрабатывать базы данных (т.е. SQL-подобные функции с использованием фреймов данных), тогда мы можем использовать пакет dplyr в R. Пакеты также предоставляют документацию о том, как использовать функции и наборы данных в данном пакете.

Где мы находим пакеты?

Пакеты доступны в Интернете через различные источники. Тем не менее, существуют определенные доверенные репозитории, откуда мы можем загрузить пакеты.

Вот два важных репозитория, которые доступны онлайн.

  • CRAN (Комплексная сеть архивов R): это официальное сообщество R с сетью FTP и веб-серверов, которая содержит новейший код и документацию R. Прежде чем размещать свои пакеты в Интернете, они проходят серию тестов в соответствии с политикой CRAN.,
  • GitHub: GitHub - это еще один известный репозиторий, но не специфичный для R. Онлайн-сообщество может делиться своими пакетами с другими людьми, и его хорошо использовать для контроля версий. GitHub является открытым исходным кодом и не имеет никакого процесса обзора.

Список полезных пакетов R

В R есть несколько пакетов, которые можно скачать с CRAN или GitHub. Ниже приведены пакеты, которые можно использовать для определенных целей.

1. Загрузка данных из внешних источников

  • Haven: R читает и записывает данные из SAS.
  • DBI: установить связь между реляционной базой данных и R.
  • RSQlite: используется для чтения данных из реляционных баз данных.

2. Манипулирование данными

  • Dplyr: он используется для манипулирования данными, такими как поднаборы, предоставляет ярлыки для доступа к данным и генерирует SQL-запросы.
  • Tidyr - используется для преобразования данных в крошечные форматы.
  • stringr - манипулирует строковыми выражениями и символьными строками.
  • lubridate - для работы с данными и временем.

3. Визуализация данных

  • РГЛ: Для работы над 3D визуализациями.
  • ggvis: для создания и построения грамматики графики.
  • googlevis: использовать инструменты визуализации google в R.

4. Веб-пакеты

  1. XML: для чтения и записи XML-документов на языке R.
  2. Httpr: работа с http-соединениями.
  3. Jsonlite: читать таблицы данных JSON .

Получение пакетов R

Мы можем проверить доступные пакеты, которые присутствуют в R, используя приведенный ниже код.

  • available.packages (): в сети CRAN доступно около 5200 пакетов.

У CRAN есть представления задач, которые группируют пакеты по определенной теме.

Установка пакетов R

Мы можем устанавливать пакеты напрямую через IDE или через команды. Для установки пакетов мы используем функцию ниже и указываем имя пакета.

Синтаксис:

install.packages()

Код:

install.packages(“ggplot2”)

Приведенный выше код устанавливает пакет ggplot2 и его зависимые пакеты, если таковые имеются.

Мы можем установить несколько пакетов одновременно, указав имена пакетов в символьном векторе.

Синтаксис:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Код:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Установка с использованием R Studio

Преимущество использования R studio заключается в том, что это GUI (графический интерфейс пользователя). Мы можем выбрать пакеты для установки и их источник.

Мы можем перейти к инструментам -> Установить пакеты.

Загрузка пакетов R

После установки пакета R нам нужно загрузить их в R, чтобы начать использовать установленные пакеты.

Мы используем следующую функцию для загрузки пакетов.

Синтаксис:

library(package name)

Примечание: имя пакета не обязательно указывать в кавычках.

Код:

library(ggplot2)

Есть определенные пакеты, которые отображают сообщения при загрузке. Некоторые из них, нет. Мы можем увидеть детали библиотеки, установленной с помощью приведенного ниже кода.

Код:

library(ggplot2)
search()

Выход:

«Пакет: решетка» «пакет: ggplot2» «пакет: makelides»

«Пакет: Knitr» «Пакет: Slidify» «Инструменты: Rstudio»

Создание собственного пакета

Прежде чем мы создадим наш собственный пакет. Мы должны помнить о нижеследующем контрольном списке, прежде чем приступить к созданию пакета.

  • Организация кода является одной из самых важных вещей при написании кода в пакете. Мы теряем половину времени на поиск местоположения кода вместо того, чтобы улучшать код. Поместите все файлы в папку, которая легко доступна.
  • Документирование кода поможет вам понять назначение кода. Когда мы не пересматриваем код часто, мы забываем, почему мы написали код определенным образом. Это также может помочь людям лучше понять ваш код, когда им поделились.
  • Совместное использование сценариев по электронной почте стало архаичным. Самый простой способ - загрузить свой код и распространить его на GitHub. Возможно, вы получите отзыв, который поможет вам улучшить код.

Чтобы создать свой собственный пакет, мы должны установить пакет devtools.

Код:

install.packages("devtools")

Чтобы помочь с документацией, мы можем использовать пакет ниже.

Код:

install.packages("roxygen2")

После установки пакета devtools. Вы можете создать свой собственный пакет.

Код:

devtools::create ("packagename")

Вместо «packagename» вы можете указать желаемое имя. Теперь вы можете добавить свои функции в этот пакет.

Вы можете создать то же имя файла, что и имя вашей функции.

Синтаксис:

Devtools:create(“firstpackage”)

Распространение пакета

Вы можете распространять свой пакет на github с помощью пакета devtools.

Мы используем приведенный ниже код для распространения нашего пакета на github.

Код:

devtools::install_github("yourusername/firstpackage")

Вы можете указать свое имя пользователя github и имя пакета, которое вы создали выше.

Вот необходимые файлы для пакета

  • функции
  • Документация
  • Данные

После того, как у нас есть все вышеперечисленные файлы, мы можем разместить их в репозитории.

Рекомендуемые статьи

Это руководство по пакетам R. Здесь мы обсудим список полезных пакетов R, установим пакеты с помощью R studio и создадим собственный пакет и т. Д. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

  1. Что такое язык программирования R?
  2. Карьера в R Программирование
  3. R Программирование против Python
  4. MySQL против SQLite
  5. Список пакетов R