Как установить NLTK?

В следующей статье Install NLTK приведена схема установки NLTK. NLTK - это набор библиотек для обработки естественного языка. Это платформа для создания программ на Python для обработки естественного языка. NLTK написан на языке программирования Python. Он был разработан Стивеном Бердом и Эдвардом Лопером. Он поддерживает исследования и преподавание в НЛП или в близких областях, включая когнитивные науки, эмпирическую лингвистику, поиск информации, искусственный интеллект и машинное обучение. NLTK предоставляет простой в использовании интерфейс.

NLTK (инструментарий естественного языка)

  • Обработка естественного языка (NLP) является частью искусственного интеллекта, который обрабатывает язык, на котором говорят люди. Таким образом, это помогает людям взаимодействовать с компьютерами, даже если они не знают, как ими пользоваться. Используя НЛП, люди просто должны диктовать команду компьютерам. Благодаря возможности машинного обучения обработка естественного языка становится все более популярной и простой в реализации. Это в основном техника взаимодействия с людьми и выполнения действий по голосовым командам.
  • Это позволяет использовать устройства даже новичку, который не знает технологии. Но реализация обработки естественного языка не легка, поскольку язык, на котором говорят люди, не имеет определенной структуры. Это неоднозначно и зависит от контекстных слов, которые могут иметь различное значение.
  • NLTK имеет более 50 корпоративных и лексических источников, таких как WordNet, Corpus для отчетов о проблемах, Penn Treebank Corpus и т. Д. Он также поставляется с руководством, в котором объясняются концепции обработки языка с помощью инструментария и основы программирования Python, которые облегчают работу для людей. которые не имеют глубоких знаний в области программирования. Он имеет широкий спектр пакетов, что делает его одним из мощных инструментов для НЛП. Вот некоторые из этих пакетов: токенизация, лемматизация, обработка по парам, анализ, подсчет символов, пунктуация, подсчет слов.

Установите NLTK для Windows

Ниже приведены инструкции по установке NLTK в Windows. Они основаны на предположении, что Python не установлен в системе. NLTK требует Python версий 2.7, 3.5 и выше.

Шаг 1: Загрузите последнюю версию Python для Windows по ссылке ниже

https://www.python.org/downloads/

Шаг 2: Нажмите на загруженный .exe, чтобы запустить его.

Шаг 3: Выберите настроить установку.

Шаг 4: Проверьте все функции, особенно «pip», так как это помогает установить NLTK, и нажмите «Далее».

Шаг 5: На следующем экране выберите дополнительные параметры, выберите путь и нажмите «Установить».

Шаг 6: После успешной установки закройте окно.

Шаг 7: Скопируйте путь к папке Scripts, чтобы установить NLTK в той же папке.

NLTK можно легко установить с помощью установщика «pip». Также мы должны установить «numpy».

Шаг 8: Чтобы установить NLTK, откройте командную строку и введите следующую команду.

Убедитесь, что установка прошла успешно.

После успешной установки пришло время использовать NLTK для обработки естественного языка.

Шаг 9: Откройте оболочку Python и введите команду ниже.

Если он импортирован без каких-либо ошибок, это означает, что NLTK установлен правильно.

Установите NLTK для Mac / Linux

В отличие от Windows, в системах Linux установлен Python. Для установки NLTK в Linux / Mac используется установщик Pip-пакетов Python. Чтобы установить pip или обновить его, введите следующие команды в командной строке.

Для установки python в Linux используйте следующие команды.

Шаг 1: Чтобы обновить индекс пакета, используйте команду ниже.

Шаг 2: Для установки Python в системе Linux используйте ниже.

Шаг 3: Введите приведенную ниже команду, чтобы установить «pip» для Python 3.

Шаг 4: После успешной установки «Pip» используйте следующие команды для установки NLTK.

Набор данных NLTK

NLTK имеет множество наборов данных, доступных для обработки на естественном языке, например, WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank и т. Д. Эти наборы данных называются корпоративными. По сути, набор данных NLTK содержит набор файлов или документов. Каждый файл / документ содержит набор слов, букв или текста на одном языке. Таким образом, корпус - это в основном библиотеки для понимания / изучения языка. У него есть правила грамматики и структура языка.

После успешной установки NLTK вы можете импортировать его, а также загрузить его корпус с помощью следующей команды.

Загрузчик NLTK открывает окно для загрузки наборов данных. Размер набора данных большой, поэтому потребуется время. Чтобы проверить, правильно ли установлены наборы данных, попробуйте импортировать набор данных и использовать его.

Переработка НЛТК

Существует 5 основных процессов обработки естественного языка. Это этапы обработки любого текста.

  1. EOS Detection : обнаружение конца речи разбивает текст на набор значимых предложений. Он делит длинный текст на части, которые имеют некоторое значение.
  2. Токенизация : этот шаг разбивает предложения на токены. Токены содержат не только слова, но и пробелы, разрывы предложений.
  3. Маркировка POS : POS означает «речь». Здесь информация присваивается токену. Эта информация указывает на то, к какому типу речи относится время: глагол, прилагательное, существительное и т. Д.
  4. Разделение на части : разделение на части означает сбор текста на основе тегов.
  5. Извлечение: Извлечение - это непрерывный процесс прохождения фрагментов и маркировки их как именованных объектов, таких как люди, местоположения, организации и т. Д.

Вывод:

NLTK используется для классификации текста, подписи к изображениям, распознавания речи, ответа на вопросы, языкового моделирования, суммирования документов и многих других операций. Есть много других инструментов для обработки естественного языка. Но у NLTK есть широкий спектр библиотек, что делает его одним из мощных инструментов обработки естественного языка. Он более точен, чем любой другой инструмент, но из-за большого количества библиотек он немного медленный. Итак, все зависит от требований пользователя. Если пользователю нужна скорость, он может предпочесть и другие инструменты, но тогда ему придется идти на компромисс с точностью содержания. Но если точность является приоритетом, то они обязательно должны пойти на NLTK.

Рекомендуемые статьи:

Это было руководство по установке NLTK. Здесь мы обсудим основную концепцию и различные шаги для установки NLTK на Windows и Linux \ Mac. Вы также можете посмотреть следующие статьи, чтобы узнать больше

  1. Установить Kubernetes Dashboard
  2. Как установить JDK
  3. Установить докер
  4. Как установить Magento?
  5. Версии Magento | Особенности версий Magento