Kuidas alla laadida & Installige NLTK Windowsi / Maci

Lang L: none (table-of-contents):

Anonim

Selles õpetuses saate teada -

  • NLTK installimine Windowsi
  • Pythoni installimine Windowsi
  • NLTK installimine Maci / Linuxi
  • NLTK installimine Anaconda kaudu
  • NLTK andmekogum
  • Kuidas alla laadida kõik NLTK paketid
  • NLP-skripti käitamine
  • Kuidas käivitada NLTK-skripti

NLTK installimine Windowsi

Selles osas õpime, kuidas NLTK seadistada terminali kaudu (Windowsi käsuviip).

Allpool toodud juhised põhinevad eeldusel, et teil pole pythoni installitud. Niisiis, esimene samm on pythoni installimine.

Pythoni installimine Windowsi:

Samm 1) Go siduda https://www.python.org/downloads/ , ja vali uusim versioon aknad.

Märkus . Kui te ei soovi uusimat versiooni alla laadida, võite külastada allalaadimise vahekaarti ja vaadata kõiki väljaandeid.

Samm 2) Klõpsake allalaaditud faili

Samm 3) Valige Kohanda installimist

Samm 4) Klõpsake nuppu JÄRGMINE

Samm 5) Järgmisel ekraanil

  1. Valige täpsemad valikud
  2. Andke kohandatud installikoht. Minu puhul valitakse C-draivi kaust töö hõlbustamiseks
  3. Klõpsake nuppu Install

Samm 6) Kui install on tehtud, klõpsake nuppu Sule.

7. samm. Kopeerige oma kausta Skriptid tee.

8. samm . Windowsi käsuviibal

  • Navigeerige pip-kausta asukohta
  • NLTK installimiseks sisestage käsk
    pip3 install nltk
  • Paigaldamine peaks toimuma edukalt

MÄRKUS . Python2 jaoks kasutage käsku pipip2 install nltk

9. samm . Otsige ja avage Windowsi menüüs Start käsk PythonShell

10. samm. Saate kontrollida, kas installimine on õige, pakkudes alltoodud käsku

import nltk

Kui viga ei näe, on installimine lõpule viidud.

NLTK installimine Maci / Linuxi

NLTK installimine Mac / Unixis nõuab nltki installimiseks pythoni paketihalduri pipi. Kui pipi pole installitud, järgige protsessi lõpuleviimiseks allolevaid juhiseid

1. samm. Uuendage paketi register, tippides alloleva käsu

sudo apt update

2. samm) Pythoni 3 pipi installimine:

sudo apt install python3-pip

Samuti saate pipi installida, kasutades easy_install.

sudo apt-get install python-setuptools python-dev build-essential 

Nüüd on installitud easy_install. Käivitage pipi installimiseks järgmine käsk

sudo easy_install pip

Samm 3) NLTK installimiseks kasutage järgmist käsku

sudo pip install -U nltksudo pip3 install -U nltk

NLTK installimine Anaconda kaudu

1. samm. Palun installige anaconda (mida saab kasutada ka erinevate pakettide installimiseks), külastades aadressi https://www.anaconda.com/products/individual ja valige, millise pythoni versiooni peate anaconda jaoks installima.

Märkus. Anakonda installimiseks vaadake üksikasjalikke juhiseid sellest õpetusest

2. samm . Anaconda viipas

  1. Sisestage käsk
    conda install -c anaconda nltk
  2. Vaadake üle paketiuuendus, minge vanemale versioonile, installige teave ja sisestage jah
  3. NLTK on alla laaditud ja installitud

NLTK andmekogum

NLTK moodulil on saadaval palju andmekogumeid, mille kasutamiseks peate alla laadima. Tehnilisemalt nimetatakse seda korpuseks . Mõned näited on märksõnad , gutenberg , framenet_v15 , suured_grammatikad ja nii edasi.

Kuidas alla laadida kõik NLTK paketid

1. samm. Käivitage Pythoni tõlk Windowsis või Linuxis

2. samm)

  1. Sisestage käsud
import nltknltk.download ()
  1. Avaneb NLTK allalaaditud aken. Andmekogumi allalaadimiseks klõpsake nuppu Laadi alla. See protsess võtab teie Interneti-ühenduse põhjal aega

MÄRKUS. Allalaadimiskohta saate muuta, klõpsates nuppu Fail> Muuda allalaadimiskataloogi

Samm 3) Installitud andmete testimiseks kasutage järgmist koodi

>>> from nltk.corpus import brown>>>brown.words()

[',', 'Fulton', 'maakond', 'suur', 'žürii', 'ütles', ...]

NLP-skripti käitamine

Arutame, kuidas NLP-skript meie kohalikus arvutis käivitatakse. Turul on palju loomuliku keele töötlemise raamatukogusid. Nii et raamatukogu valimine sõltub teie vajadustest. Siin on NLP-teekide loend.

Kuidas käivitada NLTK-skripti

Samm1) Kopeerige oma lemmikkoodiredaktoris kood ja salvestage fail nimega " NLTKsample.py "

from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)

Koodi selgitus:

  1. Selles programmis oli eesmärk eemaldada igast tüüpi kirjavahemärgid antud tekstist. Impordisime "RegexpTokenizer", mis on NLTK moodul. See eemaldab kõik avaldised, sümbolid, tähemärgid, numbrilised või mis tahes asjad, mida soovite.
  2. Olete lihtsalt edastanud regulaaravaldise moodulile "RegexpTokenizer".
  3. Lisaks märkasime sõna, kasutades moodulit "tokenize". Väljund salvestatakse muutuja "filterdText".
  4. Ja printis need "print ()" abil.

2. samm) käsureal

  • Navigeerige faili salvestamise asukohta
  • Käivitage käsk Python NLTKsample.py

See näitab väljundit järgmiselt:

["Tere", "Guru99", "Teie", "peate", "ehitama", "a", "väga", "hea", "sait" ja "," mina "," armastus "," külastamine ',' teie ',' sait ']