Selles õpetuses saate teada -
- NLTK installimine Windowsi
- Pythoni installimine Windowsi
- NLTK installimine Maci / Linuxi
- NLTK installimine Anaconda kaudu
- NLTK andmekogum
- Kuidas alla laadida kõik NLTK paketid
- NLP-skripti käitamine
- Kuidas käivitada NLTK-skripti
NLTK installimine Windowsi
Selles osas õpime, kuidas NLTK seadistada terminali kaudu (Windowsi käsuviip).
Allpool toodud juhised põhinevad eeldusel, et teil pole pythoni installitud. Niisiis, esimene samm on pythoni installimine.
Pythoni installimine Windowsi:
Samm 1) Go siduda https://www.python.org/downloads/ , ja vali uusim versioon aknad.
Märkus . Kui te ei soovi uusimat versiooni alla laadida, võite külastada allalaadimise vahekaarti ja vaadata kõiki väljaandeid.
Samm 2) Klõpsake allalaaditud faili
Samm 3) Valige Kohanda installimist
Samm 4) Klõpsake nuppu JÄRGMINE
Samm 5) Järgmisel ekraanil
- Valige täpsemad valikud
- Andke kohandatud installikoht. Minu puhul valitakse C-draivi kaust töö hõlbustamiseks
- Klõpsake nuppu Install
Samm 6) Kui install on tehtud, klõpsake nuppu Sule.
7. samm. Kopeerige oma kausta Skriptid tee.
8. samm . Windowsi käsuviibal
- Navigeerige pip-kausta asukohta
- NLTK installimiseks sisestage käsk
pip3 install nltk
- Paigaldamine peaks toimuma edukalt
MÄRKUS . Python2 jaoks kasutage käsku pipip2 install nltk
9. samm . Otsige ja avage Windowsi menüüs Start käsk PythonShell
10. samm. Saate kontrollida, kas installimine on õige, pakkudes alltoodud käsku
import nltk
Kui viga ei näe, on installimine lõpule viidud.
NLTK installimine Maci / Linuxi
NLTK installimine Mac / Unixis nõuab nltki installimiseks pythoni paketihalduri pipi. Kui pipi pole installitud, järgige protsessi lõpuleviimiseks allolevaid juhiseid
1. samm. Uuendage paketi register, tippides alloleva käsu
sudo apt update
2. samm) Pythoni 3 pipi installimine:
sudo apt install python3-pip
Samuti saate pipi installida, kasutades easy_install.
sudo apt-get install python-setuptools python-dev build-essential
Nüüd on installitud easy_install. Käivitage pipi installimiseks järgmine käsk
sudo easy_install pip
Samm 3) NLTK installimiseks kasutage järgmist käsku
sudo pip install -U nltksudo pip3 install -U nltk
NLTK installimine Anaconda kaudu
1. samm. Palun installige anaconda (mida saab kasutada ka erinevate pakettide installimiseks), külastades aadressi https://www.anaconda.com/products/individual ja valige, millise pythoni versiooni peate anaconda jaoks installima.
Märkus. Anakonda installimiseks vaadake üksikasjalikke juhiseid sellest õpetusest
2. samm . Anaconda viipas
- Sisestage käsk
conda install -c anaconda nltk
- Vaadake üle paketiuuendus, minge vanemale versioonile, installige teave ja sisestage jah
- NLTK on alla laaditud ja installitud
NLTK andmekogum
NLTK moodulil on saadaval palju andmekogumeid, mille kasutamiseks peate alla laadima. Tehnilisemalt nimetatakse seda korpuseks . Mõned näited on märksõnad , gutenberg , framenet_v15 , suured_grammatikad ja nii edasi.
Kuidas alla laadida kõik NLTK paketid
1. samm. Käivitage Pythoni tõlk Windowsis või Linuxis
2. samm)
- Sisestage käsud
import nltknltk.download ()
- Avaneb NLTK allalaaditud aken. Andmekogumi allalaadimiseks klõpsake nuppu Laadi alla. See protsess võtab teie Interneti-ühenduse põhjal aega
MÄRKUS. Allalaadimiskohta saate muuta, klõpsates nuppu Fail> Muuda allalaadimiskataloogi
Samm 3) Installitud andmete testimiseks kasutage järgmist koodi
>>> from nltk.corpus import brown>>>brown.words()
[',', 'Fulton', 'maakond', 'suur', 'žürii', 'ütles', ...]
NLP-skripti käitamine
Arutame, kuidas NLP-skript meie kohalikus arvutis käivitatakse. Turul on palju loomuliku keele töötlemise raamatukogusid. Nii et raamatukogu valimine sõltub teie vajadustest. Siin on NLP-teekide loend.
Kuidas käivitada NLTK-skripti
Samm1) Kopeerige oma lemmikkoodiredaktoris kood ja salvestage fail nimega " NLTKsample.py "
from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)
Koodi selgitus:
- Selles programmis oli eesmärk eemaldada igast tüüpi kirjavahemärgid antud tekstist. Impordisime "RegexpTokenizer", mis on NLTK moodul. See eemaldab kõik avaldised, sümbolid, tähemärgid, numbrilised või mis tahes asjad, mida soovite.
- Olete lihtsalt edastanud regulaaravaldise moodulile "RegexpTokenizer".
- Lisaks märkasime sõna, kasutades moodulit "tokenize". Väljund salvestatakse muutuja "filterdText".
- Ja printis need "print ()" abil.
2. samm) käsureal
- Navigeerige faili salvestamise asukohta
- Käivitage käsk Python NLTKsample.py
See näitab väljundit järgmiselt:
["Tere", "Guru99", "Teie", "peate", "ehitama", "a", "väga", "hea", "sait" ja "," mina "," armastus "," külastamine ',' teie ',' sait ']