Mis on urllib?
urllib on Pythoni moodul, mida saab kasutada URL-ide avamiseks. See määratleb funktsioonid ja klassid, mis aitavad URL-i toimingutel.
Pythoni abil saate juurde pääseda ja Internetist andmeid hankida, näiteks XML, HTML, JSON jne. Pythoni abil saate ka nende andmetega otse töötada. Selles õpetuses näeme, kuidas saame andmeid veebist hankida. Näiteks siin kasutasime video URL-i guru99 ja pääseme sellele video-URL-ile juurde Pythoni abil, samuti printime selle URL-i HTML-faili.
Selles õpetuses õpime
- URL-i avamine Urllibi abil
- Kuidas lugeda Pythonis oma URL-i HTML-faili
URL-i avamine Urllibi abil
Enne Interneti-andmetega ühenduse loomiseks koodi käivitamist peame importima URL-i teegi mooduli või "urllib" avalduse.
- Importige urllib
- Määratlege oma põhifunktsioon
- Deklareerige muutuja webUrl
- Seejärel kutsuge URL libi teeki funktsioon urlopen
- URL, mille avame, on guru99 õpetus youtube'is
- Järgmisena trükime tulemuse koodi
- Tulemuskoodi saab kätte kutsudes meie loodud muutuja webUrl funktsiooni getcode
- Teisendame selle stringiks, et seda saaks liita meie stringiga "tulemuse kood"
- See on tavaline HTTP-kood "200", mis näitab, et http-päring on edukalt töödeldud
Kuidas saada HTML-failivormi URL Pythonis
HTML-faili saate lugeda ka Pythoni "lugemisfunktsiooni" abil ja koodi käivitamisel kuvatakse HTML-fail konsoolis.
- Helistage muutuja webURL lugemisfunktsioonile
- Muutuja Loe võimaldab lugeda andmefailide sisu
- Lugege URL-i kogu sisu muutujaks, mida nimetatakse andmeteks
- Käivitage kood - see prindib andmed HTML-vormingusse
Siin on täielik kood
Python 2 näide
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Python 3 näide
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)