1.1 学习urllib.requests模块 Requests的底层原理是urllib,不管在Python2/Python3,都是通用,方法一样。 Requests简单易用,而在早期的Python2的urllib相对来说比较麻烦,但是老师说就算不会用,也要看懂urllib,因为很多遗留下来的项目很多都是使用urllib底层原理实现的Requests。 Python 2 版本:urllib2、urllib Python 3 版本:把urllib和urllib2合并,urlib.requests Requests库的…

2020年04月30日 0条评论 168点热度 0人点赞 阅读全文

2.1 HTTP请求 HTTP分别为GET和POST请求,GET是从服务器上获取数据,POST是向服务器传送数据。 GET:查询参数都会显示在URL上,例子:https://www.yybloger.com/?s=python POST:查询参数和需要提交的数据都会隐藏在表单里,不会显示出来,例子:网页的登入页面 2.2 URL组成部分 URL(Uniform Resource Locator)也称统一资源定位符 主机名也就是网站名,一个域名(Domain Name)可以有很多个子域名。 一般网站的端口号默认为HT…

2020年04月29日 0条评论 206点热度 0人点赞 阅读全文

找到对方IP(门牌号),可以进行通信,要把数据发送到指定的应用程序上,由于要识别相关的应用程序,我们把这些叫做“端口”因此不同的应用程序的端口也不相同,互联网上也有通讯的规则,通讯的规则我们称为协议

2020年04月28日 0条评论 208点热度 1人点赞 阅读全文

爬虫就是代替人去模拟浏览器进网页操作,爬虫我们也叫做蜘蛛(Spider)按照一定的规则,自动抓取一些互联网的信息,只要浏览器能做的事情,那么爬虫也能做。

2020年04月27日 0条评论 228点热度 2人点赞 阅读全文

上一篇文章有讲述到使用编程抓取VIP高质量歌曲,那么今天来分享我用python编程爬取高清的连续剧的思路,以后要下载新剧,都不用那么头疼。前天完成的Jxxx平台抓取的歌曲后,第二天Jxxx平台被我抓取的相关页面便不可访问。唉,都不知是不是我造成的xD。没事,那么接下来讲我的编程思路。

2020年04月18日 0条评论 217点热度 0人点赞 阅读全文
1234510