2.1 HTTP请求 HTTP分别为GET和POST请求,GET是从服务器上获取数据,POST是向服务器传送数据。 GET:查询参数都会显示在URL上,例子:https://www.yybloger.com/?s=python POST:查询参数和需要提交的数据都会隐藏在表单里,不会显示出来,例子:网页的登入页面 2.2 URL组成部分 URL(Uniform Resource Locator)也称统一资源定位符 主机名也就是网站名,一个域名(Domain Name)可以有很多个子域名。 一般网站的端口号默认为HT…

2020年04月29日 0条评论 101点热度 0人点赞 阅读全文

找到对方IP(门牌号),可以进行通信,要把数据发送到指定的应用程序上,由于要识别相关的应用程序,我们把这些叫做“端口”因此不同的应用程序的端口也不相同,互联网上也有通讯的规则,通讯的规则我们称为协议

2020年04月28日 0条评论 124点热度 1人点赞 阅读全文

爬虫就是代替人去模拟浏览器进网页操作,爬虫我们也叫做蜘蛛(Spider)按照一定的规则,自动抓取一些互联网的信息,只要浏览器能做的事情,那么爬虫也能做。

2020年04月27日 0条评论 147点热度 2人点赞 阅读全文

上一篇文章有讲述到使用编程抓取VIP高质量歌曲,那么今天来分享我用python编程爬取高清的连续剧的思路,以后要下载新剧,都不用那么头疼。前天完成的Jxxx平台抓取的歌曲后,第二天Jxxx平台被我抓取的相关页面便不可访问。唉,都不知是不是我造成的xD。没事,那么接下来讲我的编程思路。

2020年04月18日 0条评论 137点热度 0人点赞 阅读全文

之前答应了某某人要帮他写个下载电影/音频的代码,因此MCO期间写了一小程序,在这里呢,我使用了Python编程爬取了Jxxxx平台上的高质量的中文排行榜歌曲,那么这类的爬虫抓取资源算是犯法吗?其实,爬虫并不算犯法,只看使用爬虫的工程师是否做违反的事,如果说犯法,那么知名的谷歌、百度等各大搜索引擎网站都不就犯法了嘛!爬虫就是抓取浏览器上能访问,做得到的事情而已。

2020年04月16日 0条评论 144点热度 0人点赞 阅读全文
1234510