【原创】用编程批量下载VIP高质量歌曲

2020年04月16日 305点热度 0人点赞 0条评论

之前答应了某某人要帮他写个下载电影/音频的代码,因此MCO期间写了一小程序,在这里呢,我使用了Python编程爬取了Jxxx平台上的高质量的中文排行榜歌曲,那么这类的爬虫抓取资源算是犯法吗?其实,爬虫并不算犯法,只看使用爬虫的工程师是否做违反的事,如果说犯法,那么知名的谷歌、百度等各大搜索引擎网站都不就犯法了嘛!爬虫就是抓取浏览器上能访问,做得到的事情而已。

广告时间:电脑编程是一门综合性的现代技术,同时还能培养你的专注力、逻辑思考、解决问题的能力以及充分发挥创造力。有没有想和我一起学习编程的伙伴?😁

这里记录我爬取的步骤:(给大家一些编程思路)

首先找到想爬取的网站,不管是视频、音频等的内容,只要浏览器能做到的事,那么爬虫也能做。有时想要下载歌曲,下载电影,下载电子书,小说等等,可能会遇到要会员登入,又要注册/订阅,太过麻烦了,把这些麻烦的事节省下来,写一段代码,以后想抓什么资源,就爬你要的就行,那么爬取资源要注意了,如果网站说明了是不让你去爬取的资源,比如:VIP资源,那么你静悄悄就好,别大声宣扬噢!

步骤一:取得网站URL的地址

步骤二:使用浏览器抓包工具,看看有没有你要抓的资源。比如HTML标记语言会有一些信息,XML/JS等等。有效内容可能会有经过加密处理,以及反爬机制的信息,就会比较辣手一些。刚好被我排查了一圈,发现了Jxxx平台的Json加密信息,因此是没什么大问题了。

步骤三:导入Request模块,请求获取URL地址响应以及模拟浏览器,看看是否取得Response [200],表示通信成功。

步骤四:使用xPath工具,用xPath语法抓取你想要的信息,如:歌名/戏名,以及它的URL地址。

步骤五:导入etree模块,from lxml,使用zip()函数遍历,就可以形成一一对应的歌名和URL地址。

步骤六:有些网站可能把他给封装在json里面,就是那么头疼,那么我们把它转成字典。把MP3地址取出,就会发现与歌名的URL地址有共同点,那么我们用切片split()的方法把URL地址相互结合。之后再request请求获取地址内容

步骤七:保存档案,完事。就会自动帮你把所有的热门歌曲全部下载到电脑,而且比一般的下载速度还来的快噢!因为实现了不受http限速。

接下来就是享受的时候对吧!由于是原创的程序代码(在其他地方是找不到的哈),就不对外公开了,如果用途是拿来学习或个人研究所需要,那么可以与我联系免费获取我写好的代码。

接下来我也会写一些学习的知识点,当作笔记记录,也许下次在我部落格可以发现神秘的迹象。(开玩笑😁)

与我联系获取程序代码

YenYoong☕

当你能梦的时候就不要放弃梦~😎

文章评论