【原创】用编程批量下载高清连续剧

2020年04月18日 137点热度 0人点赞 0条评论

上一篇文章有讲述到使用编程抓取VIP高质量歌曲,那么今天来分享我用python编程爬取高清的连续剧的思路,以后要下载新剧,都不用那么头疼。前天完成的Jxxx平台抓取的歌曲后,第二天Jxxx平台被我抓取的相关页面便不可访问。唉,都不知是不是我造成的xD。没事,那么接下来讲我的编程思路。

抓取连续剧的方法与上一篇文章所说的方法是使用相同的技术模块,那么废话不多说。首先找寻任意的网站有你想要的连续剧,接着开始分析网站内的部构造,一样使用抓包工具查找相关的信息,比如流媒体的视频大多数都是使用分割手段来播放的视频,那么我们只需要找到ts文件所在位置,那么便可以轻而易举的爬下每个分段的视频。但是,问题在于当抓取ts文件后,都是分段的视频,还要把它们都给合拼起来的话,可以使用cmd直接拼接。

拼接参数如下:

copy /b *.ts xxx.mp4  

那么上面的方法是非常麻烦对不吧,需要一个一个的拼接,那么有没有更快更准更好的方法呢?下面我来讲快狠准的方法,首先流媒体的视频一般都会封装在一个m3u8的文件当中,记录了所有ts文件以及每个分割时间,那么我们可以利用这个m3u8的文件直接完成下载,当然我们需要用到一个插件叫做ffmpeg,这个插件可以把视频进行格式化处理,那么在我编程思路上是怎么达成的呢?

首先,我照样使用xpath语法抓取了连续剧的URL地址以及集数,那么接着我们可以把我们抓好的链接使用request模块获取循环响应,接着把获取响应的链接输出成HTML的的标记语言.text方法,接着再从中用xpath的语法取出m3u8地址,把所有取到的地址合成以下的字符串:

字符串格式化处理:

f'ffmpeg -i "{video_urls_m3u8}" -vcodec copy -acodec copy {video_id}.mp4'

video_urls_m3u8 是指么m3u8的地址,而video_id是指连续剧的剧集

当然以上的都是自己去定义的,之后,再保存到bat文件,那么直接运行就开始下载啦~😁

下载过程会显示子帧,大小,速度等的信息~

可能说我的方法来的比较笨,但是却能达到我想要的效果,只要能够下载,那么就算过关啦。哈哈。下载到的视频也算是高清的,而且以后要下载其他的连续剧只要改一改URL就可以了。真的是太方便了啦~这个也是原创的噢!如果是因为个人学习以及研究,可以联系我获取我写好的程序代码。观剧ing.....嘻嘻

与我联系获取程序代码

YenYoong☕

当你能梦的时候就不要放弃梦~😎

文章评论