每次我们都要上购物网站去找我们想要买的东西,然而想要快速的知道那些商品的价格的最低价钱,市价上卖出的价格又是多少?那些是比较可靠的商店?品质比较好的?那么我们就要使用爬虫来获取这些数据,再进行数据分析,那么今天使用了Selenium框架来简单的爬取在Shopee上的一些商品的基本信息,Ex:商品名称,商品价格,出货地点以及商品的链接。

9月 25, 2020 0条评论 1262点热度 4人点赞 YY部落站(Admin) 阅读全文

一般上我们会在网页要登录的时候,会要求要输入图形验证码,而这些验证码则会阻碍我们进行爬虫,因此我们能够使用一种能将图片的文字翻译出来。而能够将图片从中翻译出来的文字,我们称为光学文字识别(Optical Character Recognition),简写为OCR。

7月 11, 2020 1条评论 960点热度 3人点赞 YY部落站(Admin) 阅读全文

上一篇,我们讲到Selenium是一个web的自动化测试工具,可以模拟人去浏览网页,那么我们来看看Selenium的使用方法。

6月 19, 2020 0条评论 1028点热度 0人点赞 YY部落站(Admin) 阅读全文

Python中执行JS代码,通常两个库:js2py,pyexecjs。js2py是纯python实现的库,用在python中执行的js代码,本质上是将js代码翻译成python代码。js2py安装方法:

6月 3, 2020 0条评论 957点热度 0人点赞 YY部落站(Admin) 阅读全文

input() 输入函数不论输入扫码返回值都为字符串当程序中有input() 函数时,程序会停止在input() 函数这块,这时程序阻塞。输入年龄,判断年龄>18则输出”你好呀,小靓仔”;否则输出”你好呀!小朋友”

6月 3, 2020 0条评论 561点热度 0人点赞 YY部落站(Admin) 阅读全文
1234512