现今我生活在大数据时代的社会中,许多数据都是在我们日常生活中产生的,这些数据都非常的珍贵,而今天我来分享之前使用Python来爬取的天气数据,而我为什么会使用Beautiful Soup来爬取天气数据呢?因为这数据是在一个表格当中,而Beautiful Soup专为HTML或XML文件中提取数据而生。

9月 29, 2020 0条评论 571点热度 0人点赞 YY部落站(Admin) 阅读全文

每次我们都要上购物网站去找我们想要买的东西,然而想要快速的知道那些商品的价格的最低价钱,市价上卖出的价格又是多少?那些是比较可靠的商店?品质比较好的?那么我们就要使用爬虫来获取这些数据,再进行数据分析,那么今天使用了Selenium框架来简单的爬取在Shopee上的一些商品的基本信息,Ex:商品名称,商品价格,出货地点以及商品的链接。

9月 25, 2020 0条评论 1023点热度 3人点赞 YY部落站(Admin) 阅读全文

一般上我们会在网页要登录的时候,会要求要输入图形验证码,而这些验证码则会阻碍我们进行爬虫,因此我们能够使用一种能将图片的文字翻译出来。而能够将图片从中翻译出来的文字,我们称为光学文字识别(Optical Character Recognition),简写为OCR。

7月 11, 2020 1条评论 850点热度 3人点赞 YY部落站(Admin) 阅读全文

上一篇,我们讲到Selenium是一个web的自动化测试工具,可以模拟人去浏览网页,那么我们来看看Selenium的使用方法。

6月 19, 2020 0条评论 859点热度 0人点赞 YY部落站(Admin) 阅读全文

Python中执行JS代码,通常两个库:js2py,pyexecjs。js2py是纯python实现的库,用在python中执行的js代码,本质上是将js代码翻译成python代码。js2py安装方法:

6月 3, 2020 0条评论 790点热度 0人点赞 YY部落站(Admin) 阅读全文