前言
需要用到requests
和lxml
库
requests:
requests是使用Apache2 licensed 许可证的HTTP库。用python编写。比urllib2模块更简洁。
Request支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动响应内容的编码,支持国际化的URL和POST数据自动编码。在python内置模块的基础上进行了高度的封装,从而使得python进行网络请求时,变得人性化,使用Requests可以轻而易举的完成浏览器可有的任何操作。现代,国际化,友好。requests会自动实现持久连接keep-alive
lxml:
python用来解析xml和html模块,用这个模块就可以使用xpath语法。xpath就是用来筛选html或者xml中元素语法。如果匹配标签和元素,则返回element对象,如果匹配到的是标签和text,则返回字符串。
附图
必应爬取
另一种方法
来源于https://blog.csdn.net/lx1315998513/article/details/105731087
版权属于:不冷
本文链接:https://www.buleng.xyz/archives/133/
转载时须注明出处及本声明
新年快乐
还没过年呢
提前祝贺୧(๑•̀⌄•́๑)૭ 怕到时候写项目没时间
哈哈哈,新年快乐!