当前位置：主页 > python教程 > python 爬取网站

python 爬取免费简历模板网站的示例

发布：2022-10-18 09:01:25 59

给网友们整理python相关的编程文章，网友翟信鸿根据主题投稿了本篇教程内容，涉及到python、爬虫、python、爬取网站、python、爬取免费简历模板网站、python 爬取网站相关内容，已被754网友关注，相关难点技巧可以阅读下方的电子资料。

python 爬取网站

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

以上就是python 爬取免费简历模板网站的示例的详细内容，更多关于python 爬取网站的资料请关注码农之家其它相关文章！

上一篇：Python之字典对象的几种创建方法
下一篇：python 5个实用的技巧

参考资料

python整数反转输出的实例讲解

发布：2021-08-25

给定一个32位的符号整数，返回它的反转整数，正常整数方法实现，利用余数*10累加的方法完成。需要注意的是，python对整数除法采用“向下取整”机制，所以正数和负数要区别运算。整数转字

Python字符串处理示例代码

发布：2020-02-17

这篇文章主要介绍了Python字符串处理的8招秘籍，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

python获取图片分辨率的方法

发布：2021-04-13

今天小编就为大家分享一篇python 获取图片分辨率的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

搞清楚Python中capitalize()与title()的区别

发布：2020-03-05

下面小编就为大家分享一篇基于Python中capitalize()与title()的区别详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

python flask 多对多表查询功能

发布：2022-09-06

给网友朋友们带来一篇关于python的教程，我们在flask的学习中，会难免遇到多对多表的查询，今天我也遇到了这个问题。下面把我的思路分享到脚本之家平台，供大家参考

用python爬取租房网站信息的代码

发布：2022-06-27

给网友朋友们带来一篇关于python的教程，今天小编就为大家分享一篇关于用python爬取租房网站信息的代码，小编觉得内容挺不错的，现在分享给大家，具有很好的参考价值，需要的朋友一起跟随小编来看看吧

python爬取m3u8连接的视频

发布：2022-04-14

这篇文章主要为大家详细介绍了python如何爬取m3u8连接的视频，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

Python机器学习之Scikit-Learn教程

发布：2020-03-02

这篇文章主要介绍了基于Python和Scikit-Learn的机器学习探索的相关内容，小编觉得还是挺不错的，这里分享给大家，供需要的朋友学习和参考。

网友讨论

最新更新

最近更新

05-29Go语言面试八股文大全
05-29MySQL 8.4中文手册
05-29华为OD机考100题(真题)
05-29Python+OpenCV入门计算机视觉实战项目52讲 v1.0
05-21敏捷软件测试实践指南
05-21编写可维护的JavaScript
05-21Modbus协议
05-21竹林蹊径：深入浅出Windows驱动开发
05-21PCIE规范合集(PCI_Express_Base 1.0/2.1/3.0/4.0/5.0/6.0)
05-21深入理解Rust并发编程

热门资源

python 爬取免费简历模板网站的示例

python 爬取网站

参考资料

易学Python PDF电子书

Python极客项目编程 PDF电子书

python3.8.2官方文档：API参考手册编程资源

相关文章

python整数反转输出的实例讲解

Python字符串处理示例代码

python获取图片分辨率的方法

搞清楚Python中capitalize()与title()的区别

python flask 多对多表查询功能

用python爬取租房网站信息的代码

python爬取m3u8连接的视频

Python机器学习之Scikit-Learn教程

网友讨论