投递简历总是石沉大海?HR表现的机会都不给你?【Python爬虫实战:简历模板采集】
2021/9/20 17:29:03
本文主要是介绍投递简历总是石沉大海?HR表现的机会都不给你?【Python爬虫实战:简历模板采集】,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
简历模板下载
- 工具准备
- 项目思路解析
- 简易源码分享
工具准备
数据来源: 站长素材
开发环境:win10、python3.7
开发工具:pycharm、Chrome
项目思路解析
找到进入详情页面的超链接地址,以及对应简历的名字
提取出参数信息
使用xpath语法的时候需要注意网页源代码跟浏览器页面渲染的页面会有出入,提取数据需要根据网页源代码来提取
html_data = etree.HTML(page) a_list = html_data.xpath("//div[@class='box col3 ws_block']/a") for a in a_list: resume_href = 'https:' + a.xpath('./@href')[0] resume_name = a.xpath('./img/@alt')[0]
进入详情页面
找到对应的详情页面的地址
提取对应rar的下载地址
resume_tree = etree.HTML(resume_page) resume_link = resume_tree.xpath('//ul[@class="clearfix"]/a/@href')[0]
简易源码分享
import requests from lxml import etree headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0', } for i in range(2, 10): url = f'https://sc.chinaz.com/jianli/free_{str(i)}.html' # 设置相应的路由i response = requests.get(url=url, headers=headers) html_data = etree.HTML(response.text) a_list = html_data.xpath("//div[@class='box col3 ws_block']/a") for a in a_list: new_url = 'https:' + a.xpath('./@href')[0] name = a.xpath('./img/@alt')[0] res = requests.get(url=new_url) # 进入简历模板详情页面 resume_tree = etree.HTML(res.text) resume_url = resume_tree.xpath('//ul[@class="clearfix"]/a/@href')[0] result = requests.get(url=resume_url, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0'}).content # 获取二进制数据 path = './moban/' + name + '.rar' with open(path, 'wb') as fp: fp.write(result) # 保存文件
这篇关于投递简历总是石沉大海?HR表现的机会都不给你?【Python爬虫实战:简历模板采集】的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-14获取参数学习:Python编程入门教程
- 2024-11-14Python编程基础入门
- 2024-11-14Python编程入门指南
- 2024-11-13Python基础教程
- 2024-11-12Python编程基础指南
- 2024-11-12Python基础编程教程
- 2024-11-08Python编程基础与实践示例
- 2024-11-07Python编程基础指南
- 2024-11-06Python编程基础入门指南
- 2024-11-06怎么使用python 计算两个GPS的距离功能-icode9专业技术文章分享