Python 读取PDF文件为文本字符并转换为音频
2022/4/20 3:12:33
本文主要是介绍Python 读取PDF文件为文本字符并转换为音频,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
设计思路:首先通过PyPDF2非标准库提供的接口函数将PDF文件中的文本提取出来,然后,再使用pyttsx3非标准库将文本转换为音频文件。
使用pip的方式安装两个非标准库PyPDF2、pyttsx3。
pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip install pyttsx3 -i https://pypi.tuna.tsinghua.edu.cn/simple/
将这两个需要使用到的非标准库导入到当前代码块中。
import pyttsx3 as tsx import PyPDF2 as pdf
编写PDF文件读取函数并且返回text文本字符串。
def read_pdf_to_txt(pdf_file): ''' 读取PDF文件返回text文本 :param pdf_file: PDF文件路径 :return: ''' reader = pdf.PdfFileReader(open(pdf_file, 'rb')) texts = '' for page_num in range(reader.numPages): text = reader.getPage(page_num).extractText() text = text.strip().replace('\n', ' ') texts = texts + text return texts def to_video(text): ''' 文本转换为音频函数 :param text: 文本字符串 :return: ''' sp = tsx.init() sp.save_to_file(text, './vi.mp3') sp.runAndWait() sp.stop()
调用to_video函数完成音频文件的转换。
to_video(text=read_pdf_to_txt('./vi.pdf'))
这篇关于Python 读取PDF文件为文本字符并转换为音频的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-12-22初创企业的效率秘诀!实用的看板式任务管理工具推荐
- 2024-12-22新能源汽车销售难题如何破?看板工具助力门店管理升级
- 2024-12-218 款现代无代码工具,轻松提升开发者工作效率 ???????
- 2024-12-21从线索跟踪到业绩提升:销售任务管理系统推荐
- 2024-12-21刚刚发布RobinReach:多渠道社交媒体管理工具 ??
- 2024-12-21跨地域协作无压力!推荐几款必备的可视化协同工具
- 2024-12-21初学者指南:轻松掌握文章编辑器
- 2024-12-21Excel数据导出教程:让数据迁移变得简单
- 2024-12-21Excel数据导入入门教程
- 2024-12-215分钟速览:优化项目管理必备的5款高效工具