20. 处理二进制文件

2021/4/25 10:25:21

本文主要是介绍20. 处理二进制文件,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

例如,wav是一种音频文件的格式,音频文件为二进制文件。wav文件由头部信息和音频采样数据构成。前面为头部信息,包括声道数、采样频率、编码位宽等,后面是音频采样数据。

要求:使用Python,分析一个wav文件头部信息,处理音频数据。

解决方案:

通过内置函数open()指定mode参数为rb,以二进制模式读取二进制文件。

解析二进制数据可以使用标准库中的struct.unpack()方法。


  • 对于open()函数:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

打开file并返回对应的file object。如果该文件不能打开,则触发OSError

可用的模式有:

mode意义
‘r’读取(默认)
‘w’写入,并先截断文件
‘x’排它性创建,如果文件已存在则失败
‘a’写入,如果文件已存在则在末尾追加
‘b’二进制模式
‘t’文本模式(默认)
‘+’更新磁盘文件(读取并写入)
  • 对于struct.unpack()函数:
struct.unpack(format, buffer)

根据格式字符串format从缓冲区buffer解包(假定是由pack(format, …)打包)。结果为一个元组,即使其只包含一个条目。缓冲区的字节大小必须匹配格式所要求的大小。


  • 方案示例:
import structdef find_subchunk(f, name):
    f.seek(12)              #wav文件第一块大小为12
    
    while True:
        chunk_name = f.read(4)
        chunk_size, = struct.unpack('i', f.read(4))             #i表示int类型,4字节

        if chunk_name == name:
            return f.tell(), chunk_size

        f.seek(chunk_size, 1)               #1代表从当前位置开始算起f = open('demo.wav', 'rb')offset, size = find_subchunk(f, b'data')                #查看开头到data部分的指针偏移量,及data大小print(offset, size, offset + size, end=' ')               #offset+size为该demo.wav文件总大小118 31684608 31684726               #结果




这篇关于20. 处理二进制文件的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程