1.4 python 文件处理
2021/10/10 22:45:30
本文主要是介绍1.4 python 文件处理,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
Applications of Deep Neural Networks with Keras
基于Keras的深度神经网络应用
著:Jeff Heaton 译:人工智能学术前沿
目录
1.Python基础
2.机器学习Python
3.TensorFlow简介
4.表格类数据的训练
5.正则化和Dropout
6.用于计算机视觉的卷积神经网络
7.生成对抗网络
8.Kaggle数据集
9.迁移学习
10.Keras的时间序列
11.自然语言处理与语音识别
12.强化学习
13.Advanced/Other Topics
14.其他神经网络技术
1.4 python 文件处理
Part 1.4: File Handling
文件通常包含你用来训练人工智能程序的数据。经过训练后,您的模型可以使用实时数据来形成预测。这些预测可能也有记录。不管你是在预测还是在训练,文件处理对人工智能从业者来说都是一项重要的技能。
作为人工智能从业者,有许多不同类型的文件必须处理。以下列出了其中一些文件类型:
1.CSV文件(通常具有. CSV扩展名)包含类似于电子表格数据的表格数据。
2.图像文件(通常扩展名为.png或.jpg)保存计算机视觉所需的图像。
3.文本文件(通常以.txt扩展名)保存非结构化文本,是自然语言处理的关键。
4.JSON(通常有. JSON扩展名)包含半结构化的文本数据,以人类可读的基于文本的格式。
5.H5(可以有很多扩展)包含以人类可读的基于文本格式的半结构化文本数据。Keras和TensorFlow将神经网络存储为H5文件。
6.音频文件(通常有一个扩展名,如.au或.wav)包含录制的声音。
数据可以来自多种来源。在本类中,我们从三个主要位置获取数据:
- 你的硬盘——这种类型的数据存储在本地,Python访问它的路径类似于:c:\data\myfile.csv或/Users/jheaton/data/myfile.csv。
- 互联网——这种类型的数据驻留在云中,Python通过类似于https://data.heatonresearch.com/data/t81-558/iris.csv的URL访问它。
- 谷歌驱动器(云)-如果你在Google CoLab中编写代码,你可以使用GoogleDrive来保存和加载一些数据文件。CoLab将你的GoogleDrive挂载到类似以下路径:/content/drive/My drive/ myfile.csv。
读取CSV文件
Read a CSV File
Python程序可以使用Pandas读取CSV文件。我们将在下一节中看到更多关于Pandas的内容,但目前,它的一般格式是:
import pandas as pd df = pd.read_csv("https://data.heatonresearch.com/data/t81-558/iris.csv")
上面的命令从互联网加载Fisher的Iris数据集。它可能需要几秒钟的时间来加载,因此最好将加载代码保存在一个单独的Jupyter笔记本单元格中,这样在测试程序时就不必重新加载它。您可以通过这种方式加载Internet数据、本地硬盘和谷歌驱动器数据。
现在已经加载了数据,可以使用这个命令显示前5行。
display(df[0:5])
读取(流)大型CSV文件
Read (stream) a Large CSV File
Pandas通常把整个CSV文件读入内存。然而,有时您可能希望“stream”一个巨大的文件。stream允许您一次处理一个记录。当文件大到不能够全部加载到内存时,你可以使用Stream处理一个巨大文件的部分记录。
下面的代码加载Iris数据集并计算平均值,每次一行。这种技术适用于大文件。
import csv import urllib.request import codecs import numpy as np url = "https://data.heatonresearch.com/data/t81-558/iris.csv" urlstream = urllib.request.urlopen(url) csvfile = csv.reader(codecs.iterdecode(urlstream, 'utf-8')) next(csvfile) # Skip header row sum = np.zeros(4) count = 0 for line in csvfile: # Convert each row to Numpy array line2 = np.array(line)[0:4].astype(float) # If the line is of the right length (skip empty lines), then add if len(line2) == 4: sum += line2 count += 1 # Calculate the average, and print the average of the 4 iris # measurements (features) print(sum/count)
输出
[5.84333333 3.05733333 3.758 1.19933333]
读取文本文件
Read a Text File
下面的代码将美国独立宣言(USA Declaration of Independence)读为文本文件。这段代码将文档流化并逐行读取。这段代码可以处理一个巨大的文件。
import urllib.request url = "https://data.heatonresearch.com/data/t81-558/datasets/sonnet_18.txt" with urllib.request.urlopen(url) as urlstream: for line in codecs.iterdecode(urlstream, 'utf-8'): print(line.rstrip())
读取图像文件
Read an Image
计算机视觉是神经网络优于其他模型的领域之一。为了支持计算机视觉,Python程序员需要了解如何处理图像。在本课程中,我们将使用Python PIL包进行图像处理。下面的代码演示了如何从URL加载图像并显示它。
%matplotlib inline from PIL import Image import requests from io import BytesIO url = "https://upload.wikimedia.org/wikipedia/commons/9/92/Brookings.jpg" response = requests.get(url) img = Image.open(BytesIO(response.content)) img
这篇关于1.4 python 文件处理的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-26Python基础编程
- 2024-11-25Python编程基础:变量与类型
- 2024-11-25Python编程基础与实践
- 2024-11-24Python编程基础详解
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南