C# 使用流读取大型TXT文本文件
2022/8/5 1:24:06
本文主要是介绍C# 使用流读取大型TXT文本文件,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
一、前言
业务需要读取txt的内容,导入到数据库当中,博主百度了各种方法,大部分都会导致内存溢出异常,由此结合网上的各种方法,解决了该异常。
二、程序框架
.NET 4.5
WinForm
三、具体实现
1.1 TXT结构
可以看到该文件大小300多兆,里面的条数差不多60w左右,每行当中的数据使用Tab分割
1.2 代码
private void NewInsert1306(string fileDir) { FileStream fs = new FileStream(fileDir, FileMode.Open, FileAccess.Read);//创建一个文件流 参数(文件位置,打开此文件(如果没有会抛异常),文件访问权限(只读)) StreamReader sr = new StreamReader(fs);//创建一个txt读取流,从字节流中读取字符 参数(流) using (var db = new CFTech.His.Models.DbContext()) { try { Stopwatch sw = new Stopwatch();//计时器 sw.Start();//开始计时 int num = 0;//计算总条数 db.BeginTransaction(); //死循环,由于不知道到底有几行,跳出时机在循环体内部判断 while (true) { var arrList = new List<string>();//存放读取的数据 while (true) { var str = sr.ReadLine();//读取一行内容返回改行的字符串(一个换行符一行),fs有一个fs.position属性(流的位置),该属性在进行任何读取操作时会根据读取的实际情况进行移动,当该位置到达流的末尾时,此方法返回null,该位置也可手动设置fs.position=xxx(long类型) if (str == null) break;//跳出时机就是读完的时候 arrList.Add(str); if (arrList.Count > 10000) break;//该跳出用于入库,博主这里10000条入一次库 } if (arrList.Count == 0) break;//当存放数据的list条数为0时,循环就可以结束了 num += arrList.Count(); ResBase res = Insert1306(arrList);//该方法就是具体的入库操作了,可根据自己的实际情况去写 if (res.ErrCode == -1) { MessageBox.Show(res.ErrMsg); return; } } db.CommitTransaction(); fs.Close();//释放文件流 sw.Stop();//停止计时 MessageBox.Show("入库条数:" + num.ToString()+"------" + "耗时:" + sw.Elapsed); return; } catch (Exception e) { MessageBox.Show(e.Message); db.RollbackTransaction(); } } }
1.3效率(数据库:Oracle,orm框架:fireasy)
该方法为同步方法,全在主线程上操作,效率肯定没有异步快,UI会出现假死情况,以后在研究吧,差不多1分钟入库6w多,由于行业性质,勉强能接受吧
1.4遇到的坑
这是同事之前用的方法,他也没想到会遇到这么大的txt,该方法读取文件中的所有行,并且将每行数据转换为数组,对于小文件很方便,但是当文件大于一定程度时,必定会抛内存溢出异常,至于到底支持多大的文件,就没有具体测试了(个人认为和内存无关,计算机为16G内存,运行次方法时还没开始跑内存就直接抛了异常,可能是框架原因,亲测在core里面,使用相同方法,读取同一个20w行的文本,framework直接抛异常,core成功运行)
END-----------------欢迎大家留言讨论
这篇关于C# 使用流读取大型TXT文本文件的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2022-03-01沐雪多租宝商城源码从.NetCore3.1升级到.Net6的步骤
- 2024-12-06使用Microsoft.Extensions.AI在.NET中生成嵌入向量
- 2024-11-18微软研究:RAG系统的四个层次提升理解与回答能力
- 2024-11-15C#中怎么从PEM格式的证书中提取公钥?-icode9专业技术文章分享
- 2024-11-14云架构设计——如何用diagrams.net绘制专业的AWS架构图?
- 2024-05-08首个适配Visual Studio平台的国产智能编程助手CodeGeeX正式上线!C#程序员必备效率神器!
- 2024-03-30C#设计模式之十六迭代器模式(Iterator Pattern)【行为型】
- 2024-03-29c# datetime tryparse
- 2024-02-21list find index c#
- 2024-01-24convert toint32 c#