网站首页 站内搜索

搜索结果

查询Tags标签: df,共有 535条记录
  • 机器学习-关于心脏病的数据分析

    # 本次采用KNN算法进行解析 import numpy as np import pandas as pd import matplotlib.pyplot as plt import warnings warnings.filterwarnings(ignore) #用于忽略由于版本更新等不影响的bug import seaborn as sns from matplotlib import rcParams from sklearn.mode…

    2022/7/10 23:54:37 人评论 次浏览
  • linux 中awk命令实现字符串的精确匹配

    001、root@DESKTOP-1N42TVH:/home/test3# ls test.txt root@DESKTOP-1N42TVH:/home/test3# cat test.txt ## 测试数据 AKCR02000001 df AKCR02000001 df AKCR02000001 er AKCR02000001.1 dg AKCR02000001.1 der AKCR02000001.1 fg AKCR02000001.2 ee AKCR0…

    2022/7/9 5:20:25 人评论 次浏览
  • Python3教程:Pandas模块删除数据的几种情况

    开始之前,pandas中DataFrame删除对象可能存在几种情况 1、删除具体列 2、删除具体行 3、删除包含某些数值的行或者列 4、删除包含某些字符、文字的行或者列 本文就针对这四种情况探讨一下如何操作。 数据准备 模拟了一份股票交割的记录。 In [1]: import pandas as pdIn …

    2022/7/8 14:23:08 人评论 次浏览
  • python dataframe 一行变多行

    python代码报错: DataFrame object has no attribute explode 原因是pandas版本低于0.25,在0.25以上才有explode函数,所一不想升级的可以自己拆分 没有explode 原始数据: import pandas as pd df = pd.DataFrame({country: [China,US,Japan, Japan,EU,Australia,Austr…

    2022/7/6 14:21:34 人评论 次浏览
  • 20220703 爬虫&数据处理

    1、 昨天已经获取到数据,今天发现dataframe数据单列数据存储在一行中,分列不太好分,我上网查了下。从列表转换为dataframe,正常是存储为一行,需要转置下发现确实变成逗号分开的形式了。代码如下:data = get_data() df = pd.DataFrame(data=[data],index=[a]).T prin…

    2022/7/3 23:23:08 人评论 次浏览
  • python的pandas读取excel文件中的数据

    一、读取Excel文件使用pandas的read_excel()方法,可通过文件路径直接读取。注意到,在一个excel文件中有多个sheet,因此,对excel文件的读取实际上是读取指定文件、并同时指定sheet下的数据。可以一次读取一个sheet,也可以一次读取多个sheet,同时读取多个sheet时后续操…

    2022/6/30 14:22:26 人评论 次浏览
  • 效率效率!如何使用Python读写多个sheet文件

    前言怎么样使用Python提高自己的工作效率,今天就给大家分享这个吧。我们经常用pandas读入读写excel文件,经常会遇到一个excel文件里存在多个sheet文件,这个时候,就需要一次性读取多个sheet的数据并做相应的数据分析或数据处理,最后再写入新的excel文件(同样是多个sh…

    2022/6/30 1:51:12 人评论 次浏览
  • 总结出现问题后应该考虑到的点

    1、节点出现问题,一定首先要看硬盘(df)以及内存(free -m) 一定要看!!!2、抓包工具启动的过程中(Charles)会影响某些连接,可能会产生许多奇怪的问题3、当查询到的数据与数据库中的数据不一致的情况下,首先考虑缓存(缓存是否与数据库中的数据不一致了)

    2022/6/27 6:21:05 人评论 次浏览
  • sns中的displot的模仿

    弗里德曼-迪亚科尼斯规则 在统计学中,Freedman-Diaconis规则用于确定直方图中的条柱宽度, 它以David A.Freedman和Persi Diaconis的名字命名。该规则定义: \[条柱宽度 = 2 \times \frac{IQR}{\sqrt[3]{n}} \]其中,IQR是四分位距,n是观测样本数目。 import numpy as np…

    2022/6/24 23:24:42 人评论 次浏览
  • 数据可视化练习(2)

    任务二:多个饼图呈现各省份不同等级住宿场所占比 企业消费平台为了更好地发展企业业务,向企业客户推荐符合其定位的协议住宿场所,需要分析上题中Top5省份的“三星级/舒适”、“四星级/高档”和“五星级/豪华”住宿场所以及“其它类别”住宿场所(除上述三类外,其余类型…

    2022/6/24 23:19:24 人评论 次浏览
  • python数据处理:获取Dataframe中的一列或一行

    解决方案 df[w] #选择表格中的w列,使用类字典属性,返回的是Series类型df.w #选择表格中的w列,使用点属性,返回的是Series类型df[[w]] #选择表格中的w列,返回的是DataFrame属性data[0:2] #返回第1行到第2行的所有行,前闭后开,包括前不包括后data[1:2] #返回第2…

    2022/6/23 1:22:10 人评论 次浏览
  • python 读写excel

    读取excel中的内容def get_app_service():df = pd.read_excel("test.xlsx",sheet_name=test) #读取excel对应的sheetdata = list(df[service]) #读取一列# print(data)return data写数据到excel,生成新的excelwriter = pd.ExcelWriter("test.xlsx")…

    2022/6/18 1:52:08 人评论 次浏览
  • python将csv文件导入neo4j数据库中

    其实就是按行解析csv文件,并将其中数据分为“结点”、“关系”两种类型,构建利用Node()方法构建节点;Relationship()方法构建关系 csv结构entity1,relation1,entity2,relation2,info,relation3,keyword 人格纠纷权,包含,一般人格权纠纷,描述,一般人格权纠纷是指因侵害他…

    2022/6/12 6:20:26 人评论 次浏览
  • 7.Spark SQL

    未交原因:忘记交了1.请分析SparkSQL出现的原因,并简述SparkSQL的起源与发展。spark出现的目的是为了替代Mapreduce,解决Mapreduce计算短板。我们知道最初的计算框架叫 mapreduce,他的缺点是计算速度慢,还有一个就是代码比较麻烦,所以有了 hive;hive 是把类 sql 的语…

    2022/6/7 2:20:59 人评论 次浏览
  • 20211102 尹子扬《Python程序设计》 实验四 Python综合实践实验报告

    20211102 尹子扬 《Python程序设计》 实验4报告 课程:《Python程序设计》 班级: 2111 姓名: 尹子扬 学号:20211102 实验教师:王志强 实验日期:2022年5月31日 必修/选修: 公选课 (一)实验要求 Python综合应用:爬虫、数据处理、可视化、机器学习、神经网络、游戏、…

    2022/6/2 1:22:08 人评论 次浏览
扫一扫关注最新编程教程