搜索结果
查询Tags标签: df1,共有 28条记录-
Pandas数据聚合与分组
数据聚合与分组什么是分组聚合?如图:groupby:(by=None,as_index=True)by:根据什么进行分组,用于确定groupby的组 as_index:对于聚合输出,返回以组便签为索引的对象,仅对DataFrame df1 = pd.DataFrame({fruit:[apple,banana,orange,apple,banana],color:[red,yellow,ye…
2021/11/15 6:10:38 人评论 次浏览 -
如何在 Pandas 中使用 SQL
如果您考虑 Pandas DataFrame 的结构和 SQL 数据库中表的结构,它们的结构非常相似。它们都由数据点或值组成,每一行都有一个唯一的索引,每一列都有一个唯一的名称。因此,SQL 允许您快速访问您正在处理的任何项目所需的特定信息。但是,可以使用 Pandas 进行非常相似的…
2021/11/15 2:16:25 人评论 次浏览 -
如何在 Pandas 中使用 SQL
如果您考虑 Pandas DataFrame 的结构和 SQL 数据库中表的结构,它们的结构非常相似。它们都由数据点或值组成,每一行都有一个唯一的索引,每一列都有一个唯一的名称。因此,SQL 允许您快速访问您正在处理的任何项目所需的特定信息。但是,可以使用 Pandas 进行非常相似的…
2021/11/15 2:16:25 人评论 次浏览 -
python-Dataframe
创建df复制: 1.直接用df2=df1,修改df2会对df1造成影响: In [21]: import pandas as pdIn [22]: data = {a:[1,2,3],b:[4,5,6]}...: df1=pd.DataFrame(data)...: df1 Out[22]:a b 0 1 4 1 2 5 2 3 6 In [23]: df2=df1 In [24]: df2[a]=0 In [25]: df2 Out[25]:a …
2021/10/11 17:16:00 人评论 次浏览 -
python-Dataframe
创建df复制: 1.直接用df2=df1,修改df2会对df1造成影响: In [21]: import pandas as pdIn [22]: data = {a:[1,2,3],b:[4,5,6]}...: df1=pd.DataFrame(data)...: df1 Out[22]:a b 0 1 4 1 2 5 2 3 6 In [23]: df2=df1 In [24]: df2[a]=0 In [25]: df2 Out[25]:a …
2021/10/11 17:16:00 人评论 次浏览 -
Python数据的相关性和标准化
1、相关性分析协方差:Cov(X,Y)=E(XY)-E(X)E(Y) 或 cov(X, Y) = E(X-EX)(Y-EY),表示两个变量总体误差的期望,范围在负无穷到正无穷。协方差为0时,两者独立。协方差绝对值越大,两者对彼此的影响越大,反之越小公式简单翻译一下是:如果有X,Y两个变量,每个时刻的“X值…
2021/8/3 12:36:26 人评论 次浏览 -
Python数据的相关性和标准化
1、相关性分析协方差:Cov(X,Y)=E(XY)-E(X)E(Y) 或 cov(X, Y) = E(X-EX)(Y-EY),表示两个变量总体误差的期望,范围在负无穷到正无穷。协方差为0时,两者独立。协方差绝对值越大,两者对彼此的影响越大,反之越小公式简单翻译一下是:如果有X,Y两个变量,每个时刻的“X值…
2021/8/3 12:36:26 人评论 次浏览 -
Python pandas merge不能根据列名合并两个数据框(Key Error)?
目录折腾解决方法 折腾 数据分析用惯了R,感觉pandas用起来就有点反人类了。今天用python的pandas处理数据时两个数据框硬是合并不起来。 我有两个数据框,列名是未知的,只能知道索引,以及哪两个索引是用做主键合并的。(别问我为啥列名未知,因为我是开发工具)。 思路…
2021/7/7 22:36:16 人评论 次浏览 -
python——pandas进阶知识
1.将其他类型数据写入DataFrame (1)列表1.元素为数字a = [1,2,3] df1 = pd.DataFrame(a) df1结果:0 0 1 1 2 2 32.元素为元组a = [(1,2,3),(1,2),(1,3,4,5)] df1 = pd.DataFrame(a) df1结果:0 1 2 3 0 1 2 3.0 NaN 1 1 …
2021/6/1 20:22:47 人评论 次浏览 -
06 Spark SQL 及其DataFrame的基本操作
1.Spark SQL出现的 原因是什么?sparkSQL的前身是shark。在hadoop发展过程当中,为了给熟悉RDBMS但又不理解MapReduce的技术人员提供快速上手的工具,hive应运而生,是当时惟一运行在hadoop上的SQL-on-Hadoop工具。 sparkSQL做为Spark生态的一员继续发展,而再也不受限于h…
2021/5/10 19:28:13 人评论 次浏览 -
Spark SQL 及其DataFrame的基本操作
Spark SQL出现的 原因是什么?Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个叫作Data Frame的编程抽象结构数据模型(即带有Schema信息的RDD),Spark SQL的前身是 Shark,由于 Shark过于依赖Hive,因此在版本迭代时很难添加新的优化策略,从而限制了Spak的发…
2021/5/10 2:25:24 人评论 次浏览 -
Spark SQL 及其DataFrame的基本操作
Spark SQL出现的 原因是什么?Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个叫作Data Frame的编程抽象结构数据模型(即带有Schema信息的RDD),Spark SQL的前身是 Shark,由于 Shark过于依赖Hive,因此在版本迭代时很难添加新的优化策略,从而限制了Spak的发…
2021/5/9 19:27:42 人评论 次浏览 -
Pandas数据处理
Pandas数据处理:导⼊数据 导出数据 查看数据 数据选取 数据处理 数据分组和排序 数据合并# 在使用之前,需要导入pandas库 import pandas as pd导⼊数据:pd.DataFrame() # 自己创建数据框,用于练习pd.read_csv(filename) # 从CSV⽂件导⼊数据pd.read_table(filename) #…
2021/4/28 10:55:34 人评论 次浏览