python – Pandas Dataframe查找所有列等于的行

我有一个包含字符的数据帧 – 我想要一个布尔结果的行,告诉我该行的所有列是否具有相同的值. 例如,我有 df = [ a b c d0 C C C C 1 C C A A2 A A A A ] 我想要的结果是 0 True1 False2 True 我已经尝试了,但似乎

python – pandas数据框 – 选择行和清除内存?

我有一个大型的pandas数据帧(大小= 3 GB): x = read.table(‘big_table.txt’, sep=’t’, header=0, index_col=0) 因为我在内存限制下工作,所以我对数据帧进行了子集化: rows = calculate_rows() # a function that calculates what rows I need cols = ca

python – pandas数据帧中的条件列算法

我有一个pandas数据帧,具有以下结构: import numpy as npimport pandas as pdmyData = pd.DataFrame({x: [1.2,2.4,5.3,2.3,4.1], y: [6.7,7.5,8.1,5.3,8.3], condition:[1,1,np.nan,np.nan,1],calculation: [np.nan]*5}

python – Pandas isna()和isnull(),有什么区别?

熊猫有isna()和isnull().我通常使用isnull()来检测缺失值并且从未遇到过这种情况,因此我不得不使用其他方法. 那么,何时使用isna()? isnull是isna的别名.直译在 code source of pandas: isnull = isna 确实: pd.isnullfunction isna at 0x7fb4c5cefc80 所以

python – 在Pandas中将列连接为索引

我正在将文本文件导入pandas,并希望连接文件中的3个列以生成索引. 我愿意在一个或多个步骤中这样做.我可以在创建DataFrame的同时进行转换,或者我可以创建DataFrame并使用新创建的列重新构建它.知道如何以这两种方式做到这一点对我来说是最有帮助的. 我最终希

python – numpy和pandas timedelta错误

在 Python中,我有一个使用pandas生成(或从CSV文件中读取)的日期数组,我想在每个日期添加一年.我可以使用pandas但不使用numpy.我究竟做错了什么?或者它是熊猫或numpy中的错误? 谢谢! import numpy as npimport pandas as pdfrom pandas.tseries.offsets imp

python – Pandas:更改具有多级列的数据框中的特定列名称

我想找到更改多级数据框中特定列的更改名称的方法. 有了这些数据: data = { (A, 1, I): [1, 2, 3, 4, 5], (B, 2, II): [1, 2, 3, 4, 5], (C, 3, I): [1, 2, 3, 4, 5], (D, 4, II): [1, 2, 3, 4, 5],

python – Pandas读取sql整数变为浮点数

我遇到了一个问题,当我使用pandas读取Mysql表时,一些列(参见’to_nlc’)曾经是整数变成了一个浮点数(之后自动添加.0). 任何人都可以搞清楚吗?或者一些猜测?非常感谢! 问题是您的数据包含NaN值,因此int会自动转换为float. 我想你可以查看NA type promotions

python – pandas dataframe:如何计算二进制列中1行的数量?

我有以下pandas DataFrame: import pandas as pdimport numpy as npdf = pd.DataFrame({first_column: [0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0]}) df first_column0

python – 在pandas数据框中散列每个值

在 python中,我试图找到最快的方法来散列pandas数据框中的每个值. 我知道任何字符串都可以使用: hash(a string) 但是如何在pandas数据框的每个元素上应用此函数? 这可能是一件非常简单的事情,但我刚刚开始使用python. 传递散列函数以应用于str列: In [37]:

返回顶部