dataframe – 青岛站长网

python – 关于Pandas Dataframe的Kurtosis doent工作

dawei Python 2021年3月30日

当我在pandas datafame上应用kurtosis函数时,我总是得到以下错误： AttributeError: Cannot access callable attribute ‘kurt’ of ‘DataFrameGroupBy’ objects, try using the ‘apply’ method 以下示例代码适用于所有其他统计函数(mean(),skew(),…),但

如何将R中的数据框导出到MySQL中的表中

dawei MySql 2020年12月30日

我在RODBC中尝试过sqlSave(),但它的运行速度非常慢.有没有其他方法可以做到这一点？最佳答案你可以看一下包RMySQL.我正在使用它,它提供了一些方便的加载和从MySQL数据库读取数据.这就是说你可以使用的查询是有限的(例如HAVING不可能是IIRC).我不能说它超级快,

python – 如何在DataFrame中增加groupby中的行数

dawei Python 2020年12月30日

我需要计算pandas DataFrame中每个产品的activity_months数.到目前为止,这是我的数据和代码： from pandas import DataFramefrom datetime import datetimedata = [(product_a,08/31/2013),(product_b,08/31/2013),(product_c,0

python – 在Pandas DataFrame中分割列表

dawei Python 2020年12月15日

我有一个包含许多列的csv文件.使用大熊猫,我将这个csv文件读入数据框,并有一个datetime索引和五六个其他列. 其中一列是时间戳列表(下面是索引示例) CreateDate TimeStamps4/1/11 [Timestamp(2012-02-29 00:00:00), Timestamp(2012-03-31 00:00:00), Timestamp

python – 大型Pandas Dataframe并行处理

dawei Python 2020年12月4日

我正在访问一个非常大的Pandas数据帧作为全局变量.通过 joblib并行访问此变量. 例如. df = db.query(select id, a_lot_of_data from table)def process(id): temp_df = df.loc[id] temp_df.apply(another_function)Parallel(n_jobs=8)

python – Pandas Dataframe查找所有列等于的行

dawei Python 2020年11月17日

我有一个包含字符的数据帧 – 我想要一个布尔结果的行,告诉我该行的所有列是否具有相同的值. 例如,我有 df = [ a b c d0 C C C C 1 C C A A2 A A A A ] 我想要的结果是 0 True1 False2 True 我已经尝试了,但似乎

python – pandas dataframe：如何计算二进制列中1行的数量？

dawei Python 2020年9月21日

我有以下pandas DataFrame： import pandas as pdimport numpy as npdf = pd.DataFrame({first_column: [0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0]}) df first_column0

python – 在大熊猫DataFrame中选择和删除具有相同名称的列

dawei Python 2020年9月21日

我有一个巨大的DataFrame,其中一些列具有相同的名称.当我尝试选择存在两次的列时(例如del df [‘col name’]或df2 = df [‘col name’]),我得到一个错误.我能做什么？您可以按索引对列列出： df = pd.DataFrame([[1,2],[3,4],[5,6]], columns=[a,a]) df a a0

python – 为什么statsmodels不能重现我的R逻辑回归结果？

dawei Python 2020年8月3日

我很困惑为什么R和statsmodels中的逻辑回归模型不一致.如果我在R中准备一些数据# From https://courses.edx.org/c4x/MITx/15.071x/asset/census.csv library(caTools) # for sample.split census = read.csv(census.csv) set

标签： dataframe