python – 在pandas数据框中散列每个值
发布时间:2020-09-21 08:11:05  所属栏目:Python  来源:互联网 
            导读:在 python中,我试图找到最快的方法来散列pandas数据框中的每个值. 我知道任何字符串都可以使用: hash(a string) 但是如何在pandas数据框的每个元素上应用此函数? 这可能是一件非常简单的事情,但我刚刚开始使用python. 传递散列函数以应用于str列: In [37]:
                
                
                
            | 
                         在 python中,我试图找到最快的方法来散列pandas数据框中的每个值. 我知道任何字符串都可以使用: hash('a string') 
 但是如何在pandas数据框的每个元素上应用此函数? 这可能是一件非常简单的事情,但我刚刚开始使用python. 解决方法传递散列函数以应用于str列:In [37]:
df = pd.DataFrame({'a':['asds','asdds','asdsadsdas']})
df
Out[37]:
            a
0        asds
1       asdds
2  asdsadsdas
In [39]:
df['hash'] = df['a'].apply(hash)
df
Out[39]:
            a                 hash
0        asds  4065519673257264805
1       asdds -2144933431774646974
2  asdsadsdas -3091042543719078458 
 如果要对每个元素执行此操作,请调用applymap: In [42]:
df = pd.DataFrame({'a':['asds','asdsadsdas'],'b':['asewer','werwer','tyutyuty']})
df
Out[42]:
            a         b
0        asds    asewer
1       asdds    werwer
2  asdsadsdas  tyutyuty
In [43]:
df.applymap(hash)
Out[43]:
                     a                    b
0  4065519673257264805  7631381377676870653
1 -2144933431774646974 -6124472830212927118
2 -3091042543719078458 -1784823178011532358                        (编辑:莱芜站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!  | 
                  
相关内容
- 在Python中循环退出
 - python简单的监控脚本-利用socket、psutil阻止远程主机运行
 - python – Scipy.optimize Inequality Constraint – 不平等
 - python – 随机裁剪数据增强卷积神经网络
 - python – 恢复使用迭代器的Tensorflow模型
 - 当它达到内存限制时退出Python程序
 - python – 结束索引为0的切片运算符
 - python – 带有postgres的游标,存储数据的位置以及对DB的调
 - python – 当content-type为“application / xml”时,如何使
 - python – Pip默认行为与virtualenv冲突?
 
