从整个数据库中获取列名(假设数据库包含超过100行,超过50列),基于pandas中特定列中包含的特定值.
在Bkmm3(来自印度的成员)的帮助下,我在数字术语上取得了成功但在字母术语上失败了.我试过的方式是这样的:
df = pd.DataFrame({'A':['APPLE','BALL','CAT'],
'B':['ACTION','BATMAN','CATCHUP'],
'C':['ADVERTISE','BEAST','CARTOON']})
response = input("input")
for i in df.columns: if(len(df.query(i + '==' + str(response))) > 0):
print(i)`
然后输出出现错误:
Traceback (most recent call last): NameError: name 'APPLE' is not defined
你们的任何帮助都会非常感谢,谢谢. . .
解决方法:
isin / eq适用于DataFrames,您可以100%向量化:
df.columns[df.isin(['APPLE']).any()] # df.isin([response])
要么,
df.columns[df.eq(response).any()]
索引([‘A’],dtype =’对象’)
这是使用DataFrame.eval和np.logical_or的迂回方式(你是在循环列上):
df.columns[
np.logical_or.reduce(
[df.eval(f"{repr(response)} in {i}") for i in df]
)]
Index(['A'], dtype='object')
温馨提示:答案为网友推荐,仅供参考