想用Python对csv表格中的某一列数据进行关键词筛选

但是只会用全词匹配……就像line[1].decode('utf-8') == u'希区柯克'……如果要搜索包含某一关键词的项目应该怎么写呢？急求，谢谢！

举报该问题

推荐答案推荐于2016-08-27

line[1].decode('utf-8').find( u'希区柯克')>=0
表示当前数据包含有所查找的字符串'希区柯克'追问

请您帮我看看这是怎么回事，我只会一点C语言……



追答

你确定这些CSV文件都有8列吗,看这个错误超出列表范围,明显不足8列

而且我觉得line[1].decode('utf-8'),后面的decode('utf-8')可能会出错

追问

我完全不会用这种语言，我找了个模板想套一下……好像远超出8列啊。原模板命令是

对同样的csv文件可以执行，这个line[0]对应的是中国名字，line[4]对应的是字母A或B，line[7]对应的是外国导演名字，有的奇长无比，line[5]对应的是日期19XXXXXX。有没有办法解决呢？

追答

将搜索的条件

if(line!=[]):
#匹配条件
改为
if len(line)>=8:
而且这个if的条件不需要放在括号里,

追问

非常感谢您的回答，并且基本解决了我的问题，谢谢！还有一点小问题希望您再帮一下

print line[33],这个line[33]里面是1949-10-01 0：00 的格式，好像没有办法输出，能再帮我解决一下吗？谢谢！

追答

不是说line[5]是日期吗,怎么又有一个日期,而且为什么会得到这么多列
打开csv文件看一下,观察里面的各列的分隔符是什么,比如分隔符是分号
就将打开csv文件的命令
reader=csv.reader(fp)

改为
reader=csv.reader(fp,delimiter=';')
用delimiter指定分隔符,应该没有这么多列的

温馨提示：答案为网友推荐，仅供参考

当前网址：http://66.wendadaohang.com/zd/29i22xppp.html

其他回答

第1个回答 2019-12-12

筛选第一个关键词的时候和平常一样，然后继续逐一筛选后面，筛选的时候按下图勾选上这个选项即可

第2个回答 2013-10-25

是索引列表超出了范围，不是每一行都有8列，所以要加异常处理。
#匹配条件
try：
if（。。。）
except IndexError：
do sth

使用decode要确认那一列是用什么编码的，那就用什么解码。一般英文系统是用ascii编码，有可能会出错，自己试下喽。追问

我是小白，麻烦您看一下我对楼上的追问，谢谢！

相似回答

Python编程实现csv文件某一列的词频统计答：data = pd.read_csv('XXX.csv')trainheadlines = []for row in range(0, len(data.index)):trainheadlines.append(' '.join(str(x) for x in data.iloc[row, m:n]))上面的m:n代表取那一列，或者那几列。advancedvectorizer = TfidfVectorizer(min_df=0, max_df=1, max_features=20...

...数据的所在行和上下两行数据,然后筛选复制python?答：if cell.value == "筛选数据":#获取到了筛选数据所在的单元格 "所在行" = cell.row break break list1=[]#一个空列表用来装行数据 row_num="所在行"-1#目标行的上一行开始获取值 for i in range(3)#3行循环3次 list1.append([])for cell in sheet[ row_num]:list1[i].append(cel...

表格一列去掉相同的字答：1、首先，将你的数据输入或粘贴到Excel的一列中。2、在Excel的菜单栏上，选择“数据”选项。3、在“数据”选项下，选择“删除重复项”。4、在弹出的对话框中，选择你想要去掉重复的列，并点击“确定”。数据处理和分析表格可以用来存储和管理大量的数据，通过使用数据处理和分析工具，可以对表格中的...

想问下,怎么用python根据提取指定关键词下面的所有列和行的数据呢?答：在这个示例中，首先使用`pd.read_excel()`函数读取包含数据的Excel文件（假设为'data.xlsx'）。然后，通过设置关键词变量来定义需要提取的关键词。接下来，使用列表推导式和`df.columns`属性遍历所有列名，将包含关键词的列存储在`selected_columns`列表中。最后，使用`df.loc`方法选择所有行，并使用`...

python 筛选excel中符合条件的数据答：用for循环遍历csv文件，取出来的都是数据列表list，继续用for遍历并用if条件判断取出就可以了，希望能帮助到你！

怎样用python,读取excel中的一列数据答：if i.find(s1)>=0:print r[a-1]#显示上一行 print i#显示定位行 print r[a+1]#显示下一行 a+=1 print 'Total:%d'%count 例：在以下数据中，查找含有T的行，并显示上一行（n行） or 下一行（n行) 。1，2，3，4 W,R,GFR,T 12,,F,34,G 这个就用上面的代码就行了。