pandas中pd.read_csv()⽅法中的encoding参数
当使⽤pd.read_csv()⽅法读取csv格式⽂件的时候,常常会因为csv⽂件中带有中⽂字符⽽产⽣字符编码错误造成读取⽂件错误,在这个时候,我们可以尝试将pd.read_csv()函数的encoding参数设置为"gbk"或者"utf-8",例⼦如下:
1import pandas as pd
2import numpy as np
3
4 head = ["表头1" , "表头2" , "表头3"]
5 l = [[1 , 2 , 3],[4,5,6] , [8 , 7 , 9]]
6 df = pd.DataFrame (l , columns = head)
_csv ("testfoo.csv")
8
9 df2 = pd.read_csv ("testfoo.csv" , encoding = "gbk")
10print (df2)
结果如下:
Unnamed: 0  表头1  表头2  表头3
0          0    1    2    3
1          1    4    5    6
记住我
2          2    8    7    9