原标题:Pandas | read_csv各种报错解决办法

在使用pandas读入csv文件时,有如下几种常见错误类型:

通常报错为:

2. 文件解码格式存在错误时,查看源文件编码或更换几个常用编码格式读取试试。

3.当文件仅有很少的行出现错误时,如数据不是太重要,可选择跳过错误的行。

4. 在写入文件时,使用在未在字段中出现的符号作为分隔符!!!使用在未在字段中出现的符号作为分隔符!!!使用在未在字段中出现的符号作为分隔符!!!

由于逗号引号等符号容易出现在json子串中如{"姓名":"老吴","职业":"歌手","兴趣":"hiphop"},建议使用Tab(/t)等生僻符号进行分隔

找出分割错的符号的出现规律,根据规律利用正则表达式进行替换或分割,如Fig1发现json子串内逗号都包含在{}括号内,且前后都存在"引号,因此可利用正则表达式选择后没有引号的逗号分隔,sep = ',(?!")'

更多关于python数据分析与挖掘内容请关注我的专栏:数与码

或者关注我的知乎账号:知行

欢迎交流讨论和点赞~~

相关文章