Pandas | read_csv各种报错解决办法
原标题:Pandas | read_csv各种报错解决办法
在使用pandas读入csv文件时,有如下几种常见错误类型:
通常报错为:
2. 文件解码格式存在错误时,查看源文件编码或更换几个常用编码格式读取试试。
3.当文件仅有很少的行出现错误时,如数据不是太重要,可选择跳过错误的行。
4. 在写入文件时,使用在未在字段中出现的符号作为分隔符!!!使用在未在字段中出现的符号作为分隔符!!!使用在未在字段中出现的符号作为分隔符!!!
由于逗号引号等符号容易出现在json子串中如{"姓名":"老吴","职业":"歌手","兴趣":"hiphop"},建议使用Tab(/t)等生僻符号进行分隔
找出分割错的符号的出现规律,根据规律利用正则表达式进行替换或分割,如Fig1发现json子串内逗号都包含在{}括号内,且前后都存在"引号,因此可利用正则表达式选择后没有引号的逗号分隔,sep = ',(?!")'
更多关于python数据分析与挖掘内容请关注我的专栏:数与码
或者关注我的知乎账号:知行
欢迎交流讨论和点赞~~