故障检测在JSON编码

学习如何解决故障检测编码输入JSON文件在使用BOM数据砖。

写的亚当Pavlacka

去年发表在:2022年6月1日

问题

火花工作不包含异常信息:

无效的utf - 32字符0 x1414141 char # 1(以上10飞行符),在org.apache.spark.sql.catalyst.json.JacksonParser.parse字节# 7)

导致

JSON数据源读者能够自动检测使用JSON编码的输入文件