问题
你是有xlrd安装在您的集群和正试图读取Excel .xlsx格式的文件,当你得到一个错误。
XLRDError: Excel xlsx文件;不支持
导致
xlrd2.0.0以上只能读取xls文件。
支持.xlsx文件被撤xlrd由于一个潜在的安全漏洞。
解决方案
使用openpyxl打开.xlsx文件代替xlrd。
- 安装openpyxl图书馆在你的集群(AWS|Azure|GCP)。
- 确认您使用的熊猫版本1.0.1或以上。
%的python导入大熊猫作为pd打印(pd.__version__)
- 指定openpyxl当阅读.xlsx文件熊猫。
% python导入熊猫df = pandas.read_excel (“< name-of-file >。xlsx’,引擎= ' openpyxl”)
指的是openpyxl文档为更多的信息。