python - 在 Ubuntu 上将 Python ODBC 与 Cloudera Impala ODBC 驱动程序一起使用时出现 ParseException 语法错误

标签 python ubuntu odbc cloudera impala

我们有一个 Python 3.7 应用程序在 AWS EC2 实例 (Amazon Linux) 上运行,该应用程序使用 pyodbc (4.0.27) 和 Cloudera Impala ODBC 驱动程序(使用 ClouderaImpalaODBC-2.6.5.rpm 安装)对 Cloudera Impala 服务执行 SQL 查询。这个应用程序已经成功运行了好几年。
我目前正在尝试让应用程序在运行 Ubuntu 18.04.4 LTS 的 Docker 容器中运行,但在运行最基本的查询时遇到以下错误(例如 SELECT 'HELLO' ):

Error: ('HY000', '[HY000] [Cloudera][ImpalaODBC] (110) Error while executing a query in Impala: [HY000] : ParseException: Syntax error in line 1:\\n\ufffd\ufffd\ufffd\ufffd\ufffd\ufffd\ufffd\\n^\\nEncountered: Unexpected character\\nExpected: ALTER, COMMENT, COMPUTE, COPY, CREATE, DELETE, DESCRIBE, DROP, EXPLAIN, GRANT, INSERT, INVALIDATE, LOAD, REFRESH, REVOKE, SELECT, SET, SHOW, TRUNCATE, UPDATE, UPSERT, USE, VALUES, WITH\\n\\nCAUSED BY: Exception: Syntax error\\n\\x00\u6572\u3a64\u5520\u656e\u7078\u6365\u6574\\u2064\u6863\u7261\u6361\u6574\u0a72 (110) (SQLExecDirectW)')"}
不用说,这看起来像是一个字符串编码问题。
一些上下文内务管理:
  • 两个系统(Amazon Linux/Ubuntu)上的 python 代码是相同的
  • 两个系统上的 Impala ODBC 驱动程序安装具有相同的版本 (2.6.5);用于 Ubuntu 的 Impala ODBC 驱动程序直接从 Cloudera 网站 (https://www.cloudera.com/downloads/connectors/impala/odbc/2-6-5.html)
  • 下载
  • Impala ODBC 连接参数是相同的,除了操作系统特定的项目:
  • “主机”:“[主机]”
  • “港口”:21050
  • "数据库": "[数据库]
  • “UID”:“[用户名]”
  • “密码”:“[密码]”
  • “驱动程序”:“{/opt/cloudera/impalaodbc/lib/64/libclouderaimpalaodbc64.so}”
  • “使用SASL”:1
  • “AuthMech”:3
  • “SSL”:1
  • “CAIssuedCertNamesMismatch”:1
  • “TrustedCerts”:“[path_to_certs_file]”
  • “TSaslTransportBufSize”:1000
  • “RowsFetchedPerBlock”:10000
  • “套接字超时”:0
  • “字符串列长度”:32767
  • "UseNativeQuery": 0

  • 应用程序似乎成功连接到 Impala,因为调用 pyodbc.connect(**config, autocommit=True) 没有错误。或从连接中获取光标(已尝试使用无效的凭据来确保,并在凭据错误时获得通常的连接错误)。错误消息的详细信息表明正在使用正确的 ODBC 驱动程序

  • 我尝试使用 Impala ODBC 驱动程序参数“DriverManagerEncoding”的不同值,例如“UTF-16”、“UTF-32”或根本没有它(Amazon Linux 设置就是这种情况)但总是得到同样的错误。
    我还尝试在两个系统上使用 odbclinux 工具 isql 来尝试以这种方式进行故障排除;能够从 Amazon Linux 系统成功连接,但无法在 Ubuntu 上连接 - 始终得到以下信息(不确定这是否相关或其他问题):
    iusql -v [DSN]
    [unixODBC][
    [ISQL]ERROR: Could not SQLDriverConnect
    

    最佳答案

    找到了罪魁祸首 - 是设置 DriverManagerEncoding/opt/cloudera/impalaodbc/lib/64/cloudera.impalaodbc.ini :

    [Driver]
    
    ## - Note that this default DriverManagerEncoding of UTF-32 is for iODBC.
    ## - unixODBC uses UTF-16 by default.
    ## - If unixODBC was compiled with -DSQL_WCHART_CONVERT, then UTF-32 is the correct value.
    ##   Execute 'odbc_config --cflags' to determine if you need UTF-32 or UTF-16 on unixODBC
    ## - SimbaDM can be used with UTF-8 or UTF-16.
    ##   The DriverUnicodeEncoding setting will cause SimbaDM to run in UTF-8 when set to 2 or UTF-16 when set to 1.
    
    DriverManagerEncoding=UTF-32
    ErrorMessagesPath=/opt/cloudera/impalaodbc/ErrorMessages/
    LogLevel=0
    LogPath=
    SwapFilePath=/tmp
    
    
    ## - Uncomment the ODBCInstLib corresponding to the Driver Manager being used.
    ## - Note that the path to your ODBC Driver Manager must be specified in LD_LIBRARY_PATH (LIBPATH for AIX).
    ## - Note that AIX has a different format for specifying its shared libraries.
    
    # Generic ODBCInstLib
    #   iODBC
    # ODBCInstLib=libiodbcinst.so
    
    #   SimbaDM / unixODBC
    #ODBCInstLib=libodbcinst.so
    
    # AIX specific ODBCInstLib
    #   iODBC
    #ODBCInstLib=libiodbcinst.a(libiodbcinst.so.2)
    
    #   SimbaDM
    #ODBCInstLib=libodbcinst.a(odbcinst.so)
    
    #   unixODBC
    ODBCInstLib=libodbcinst.a(libodbcinst.so.1)
    
    该文件是作为驱动程序安装的一部分自动生成的。注意关于 iODBC 与 unixODBC 的评论——我们只安装了后者。
    一旦我注释掉该配置,我们的 python 应用程序就可以工作了。它还修复了 iusql 的问题。 (这是 unixODBC 安装的一部分)。
    奖励内容:
    我也遇到了 iqsl 的问题(不是 iusql ) - 收到命令 isql -v [DSN] 的此错误/输出:
    [S1000][unixODBC][Cloudera][ODBC] (11560) Unable to locate SQLGetPrivateProfileString function.
    [ISQL]ERROR: Could not SQLConnect
    
    该错误与配置参数 ODBCInstLib 有关在同一个ini文件。一旦我将其从默认 libodbcinst.a(libodbcinst.so.1) 更改为至/usr/lib/x86_64-linux-gnu/libodbcinst.so有效。发现答案在这篇文章中,它实际上帮助解决了我最初的问题:
    Can't connect to snowflake via unixODBC. Error: [S1000][unixODBC][Snowflake][ODBC] (11560) Unable to locate SQLGetPrivateProfileString function

    关于python - 在 Ubuntu 上将 Python ODBC 与 Cloudera Impala ODBC 驱动程序一起使用时出现 ParseException 语法错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72120483/

    相关文章:

    python - 我怎样才能让我的代码更有效率?

    linux - 如何开始为 Elementary OS 编程?

    python - 如何在已经服务于 PHP 网站的 Ubuntu 服务器上运行基于 Flask 的网页

    php - 正确签名的 phpmailer 电子邮件不断被标记为垃圾邮件或被拒绝

    c++ - 输出参数未填充 MSSQL ODBC

    php - 如何在 Windows 2003 上使用 PHP 将 ODBC 连接到 DB2?

    python - 如何使用python统计一个字母在word中出现的次数

    python - keras 回调列表生成错误 : 'tuple' object has no attribute 'set_model'

    python - 在没有页面加载的情况下 session 超时时更新表记录

    sql-server - SP_Who 不返回 DBName 列