Python 连接 Hive 的方式



Python 连接 Hive 的方式都有哪些呢?

连接 Hive 的方式无非 Thrift、JDBC、ODBC 几种,都需要服务端开启 HiveServer2 的服务。

通过 Thrift

客户端环境可能需要先配置好 SASL、Thrift 相关包的部署。

PyHive

PyHive 可以连接 Hive 和 Presto 。

HiveServer2 是一个基于 Thrift 的服务,是 HiveServer 的替代。

pyhs2

pyhs2 是一个 HiveServer2 的客户端驱动,但它从 2016 年起就已经无人维护,不推荐继续使用。

impyla

impyla 在 Windows 下的表现不错。

通过 JDBC

Hive 自己的 beeline 客户端就是通过 JDBC 连接 HiveServer2 的。Python 操作 JDBC 需要 JPype

JayDeBeApi

JayDeBeApi 是最常见的 Python 下操作 JDBC 的库。

通过 ODBC

pyodbc

pyodbc 需要客户端先配置好 Data Source 。Linux 下可能需要额外安装 ODBC 驱动。

本文链接: https://paxinla.github.io/posts/2020/12/python-lian-jie-hive-de-fang-shi.html

知识共享许可协议 本作品采用知识共享署名-非商业性使用-相同方式共享 3.0 中国大陆许可协议进行许可,欢迎转载、演绎,
但是必须保留本文的署名 Charles(包含链接),且不得用于商业目的。