mysql - 如何从 Pyspark 更新 Mysql 表中的数据

标签 mysql pyspark

我可以通过

从 pyspark 中的 mysql 表中读取数据
hiveContext.read.format('jdbc').options(url=jdbc_url, dbtable=mysql_query,driver='com.mysql.jdbc.Driver').load()

但我无法找到一种方法来更新 mysql 中的记录。有没有人从 pyspark 执行过更新。

最佳答案

不允许更新。您只能:

  • 追加
  • 覆盖

对于更新或其他细粒度修改,直接使用标准数据库客户端。

关于mysql - 如何从 Pyspark 更新 Mysql 表中的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41197395/

相关文章:

php/mysql/ajax 加入查询并访问结果变量

mysql - SQL Server 无法转换数据值

hadoop - DataFrame Write PartitionBy-无法参数化多个列

apache-spark - rdd.histogram 给出 "can not generate buckets with non-number in RDD"错误

mysql - 显示两种状态的金额总和

MySQL 查询选择自动递增的结果作为结果中添加的新列

mysql - 为什么这段代码不起作用?从生成日期范围获取计数

python - 如何将 pyspark 日志记录级别设置为调试?

python - "unbound method textFile() must be called with SparkContext instance as first argument (got str instance instead)"

pyspark - 如何使用 pyspark graphframe pregel API 实现循环检测