javascript - 将 pandas 数据帧转换为自定义 JSON 格式(然后转换为 JS 对象)

标签 javascript python json pandas parallel-coordinates

我想使用平行坐标图绘制某些分析的结果。找到了一个使用 protovis 制作的出色示例 http://mbostock.github.io/protovis/ex/cars.html我正在尝试重新排列我的数据以按照示例(cars.js)复制数据文件的结构。 因此,我的 dataframe 结构:

                    north   ch  wwr  ach  tmin  tmax  B1_EMS_DH26
Job_ID                                                           
EP_P1203_000000000    0.0  2.5   40  4.0    24    25       1272.2
EP_P1203_000000001    0.0  2.5   40  4.0    24    26       1401.9
EP_P1203_000000002    0.0  2.5   40  4.0    24    27       1642.3

应转换为以下内容:

var results = [{
    name: "EP_P1203_000000000",
    north: 0.0,
    ch: 2.5,
    wwr: 40,
    ach: 4.0,
    tmin: 24,
    tmax: 25,
    origin: 1272.2
  },
  {
    name: "EP_P1203_000000001",
    north: 0.0,
    ch: 2.5,
    wwr: 40,
    ach: 4.0,
    tmin: 24,
    tmax: 26,
    origin: 1401.9
  },
  {
    name: "EP_P1203_000000002",
    north: 0.0,
    ch: 2.5,
    wwr: 40,
    ach: 4.0,
    tmin: 24,
    tmax: 27,
    origin: 1272.3
  },
  {
    name: "EP_P1203_000000003",
    north: 0.0,
    ch: 2.5,
    wwr: 40,
    ach: 4.0,
    tmin: 24,
    tmax: 28,
    origin: 1642.3
  },
];

除了将我的列 B1_EMS_DH26 替换为 origin (图表似乎使用它来设置线条颜色),我希望不必对行进行切片并手动替换符号。

使用dataframe.to_json命令返回一行:

{
  "EP_P1203_000000000": {
    "north": 0.0,
    "ch": 2.5,
    "wwr": 40,
    "ach": 4.0,
    "tmin": 24,
    "tmax": 25,
    "B1_EMS_DH26": 1272.2
  },
  "EP_P1203_000000001": {
    "north": 0.0,
    "ch": 2.5,
    "wwr": 40,
    "ach": 4.0,
    "tmin": 24,
    "tmax": 26,
    "B1_EMS_DH26": 1401.9
  },
  "EP_P1203_000000002": {
    "north": 0.0,
    "ch": 2.5,
    "wwr": 40,
    "ach": 4.0,
    "tmin": 24,
    "tmax": 27,
    "B1_EMS_DH26": 1642.3
  }
}

这仍然不太正确。 您建议如何解决这个问题?

最佳答案

您的数据框(用于娱乐目的):

df= pd.DataFrame(
    {'north': [0.0, 0.0, 0.0],
     'B1_EMS_DH26': [1272.2, 1401.9, 1642.3],
     'tmax': [25, 26, 27],
     'wwr': [40, 40, 40],
     'ch': [2.5, 2.5, 2.5],
     'tmin': [24, 24, 24],
     'ach': [4.0, 4.0, 4.0]
     },
    index=['EP_P1203_000000000', 'EP_P1203_000000001', 'EP_P1203_000000002'],
    columns=['north', 'ch', 'wwr', 'ach', 'tmin', 'tmax', 'B1_EMS_DH26'])

这可能是最糟糕的方法,但它有效(我认为):

import re
import json

with open('whatever.json', 'w') as f:
    f.write('var results = [\n')
    for k,v in df.drop('B1_EMS_DH26', axis=1).T.to_dict().items():
        f.write("{name:"+json.dumps(k)+", "+re.sub(r'[{"\']', '', json.dumps(v))+',\n')
    f.write('];')

产品:

var results = [{
    name: "EP_P1203_000000001",
    ach: 4.0,
    north: 0.0,
    tmax: 26.0,
    tmin: 24.0,
    ch: 2.5,
    wwr: 40.0
  },
  {
    name: "EP_P1203_000000000",
    ach: 4.0,
    north: 0.0,
    tmax: 25.0,
    tmin: 24.0,
    ch: 2.5,
    wwr: 40.0
  },
  {
    name: "EP_P1203_000000002",
    ach: 4.0,
    north: 0.0,
    tmax: 27.0,
    tmin: 24.0,
    ch: 2.5,
    wwr: 40.0
  },
];

它将输出一个我认为您正在寻找的结构的文件。如果没有,请告诉我。我知道这是可怕的黑客行为。具有高级 json 经验的人无疑知道更好的方法。

关于javascript - 将 pandas 数据帧转换为自定义 JSON 格式(然后转换为 JS 对象),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42397717/

相关文章:

javascript - strokestyle 和 strokewidth 属性不起作用

javascript - 如何在 Chart.js 上自定义边框样式

javascript - 无法删除悬停时由 addClass 添加的类

javascript - 基于 Python websocket 的应用程序框架/服务器

python - 使用 tf.estimator 的自定义指标

python - 抛出什么异常? (Python)

python - 使用 Python 在 Postgres 中搜索 json 编码的字符串

python - 发送 JSON 字符串作为 post 请求

javascript - 在 html 表中动态渲染非结构化 JSON 数据

javascript - Chrome存储同步以持久顺序获取项目