dictionary - 映射到 Deedle 框架

标签 dictionary f# dataframe deedle

我正在学习 F#。 我正在尝试转换 Map<string, seq<DateTime * float>>到 Deedle 数据框 ( http://bluemountaincapital.github.io/Deedle/tutorial.html#creating )。

我准备了以下代码:

let folderFnct (aFrame:Frame) colName datesAndValues =
    let newSerie = Series(Seq.map (fun x -> fst x) datesAndValues, Seq.map (fun y -> snd y) datesAndValues)
    let newFrame = aFrame.Join([colName], [newSerie], kind=JoinKind.Inner)
    newFrame


let mapToDeedleFrame myMap frame =       
    Map.fold ( fun s ticker datesAndValues -> folderFnct s ticker datesAndValues) frame myMap

mapToDeedleFrame使用现有框架折叠 map 。文件夹功能folderFnct :

  • 取景
  • 使用 Map 键作为框架中的列名,并且
  • 处理值 ( <DateTime * float> ) 使其成为一个系列。

问题在于:

let newFrame = aFrame.Join([colName], [newSerie], kind=JoinKind.Inner)

哪里:

The field, constructor or member 'Join' is not defined

我已经确定了问题的三个潜在原因:

  1. 为什么是aFrame.Join没有定义的?我尝试明确指定 aFrame 的类型
  2. 我怎样才能喂给 mapToDeedleFrame一个框架?
  3. 我应该在 folderFnct 中进行模式匹配吗?针对 aFrame 的情况是空的吗?

非常感谢!

编辑 1

根据 Tomas 的建议,这就是我目前所做的。

let folderFnct (aFrame:Frame<'a, 'b>) columnName (seqOfTuples: seq<'a*'b>) =
    let newSerie = Series(Seq.map (fun x -> fst x) seqOfTuples, Seq.map (fun y -> snd y) seqOfTuples)
    let otherFrame = Frame([columnName], [newSerie])
    let newFrame = aFrame.Join((otherFrame), kind=JoinKind.Inner)
    newFrame


let mapToDeedleFrame myMap frame =       
    Map.fold ( fun state k vals -> folderFnct state k vals) frame myMap

缺少的最后一步是:如何快速将空框架(可能避免创建虚拟框架)传递给 mapToDeedleFrame ?我试过[]

let frame = mapToDeedleFrame mapTS []

这可能是个愚蠢的问题,但我是 F# 的新手,我想知道是否有 Empty语言中内置的类型。

跟进问题

在我阅读的源文件中(https://github.com/BlueMountainCapital/Deedle/blob/master/src/Deedle/Frame.fs):

  member frame.Join<'V>(colKey, series:Series<'TRowKey, 'V>, kind, lookup) =    
    let otherFrame = Frame([colKey], [series])
    frame.Join(otherFrame, kind, lookup)

在屏幕弹出的功能描述中:

Printscreen

从上图我猜想Frame的类型和colKey是一样的,而据我了解,colKey只是从serie加入join后的dataframe列的key。作为一个完全的菜鸟,我很困惑..

编辑 2

我重写了代码:

let seriesListMapper (colName:string, series:Series<'a, 'b>) = 
    [colName => series] |> frame


let frameListReducer (accFrame: Frame<'a, 'b>) (aFrame: Frame<'a, 'b>) =
     accFrame.Join(aFrame, kind=JoinKind.Outer)


let seriesListToFrame (seriesList: List<string * Series<'a, 'b>>) =
    seriesList |> List.map (fun elem -> seriesListMapper elem) |> List.reduce(fun acc elem -> frameListReducer acc elem)

问题在于:

let frame = seriesListToFrame seriesList

返回框架作为框架,而 seriesList 是 (string *Series<DateTime, float>) list

我认为问题在于:

let seriesListMapper (colName:string, series:Series<'a, 'b>) = 
    [colName => series] |> frame

事实上seriesListMapper表示为

seriesListMapper: colName:string * series:Series<'a, 'b> -> Frame<'a, string>

我不明白这些值是如何以及为什么转换为 string 的来自 float .

一个有趣的事情是用 frame.Format() 绘制框架实际上确认数据看起来是正确的。就是这种对 string 的“奇怪”转换.

最佳答案

folderFnct 的类型注解中, 你有 aFrame:Frame .但是,表示数据框的类型是具有两个类型参数的泛型类型(分别表示行和列的索引类型),因此注释应为 aFrame:Frame<_, _> .

另一种向框架添加系列的方法是使用变异操作:

aFrame.AddSeries(colName, newSeries)

但是,这只支持左连接(数据框只能通过添加新系列来改变,但不能改变索引)。但是,您可以使用这种方法,然后在构建框架后从框架中删除所有缺失值。

编辑:回答关于泛型类型的问题:

  • Series<K, V>表示键类型为 K 的系列包含 V 类型的值(例如,具有普通索引观测值的系列将有 K=intV=float )

  • Frame<R, C>表示包含异构数据(每列的类型可能不同)的帧,其中行由 R 索引和列由 C 索引.对于普通索引框架 R=int通常,您的列将被命名为 C=string (但你也可以有其他索引)

关于dictionary - 映射到 Deedle 框架,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19795949/

相关文章:

f# - 使用 F# 记录对象更改的方法

generics - F#:使用 List.map 调用一系列方法中的方法

r - 根据重复序列划分数据帧行

f# - 如何使用 F# 在 Akka.Remote 中发送带有元组的消息?

c# - 在字典中添加新项目或更新现有项目的方法

python - 在 Python 中导入 XML 字典

c# - 在特定位置添加字典元素

python - Pandas 如何处理类型为 "object"的列与整数进行比较的情况?

python - Pandas 按条件连接两个数据框

perl - split inside map 是如何工作的?