c# - 提高 F# map 插入性能

标签 c# .net dictionary f#

我目前正在对 F# 映射与 C# 词典进行一些测试。我意识到它们在实现方面完全不同,但它们确实为各自的语言填充了相同的用途。

我设计了一个简单的测试来检查插入时间,因为 F# 映射是不可变的,因此它必须为每次插入创建一个全新的映射。我想知道这有多大的打击。

测试如下:

 //F# 
 module Test = 
    let testMapInsert () = 
        let sw = Stopwatch()
        let rec fillMap endIdx curr map =
            if curr = endIdx then 
                map 
            else 
                fillMap endIdx (curr + 1) (map |> Map.add curr curr)
        sw.Start ()
        let q = fillMap 100000000 Map.empty
        sw.Stop ()
        printfn "%A" sw.ElapsedMilliseconds

 //C#
 class Program
    {
        static void Test(int x) {
            var d = new Dictionary<int,int>();
            for (int i = 0; i < x; i++) {
                d.Add(i,i);
            }
        }
        static void Main(string[] args) {
            Stopwatch sw = new Stopwatch();
            sw.Start();
            Test(10000000);
            sw.Stop();
            System.Console.WriteLine(sw.ElapsedMilliseconds);
            //FSHARP.Test.testMapInsert(); f# function called in c#.

        }
    }

使用此方法进行 1000 万次元素插入会产生以下以毫秒为单位的时间:
C#: 332

F#: 13605

我认为 C# 字典会快一点,但那是完全不同的。

有没有办法为这种用例加速 F# 字典?或者这只是它的方式并且 F# 映射在这些情况下为了线程安全而与性能进行权衡?

最佳答案

正如评论中提到的,区别不是基于 C# 和 F# 之间的区别,而是基于不可变的基于树的映射和基于哈希表的可变字典之间的区别。

使用 #time ,我在 F# 交互中获得以下性能:

#time 
// Immutable tree-based F# map (~14 sec)
let mutable map = Map.empty
for i in 0 .. 10000000 do
  map <- Map.add i i map

// Mutable hashtable-based .NET dictionary (~0.3 sec)
let dict = System.Collections.Generic.Dictionary<_, _>()
for i in 0 .. 10000000 do
  dict.Add(i, i)

有趣的问题是 - 你能更快地制作不可变的 F# map 吗?原则上,如果您知道正在使用已排序的数组,则可以更快地构建 map 。 F# 映射没有任何可以让您执行此操作的操作,但可以添加它。

当我定义与 F# map 共享内部结构的自己的 Map 类型时:
type MapTree<'Key, 'Value when 'Key : comparison > = 
  | MapEmpty 
  | MapOne of 'Key * 'Value
  | MapNode of 'Key * 'Value * MapTree<'Key, 'Value> *  MapTree<'Key, 'Value> * int

然后我可以定义 ofSortedArray手术:
let height = function
  | MapEmpty -> 0
  | MapOne _ -> 1
  | MapNode(_, _, _, _, h) -> h

let rec ofSortedArray (data:_[]) i j = 
  if i = j then MapOne(data.[i])
  elif i > j then MapEmpty 
  else 
    let m = i + (j - i) / 2
    let l, r = ofSortedArray data i (m - 1), ofSortedArray data (m + 1) j
    let k, v = data.[m]
    MapNode(k, v, l, r, 1 + (max (height l) (height r)))

这仍然远不及可变哈希表有效,但我得到以下信息:
// Immutable tree-based F# map, using sorted array 
let arr = [| for i in 0 .. 10000000 -> i, i |] // ~1 sec
let map = ofSortedArray arr 0 10000000         // ~3 sec

如果您真的想使用它,您需要自己版本的 F# 映射 - 或者您可以向 F# 核心库发送拉取请求,添加对此类内容的支持!

关于c# - 提高 F# map 插入性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61686286/

相关文章:

c# - 不同的字符串比较方法有什么区别

c# - LINQ 中的 Context.SaveChanges()

python - 从 python3.3 中的两个嵌套列表添加一元值

ios - MapBox:如何删除一个形状并绘制另一个形状?

c# - 使用 Entity Framework 替换选择的字符串

c# - 不保存到 HDD 的临时文件

c# - 中国日期 - 在有效的日期时间无法识别字符串

c# 去除多余空格的最快方法

c# - 是否可以在 Visual Studio 中为同一个 TargetFramework 构建不同的输出?

python - 使用子字符串将字典转换为列表