haskell - 用 GHC 将小型 Haskell 程序编译成巨大的二进制文件

标签 haskell linker ghc static-linking glfw

即使是非常小的 Haskell 程序也会变成巨大的可执行文件。

我编写了一个小程序,它被编译(使用 GHC)为大小扩展为 7 MB 的二进制文件!

是什么导致即使是很小的 Haskell 程序也被编译成巨大的二进制文件?

我可以做些什么来减少这种情况?

最佳答案

让我们看看是怎么回事,试试

  $ du -hs A
  13M   A

  $ file A
  A: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), 
     dynamically linked (uses shared libs), for GNU/Linux 2.6.27, not stripped

  $ ldd A
    linux-vdso.so.1 =>  (0x00007fff1b9ff000)
    libXrandr.so.2 => /usr/lib/libXrandr.so.2 (0x00007fb21f418000)
    libX11.so.6 => /usr/lib/libX11.so.6 (0x00007fb21f0d9000)
    libGLU.so.1 => /usr/lib/libGLU.so.1 (0x00007fb21ee6d000)
    libGL.so.1 => /usr/lib/libGL.so.1 (0x00007fb21ebf4000)
    libgmp.so.10 => /usr/lib/libgmp.so.10 (0x00007fb21e988000)
    libm.so.6 => /lib/libm.so.6 (0x00007fb21e706000)
    ...      

您从 ldd 输出中看到 GHC 生成了一个动态链接的可执行文件,但是只有 C 库是动态链接的!所有 Haskell 库都被逐字复制。

另外:由于这是一个图形密集型应用程序,我肯定会使用 ghc -O2

进行编译

您可以做两件事。

剥离符号

一个简单的解决方案:剥离二进制文件:

$ strip A
$ du -hs A
5.8M    A

Strip 从目标文件中丢弃符号。它们通常仅在调试时需要。

动态链接的 Haskell 库

最近,GHC 获得了对 dynamic linking of both C and Haskell libraries 的支持.大多数发行版现在都发布了一个 GHC 版本,用于支持 Haskell 库的动态链接。共享的 Haskell 库可以在许多 Haskell 程序之间共享,而无需每次都将它们复制到可执行文件中。

在撰写本文时支持 Linux 和 Windows。

要允许动态链接 Haskell 库,您需要使用 -dynamic 编译它们,如下所示:

 $ ghc -O2 --make -dynamic A.hs

此外,任何你想共享的库都应该使用 --enabled-shared 构建:

 $ cabal install opengl --enable-shared --reinstall     
 $ cabal install glfw   --enable-shared --reinstall

你最终会得到一个更小的可执行文件,它同时动态解析了 C 和 Haskell 的依赖关系。

$ ghc -O2 -dynamic A.hs                         
[1 of 4] Compiling S3DM.V3          ( S3DM/V3.hs, S3DM/V3.o )
[2 of 4] Compiling S3DM.M3          ( S3DM/M3.hs, S3DM/M3.o )
[3 of 4] Compiling S3DM.X4          ( S3DM/X4.hs, S3DM/X4.o )
[4 of 4] Compiling Main             ( A.hs, A.o )
Linking A...

然后,瞧!

$ du -hs A
124K    A

你可以剥离它以使其更小:

$ strip A
$ du -hs A
84K A

一个很小的可执行文件,由许多动态链接的 C 和 Haskell 片段构建而成:

$ ldd A
    libHSOpenGL-2.4.0.1-ghc7.0.3.so => ...
    libHSTensor-1.0.0.1-ghc7.0.3.so => ...
    libHSStateVar-1.0.0.0-ghc7.0.3.so =>...
    libHSObjectName-1.0.0.0-ghc7.0.3.so => ...
    libHSGLURaw-1.1.0.0-ghc7.0.3.so => ...
    libHSOpenGLRaw-1.1.0.1-ghc7.0.3.so => ...
    libHSbase-4.3.1.0-ghc7.0.3.so => ...
    libHSinteger-gmp-0.2.0.3-ghc7.0.3.so => ...
    libHSghc-prim-0.2.0.0-ghc7.0.3.so => ...
    libHSrts-ghc7.0.3.so => ...
    libm.so.6 => /lib/libm.so.6 (0x00007ffa4ffd6000)
    librt.so.1 => /lib/librt.so.1 (0x00007ffa4fdce000)
    libdl.so.2 => /lib/libdl.so.2 (0x00007ffa4fbca000)
    libHSffi-ghc7.0.3.so => ...

最后一点:即使在只有静态链接的系统上,您也可以 use -split-objs , 为每个顶级函数获取一个 .o 文件,这可以进一步减少静态链接库的大小。它需要使用 -split-objs 构建 GHC,有些系统忘记这样做。

关于haskell - 用 GHC 将小型 Haskell 程序编译成巨大的二进制文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27468734/

相关文章:

haskell - GHCi - 第二次运行时跳过断点

linker - 动态链接和动态加载有什么区别

haskell - 为什么 Haskell 中的这种类型注释是必要的?

haskell - 如何在不安装 cabal 的情况下在 snap 框架中进行迭代

haskell - 瓦德勒的论文 : How is a tuple a function?

Haskell Map函数实现问题

linker - 单命令编译和链接失败,单独的步骤有效

c++ - 如何找到谁在调用共享库函数?

Haskell:如何只用 ghc 生成 .hi 文件?

haskell - 为多态模式同义词编写完整的编译指示?