programming-languages - 从二进制文件中确定源语言?

标签 programming-languages binary disassembly

responded关于使用非Objective-C 语言为iPhone 开发的另一个问题,我断言使用C# 为iPhone 编写代码会令Apple 评论者感到错误。我主要谈论的是所讨论的 ObjC 和 C# 库之间不同的 UI 元素,但一位评论者提出了一个有趣的观点,让我想到了这个问题:

是否可以仅从其二进制文件中确定程序所用的语言? 如果有这样的方法,它们是什么?

为了这个问题,让我们假设:

  • 从交互的角度(控制台行为、任何 GUI 外观等)来看,两者是相同的。
  • 这种性能不是语言的可靠指标(没有比较,比如说,Java 和 C)。
  • 你和语言之间没有解释器或其他东西——只是原始的可执行二进制文件。

  • 如果您是语言不可知论者,则可以加分。

    最佳答案

    简答:

    长答案:

    如果查看二进制文件,您可以找到已链接的库的名称。在 TextPad 中打开 cmd.exe 可以轻松找到十六进制偏移量 0x270 处的以下内容:msvcrt.dll、KERNEL32.dll、NTDLL.DLL、USER32。 dll 等。 msvcrt 是 Microsoft 'C' 运行时支持函数。 KERNEL32、NTDLL 和 USER32.dll 是操作系统特定的库,它们告诉您目标平台或构建它的平台,具体取决于跨平台开发环境将两者隔离的程度。

    撇开这些线索不谈,大多数 c/c++ 编译器都必须将函数的名称插入二进制文件中,所有函数(或入口点)的列表都存储在表中。 C++ 对函数名称进行“修饰”以对参数及其类型进行编码以支持重载方法。可以混淆函数名称,但它们仍然存在。函数签名将包括参数的数量和类型,可用于跟踪系统或程序中使用的内部调用。在偏移量 0x4190 处是“SetThreadUILanguage”,可以搜索它以了解有关 development environment 的很多信息。 .我在偏移量 0x1ED8A 处找到了入口点表。我可以很容易地看到诸如 printf、exit 和 scanf 之类的名称;连同 __p__fmode、__p__commode 和 __initenv

    x86 处理器的任何可执行文件都有一个数据段,其中包含程序中包含的任何静态文本。回到 cmd.exe(偏移 0x42C8)是文本“S.o.f.t.w.a.r.e.P.o.l.i.c.i.e.s.M.i.c.r.o.s.o.f.t..W.i.n.d.o.w.s..S.y.s.t.e.t.e.s.该字符串需要两倍于通常需要的字符,因为它使用双宽字符存储,可能是为了国际化。错误代码或消息是这里的主要来源。

    在偏移 B1B0 处是“p.u.s.h.d”,后跟 mkdir、rmdir、chdir、md、rd 和 cd;为了可读性,我省略了不可打印的字符。这些都是 cmd.exe 的命令参数。

    对于其他程序,我有时能够找到编译程序的路径。

    所以, ,可以从二进制文件中确定源语言。

    关于programming-languages - 从二进制文件中确定源语言?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1704202/

    相关文章:

    arm - 如何区分elf文件中的thumb指令和a​​rm指令?

    java - 从代码片段中检测编程语言

    functional-programming - Derivable 规则和 Admissible 规则之间的区别?

    java - 在Java中从包含8位(灰度)或1位(二进制)数据的字节数组创建图像(bmp左右)

    f# - 是否可以将 F# 代码转换为 C# 代码?

    assembly - x86 中 BND RET 的含义

    programming-languages - 哪些编程语言允许您定义成对括号之类的运算符?

    reflection - 基于镜子的反射和传统反射有什么区别?

    javascript - 位串中的交替整数

    binary - 编号系统 : binary vs hex