java - 为 Hashtable.put() 分配的内存

标签 java optimization

所以我在阅读 Peter Norvig 的 IAQ(不常见问题 - link)时偶然发现了这个:

You might be surprised to find that an Object takes 16 bytes, or 4 words, in the Sun JDK VM. This breaks down as follows: There is a two-word header, where one word is a pointer to the object's class, and the other points to the instance variables. Even though Object has no instance variables, Java still allocates one word for the variables. Finally, there is a "handle", which is another pointer to the two-word header. Sun says that this extra level of indirection makes garbage collection simpler. (There have been high performance Lisp and Smalltalk garbage collectors that do not use the extra level for at least 15 years. I have heard but have not confirmed that the Microsoft JVM does not have the extra level of indirection.)

An empty new String() takes 40 bytes, or 10 words: 3 words of pointer overhead, 3 words for the instance variables (the start index, end index, and character array), and 4 words for the empty char array. Creating a substring of an existing string takes "only" 6 words, because the char array is shared. Putting an Integer key and Integer value into a Hashtable takes 64 bytes (in addition to the four bytes that were pre-allocated in the Hashtable array): I'll let you work out why.

很好,我显然已经尝试过了,但我无法弄清楚。下面我只计算单词: 一个 Hashtable put 创建一个 Hashtable$Entry:3(开销)+ 4 个变量(我假设 3 个引用是 1 个字 + 1 个整数)。我进一步假设他的意思是整数是新分配的(因此没有被整数类缓存或已经存在)达到 2*(3 [开销] + 1 [1 int 值])。

所以最后我们得到... 15 个字或 60 个字节。所以我首先想到的是作为内部类的 Entry 需要对其外部对象的引用,但是它是静态的所以这没有多大意义(当然我们必须存储一个指向父类的指针,但我会认为信息由 VM 存储在类头中)。

只是出于好奇,我很清楚所有这些在很大程度上取决于实际的 JVM 实现(在 64 位版本上结果会有所不同),但我仍然不喜欢我无法回答的问题回答:)

编辑:只是为了让这一点更清楚一点:虽然我很清楚更紧凑的结构可以为我们带来一些性能优势,但我同意通常担心这里的几个字节或者浪费时间。我肯定不会因为这里或那里的几个字节开销而停止使用哈希表,就像我不会使用普通字符数组而不是字符串(或开始使用 C)一样。这纯粹是出于学术兴趣,希望更多地了解 Java/JVM 的内部 :)

最佳答案

作者似乎假设有 3 个对象,每个对象有 16 字节的开销,Map.Entry 中有 2 个 32 位引用和 2 x 1 32 位 int 值。这将总共 64 字节

这是有缺陷的,因为 Sun/Oracle 的 JVM 仅在 8 字节边界上分配,因此虽然从技术上讲 Integer 占用 20 字节内存,但使用了 24 字节(下一个 8 的倍数)

此外,许多 JVM 现在使用 64 位引用,因此 Map.Entry 将使用另外 16 个字节。

这一切都非常低效,这就是为什么您可能会使用像 TIntIntHashMap 这样使用基元的类。

但是,通常这并不重要,因为当您将内存与您的时间成本进行比较时,它的价格低得惊人。如果您在服务器应用程序上工作并且您的公司每小时花费大约 40 美元,那么您需要每分钟节省大约 10 MB 才能节省与您花费的内存一样多的内存。 (理想情况下,您需要节省的空间比这多得多)每分钟节省 10 MB 是很困难的。

内存是可以重复使用的,但你的时间不是。

关于java - 为 Hashtable.put() 分配的内存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6162852/

相关文章:

java - Tomcat 在生产服务器上突然停止工作

java - Hibernate 设置为 json

mysql - 使用值列表中的子查询优化 mysql 查询

optimization - 优化零件提取

ruby-on-rails - Rail 片段缓存如何使您的应用程序受益,即防止数据库调用?

optimization - 内存读写汇编指令的最优排序

java - Tomcat Https jks 文件错误 : java. io.IOException : DerInputStream. getLength() : lengthTag=109, too big

java - 需要多个 slf4j 绑定(bind)的解决方案,而不从类路径中删除其他绑定(bind) jar

java - Grails 应用程序中的 Perm Gem 问题

c++ - 帮助编译器优化分支代码序列