C#之int挑战Java之Integer

蒲善思 发表于 2025-5-29 19:17:54

《.NET 4.0面向对象编程漫谈》扩充阅读之

C#之int挑战Java之Integer

注：
         此文是我为本人拙著《.NET 4.0面向对象编程漫谈》所新写的扩充阅读材料。
         本文涉及到一些JVM原理和Java的字节码指令，推荐感兴趣的读者阅读一本有关JVM的经典书籍《深入Java虚拟机（第2版）》，将它与我在《.NET 4.0面向对象编程漫谈》中介绍的CLR原理与IL汇编指令作个对比，相信读者会有一定的启发。而仔细对比两个类似事物的异同，是很有效的学习方法之一。
         今后我还将在个人博客上放出其他的文章，希望能帮助书的读者开拓视野，启发思考，大家一起探讨技术的奥秘。
         本文所述之内容仅代表个人之理解，任何疏漏及错误请直接回贴指出。
==========================================================================

1 奇特的程序输出

         前段时间，一个学生给我看了一段“非常诡异”的Java代码：

public class TestInteger {
    public static void main(String[] args){
        Integer v1=100;
        Integer v2=100;
        System.out.println(v1==v2); //输出：true
        Integer w1=200;
        Integer w2=200;
        System.out.println(w1==w2); //输出：false
    }
}
         让这个学生最困惑的是，为什么这些如此相似的代码会有这样令人意外的输出？
         我平时多使用C#，Java用得不多，初看到这段代码的输出，我也同样非常奇怪：怎么会这样呢？100和200这两个整型数值对Integer这个类有本质上的差别吗？
         为了弄明白出现上述现象的底层原因，我使用javap工具反汇编了Java编译器生成的.class文件：


         通过仔细阅读Java编译器生的字节码，我发现以下给Integer变量赋值的语句：

         Integer v1=100;

         实际上调用的是Integer.valueOf方法。
         而完成两个Integer变量比较的以下语句：

         System.Console.WriteLine(v1 == v2);

         实际生成的是if_acmpne指令。其中的a代表“address”，cmp代表“Compare”，ne代表“not equal”。
         这条指令的含义是：比较Java方法栈中的两个操作数（即v1与v2），看看它们是不是指向堆中的同一个对象。
         当给v1和v2赋值100时，它们将引用同一个Integer对象。
         那为什么当值改为200时，w1和w2就“翻脸了”，分别引用不同的Integer对象？
         秘密就在于Integer.valueOf方法。幸运的是，Java的类库是开源的，所以我们可以毫不费力地看到相关的源代码：

public static Integer valueOf(int i) {
        if(i >= -128 && i 128的整数值的应用程序而言，这个缓存一点用处也没有，是个累赘。就算真要缓存，那也最好由应用程序开发者自己来实现，因为他可以依据自己开发的实际情况缓存真正用到的对象，而不需背着这个包容着256个Integer对象的大包袱。</p>         而且前面也看到了，基于Integer对象的加减乘除会增加许多不必要的类型转换指令，远不如直接使用原始数据类型更快捷更可靠。
         其实上用得最多的不是Integer对象而是它所封装的一堆静态方法（这些方法提供了诸如类型转换等常用功能），我很怀疑在实际开发中有多少场合需要去创建大量的Integer对象，而且还假设它们封装的数值还位于[-128,127]区间之内？
       缓存Integer对象还对多线程应用程序带来了一定的风险，因为可能会有多个线程同时存取同一个缓存了的Integer对象。不过JDK设计者已经考虑到了这个问题，我看到Integer类的字段都是final的，不可改，是一个不可变类，所以可以在多线程环境下安全地访问。尽管在使用上没问题，但这一切是不是有点弯弯绕？去掉这个对象缓存，Integer类型是不是“更轻爽”“更好用”？

4 C# int挑战Java Integer

         将Java的设计与.NET（以C#为例）的设计作个比较是有趣的。
         Java将数据类型分为“原始数据类型”和“引用数据类型”两大类，int是原始数据类型，为了向开发者提供一些常用的功能（比如将String转换为int），所以JDK提供了一个引用类型Integer，封装这些功能。
         .NET则不一样，它的数据类型分为“值类型”和“引用数据类型”两大类，int属于值类型，本身就拥有丰富的方法，请看以下C#代码：

    int i = 100;
    string str = i.ToString(); //int变量本身就拥有“一堆”的方法
         使用.NET的反汇编器ildasm查看一下上述代码生成的IL指令，不难发现C#编译器会将int类型映射为System.Int32结构：

         注意System.Int32是一个值类型，生存于线程堆栈中，一般来说，在多线程环境下，使用值类型的变量往往比引用类型的变量更安全，因为它减少了多线程访问同一对象所带来的问题。

=================================
         简要解释一下：请对比以下两个方法：
          void DoSomethingWithValueType(int value);
          void DoSomethingWithReferenceType(MyClass obj);
         当多个线程同时执行上述两个方法时，线程函数使用值类型的参数value是比较安全的，不用担心多个线程互相影响，但引用类型的obj参数就要小心了，如果多个线程接收到的obj参数有可能引用同一个MyClass对象，为保证运行结果的正确，有可能需要给此对象加锁。
====================================
         与JVM一样，.NET的CLR也提供了add等专用指令完成加减乘除功能。
         从开发者使用角度而言，C#的int既具有与Java的原始数据类型int一样的在虚拟机级别的专用指令，又具有Java包装类Integer所拥有的一些功能，还同时避免了Java中Integer的那种比较古怪的特性，个人认为，C#中的int比Java中的int/Integer更好用，更易用。
         但从探索技术内幕而言则大不一样，Java使用Integer一个类就“搞定”了所有常用的整数处理功能，而对于.NET的System.In32结构，好奇的朋友不妨用Reflector去查看一下相关的源码，会发现System.Int32在内部许多地方使用了Number类所封装的功能，还用到了NumberFormatInfo（提供数字的格式化信息）、CultureInfo（提供当前文化信息）等相关类型，如果再算加上一堆的接口，那真是“相当地”复杂。
         比对一下Java平台与.NET平台，往往会发现在许多地方Java封装得较少。
         从应用程序开发角度来看，不少地方Java在使用上不如.NET方便。就拿本文所涉及的非常常见的整数类型及其运算而言，相信大家都看到了，使用Java编程需要留心这个“Intege对象缓存”的陷阱，而.NET则很贴心地把这些已发现的陷阱（.NET设计者说：当然肯定会有没发现的陷阱，但那就不关我事了）都盖上了“厚厚”的井盖，让开发者很省心，因而带来了较高的开发效率和较好的开发体验。
         但另一方面，Java的JDK代码一览无余，是开放的，你要探索其技术内幕，总是很方便，这点还是比较让人放心。
        .NET则相对比较封闭，总是遮遮掩掩，想一览其庐山真相还真不容易，而且我感觉它为开发者考虑得太周到了，服务得太好了，这不见得是一件好事。因为人性的弱点之一就是“好逸恶劳”，生活太舒服了，进取精神就会少掉不少，.NET开发者很容易于不知不觉中养成了对技术不求甚解的“恶习”，因为既然代码能够正常工作，那又何必费心地去追根问底？但话又说回来，如果仅满足于知其然，又怎会在技术上有所进步和提高？等到年纪一大，就被年轻人给淘汰了。而这种现象的出现，到底应该怪微软，怪周遭的环境，还是自己呢？

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

页: [1]

程序园's Archiver

C#之int挑战Java之Integer