Java高质量代码之 — 字符串_JAVA

您所在的位置：程序员俱乐部 > 编程开发 > JAVA > Java高质量代码之 — 字符串

Java高质量代码之 — 字符串

2013/8/20 18:41:36 ray_yui 程序员俱乐部我要评论(0)

摘要：前言:由于上一个星期工作繁忙,利用上下班和晚上睡前空余的时间拜读了秦小波老师的《改善Java程序的151建议》,感觉廓然开朗,注意到了很多平时在编写代码中并不会注意的问题,甚至感觉自己对Java只是略懂皮毛,不足以登大雅之堂,特此与读者分享读书笔记,以下内容摘自《改善Java程序的151建议》一书和笔者的理解Java高质量代码系列文章面向对象篇:http://ray-yui.iteye.com/blog/1926984数据类型篇:http://ray-yui.iteye
标签：Java 代码字符串

前言:由于上一个星期工作繁忙,利用上下班和晚上睡前空余的时间拜读了秦小波老师的《改善Java程序的151建议》,感觉廓然开朗,注意到了很多平时在编写代码中并不会注意的问题,甚至感觉自己对Java只是略懂皮毛,不足以登大雅之堂,特此与读者分享读书笔记,以下内容摘自《改善Java程序的151建议》一书和笔者的理解

Java高质量代码系列文章
      面向对象篇:http://ray-yui.iteye.com/blog/1926984
      数据类型篇:http://ray-yui.iteye.com/blog/1927251
          字符串篇:http://ray-yui.iteye.com/blog/1927647

继上一章讲了数据类型,但在Java当中,什么数据类型使用频率最高,最受大家喜爱?那就是我们无限兼容的String类型,拥有诸多方法的String类型,近乎万能的String类型,而在使用String类型当中我们要注意什么?

1.推荐使用String直接赋值
    首先我们来看一道经典的题目

class="java" name="code">
public static void main(String[] args) {
		String str1 = "Hello";
		String str2 = "Hello";
		String str3 = new String("Hello");
		System.out.println(str1 == str2);
		// 输出结果为true
		System.out.println(str1 == str3);
		// 输出结果为false
	}

以上代码,相信老鸟并不陌生,或者在学习过程中接触,或者在面试题上坑过,原因是Java当中为了避免系统大量的产生String对象,于是就设计出一个字符串常量池,当创建一个String时,会首先在常量池当中检查是否存在这个Hello这个常量,若然不存在,创建,若然存在,将内存地址指向此常量地址,str1赋值时,首先在常量池中创建了Hello,而str2再赋值时,Java检查到常量池中有Hello,直接将Hello的地址赋予了str2,造成str1==str2的情况,而new String的情况下,Java不会去常量池寻找,而是直接在堆中建立对象,所以使用str1==str3自然不成立,通过上面的介绍,由于对象池是由JVM本身进行维护的,所以JVM本身已对常量池进行了大量优化,所以使用直接赋值的方式会比使用new String的方式效率更高,更节省内存空间.

2.注意正则表达式引发的问题
请观察一下一段代码

public static void main(String[] args) {
		// 1
		String str1 = "AHelloA";
		str1 = str1.replaceAll("A", "");
		System.out.println(str1.equals("Hello"));
		// 输出为true

		// 2
		String str2 = "$Hello$";
		str2 = str2.replaceAll("$", "");
		System.out.println(str2.equals("Hello"));
		// 输出为false

		// 3
		String str3 = "$Hello$";
		str3 = str3.replaceAll("\\$", "");
		System.out.println(str3.equals("Hello"));
		// 输出为true

		// 4
		String str4 = "$Hello$";
		// 更改了replace方法
		str4 = str4.replace("$", "");
		System.out.println(str4.equals("Hello"));
		// 输出true
	}

注意观察//2 ,大家还记得正则表达式吗?这是因为replaceAll的方法其实是接受一个正则表达式,而$符号刚好是正则表达式的结束符号,所以出现了//2的情况,以后使用replaceAll时需要注意

3.注意String的不变性
请观察一下代码

public static void main(String[] args) {
		// 1
		String str1 = "Hello";
		str1 += " World";
		System.out.println(str1);
		// 输出Hello World

		// 2
		str1.replace("World", "");
		System.out.println(str1);
		// 输出Hello World

		// 3
		str1.substring(3);
		System.out.println(str1);
		// 输出Hello World
	}

在上面的代码当中,//1中,究竟创建了多少个String?一共是创建了3个,第一为Hello,第二为World,第三为Hello World,因为直接赋值的方式是在字符串常量池中生成的常量,什么是常量?不可变就为常量,因为不可变,所以//1中产生的了3个String,而//2中为什么我替换了还是等于Hello World呢?这也是因为不变性,仔细的你会发现,String类中提供的修改字符串的方法,包括substring,replace,concat等都是返回一个新的字符串,这是因为字符串的不变性造成的,所以在调用这些方法时需要用另一个或本调用的string去进行接收,//3同理

4.注意字符串的位置
请观察以下代码

public static void main(String[] args) {
		String str1 = 1 + 2 + "Hello";
		System.out.println(str1);
		// 输出3Hello

		String str2 = "Hello" + 1 + 2;
		System.out.println(str2);
		// 输出Hello12
	}

      笔者认为String是一个霸道的类型,而且霸道得我很欢喜,因为任何与String类型进行+号操作的其他类型,都会自动升格为String类型,而上例中是因为首先执行1+2的操作,再偶遇到String的Hello,再进行了自动升格,而第二个例子中,在还没进行整形的加法运算时,就首先偶遇到了String,已经自动提升为String,所以就等于Hello1+2的操作,自然等于Hello12

5.正确使用String,StringBuffer,StringBuilder
      在上文当中,曾经提到过String的不变性,在String原因下,就产生出了StringBuffer和StringBuilder,后2者为可变的字符串,亦可以称为缓冲字符串,主要原理其实很简单,就是缓冲字符串中的字符串形式是char数组,以下来分析StringBuffer和String的几点不同
      1.在频繁的字符串运算,例如拼接,删除,增加,替换,解释XML,进行SQL拼接
        的时候,请优先考虑使用StringBuffer

      2.在性能考虑方面,由于StringBuffer带有缓冲区,而且最终使用toString()
        方法转换成1个字符串,我们试想,StringBuffer无论里面的信息是多么的
        复杂,但最终是生成了1个字符串对象,效率会比用+号拼接不停生成字符串
        的效率要高

      3.想使用更多功能时,例如字符串翻转reverse,字符串插入insert,这些都是
        String所不提供的,而StringBuffer却支持,所以想增加某些功能时,使用
        StringBuffer

      4.StringBuffer和StringBuilder区别?很简单,StringBuffer是线程安全的,
        在多线程的环境底下应该使用StringBuffer,而StringBuilder线程是不
        安全的,由于现在流行的SSH框架,而struts2中Action是线程安全的,所以
        请大胆的使用StringBuilder

6.推荐在复杂字符串操作中使用正则表达式
      正则表达式是笔者非常喜爱的东西,对字符串的操作而言,简直是万能,但却不容易一眼看穿究竟正则想表达些什么,因为毕竟是以符号来表达,在String中很多操方法都支持正则表达式,例如replace,split,substring等等,都知道正则表达式的参数,所以在操作复杂的字符串例如邮箱验证时,请务必使用正则表达式

7.使用字符串解决编码问题
      相信各位接触过Web开发经验的开发人员都肯定接触过乱码问题,有时是从Web接受时遇到的,有时是从数据库中读取到乱码,而乱码的元凶就在于我们的IDE,使用javac进行编译时,JDK默认生成的编码是UTF-8的UNICODE编码,但在IDE开发进行编译时,若没有指定的话就会使用机器默认的语言,例如Window就会使用GBK等,而怎么样解决这个问题呢?除了在框架配置中解决,还可以在String当中使用代码来解决乱码,请看以下例子

public static void main(String[] args) throws UnsupportedEncodingException {
		String str1 = "你好";

		// 第一种方法,此种方法需要知道来源字符串的编码
		byte[] byte1 = str1.getBytes("GBK");
		String str2 = new String(byte1);

		// 第二种方法,此种方法需要知道转变为什么格式的字符串,推荐使用
		String str3 = new String(str1.getBytes(), "UTF-8");
	}

8.对字符串排序持宽容心态
例如创建了一个字符串数组,使用Arrays.sort()进行自然排序,注意是自然排序,就会出现排序混乱的情况,为什么呢?因为我们Java对字符串排序时是根据了UNICODE编码来进行排序,是UNICODE编码对汉字的顺序并不是连贯连续的,所以若然要对字符串进行精确排序,可以选择使用pingyin4j转换成拼音后再首字母排序

总结:
笔者在本文章中只从《改善Java程序的151建议》中提取部分进行归纳性叙述,推荐各位读者购买这本书,该书不仅从事例中学习,而且涉及到原理,底层的实现,不仅告诉你应该怎么做,还告诉你为什么要这样做.

上一篇： Java中super的使用下一篇：不要在常量和变量中出现易混淆的字母