当前位置:主页 > java教程 > Java String字符串和Unicode字符相互转换代码详解

Java String字符串和Unicode字符相互转换实例代码

发布:2019-12-24 15:57:16 138


给寻找编程代码教程的朋友们精选了Java字符串相关的编程文章,网友汤茂勋根据主题投稿了本篇教程内容,涉及到Java、String、字符串、Unicode、Java String字符串和Unicode字符相互转换代码详解相关内容,已被320网友关注,内容中涉及的知识点可以在下方直接下载获取。

Java String字符串和Unicode字符相互转换代码详解

网上大部分有关“Java String字符串和Unicode字符相互转换代码”的博文几乎都仅是将全为Unicode字符的字符串进行转换,而我们日常很可能需要的是将混有普通字符的Unicode一并转换(例如“\u0061\u0062\u0063(123)”,我们希望转换成“abc(123)”,而实际上网上的通用方法并不符合该需求,运行即报错),普通字符跳过而Unicode字符要进行转换,在进行字符串的查找替换截取什么的使用正则表达式往往是个很好的选择。

因此作者我结合了网上提供的方法结合正则i表达式实现该需求!

在进行代码讲解时我先贴出实现代码:

网上一般实现代码:

字符串转换unicode java方法代码片段:

 /**
	 * 字符串转换unicode
	 * @param string
	 * @return
	 */
	public static String string2Unicode(String string) {
		StringBuffer unicode = new StringBuffer();
		for (int i = 0; i < string.length(); i++) {
			// 取出每一个字符
			char c = string.charAt(i);
			// 转换为unicode
			unicode.append("\\u" + Integer.toHexString(c));
		}
 
		return unicode.toString();
	}

unicode转换字符串java方法代码片段:

/**
	 * unicode 转字符串
	 * @param unicode 全为 Unicode 的字符串
	 * @return
	 */
	public static String unicode2String(String unicode) {
		StringBuffer string = new StringBuffer();
		String[] hex = unicode.split("\\\\u");
 
		for (int i = 1; i < hex.length; i++) {
			// 转换出每一个代码点
			int data = Integer.parseInt(hex[i], 16);
			// 追加成string
			string.append((char) data);
		}
 
		return string.toString();
	

结合正则实现的代码:

混有普通字符的Unicode转换为字符串:

/**
	 * 含有unicode 的字符串转一般字符串
	 * @param unicodeStr 混有 Unicode 的字符串
	 * @return
	 */
	public static String unicodeStr2String(String unicodeStr) {
		int length = unicodeStr.length();
		int count = 0;
		//正则匹配条件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}";
		String regex = "\\\\u[a-f0-9A-F]{1,4}";
		Pattern pattern = Pattern.compile(regex);
		Matcher matcher = pattern.matcher(unicodeStr);
		StringBuffer sb = new StringBuffer();
		
		while(matcher.find()) {
			String oldChar = matcher.group();//原本的Unicode字符
			String newChar = unicode2String(oldChar);//转换为普通字符
			// int index = unicodeStr.indexOf(oldChar);
      // 在遇见重复出现的unicode代码的时候会造成从源字符串获取非unicode编码字符的时候截取索引越界等
			int index = matcher.start();
 
			sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符
			sb.append(newChar);//添加转换后的字符
			count = index+oldChar.length();//统计下标移动的位置
		}
		sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符
		return sb.toString();
	}

完整代码:

package util;
 
import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
/**
 * 
 * <p>Title: String 与 Unicode 互相转换的工具类</p>
 * <p>Description: </p>
 * <p>Company: SCAU@Copyright</p>
 * @Copyright 1.0
 * @author jodenhe (824923282@qq.com)
 * @version 1.0
 * @since 2017年8月17日 下午9:42:50
 */
public class StringUnicodeUtil {
	
	/**
	 * 含有unicode 的字符串转一般字符串
	 * @param unicodeStr 混有 Unicode 的字符串
	 * @return
	 */
	public static String unicodeStr2String(String unicodeStr) {
		int length = unicodeStr.length();
		int count = 0;
		//正则匹配条件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}";
		String regex = "\\\\u[a-f0-9A-F]{1,4}";
		Pattern pattern = Pattern.compile(regex);
		Matcher matcher = pattern.matcher(unicodeStr);
		StringBuffer sb = new StringBuffer();
		
		while(matcher.find()) {
			String oldChar = matcher.group();//原本的Unicode字符
			String newChar = unicode2String(oldChar);//转换为普通字符
			// int index = unicodeStr.indexOf(oldChar);
      // 在遇见重复出现的unicode代码的时候会造成从源字符串获取非unicode编码字符的时候截取索引越界等
			int index = matcher.start();
			
			sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符
			sb.append(newChar);//添加转换后的字符
			count = index+oldChar.length();//统计下标移动的位置
		}
		sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符
		return sb.toString();
	}
	
	/**
	 * 字符串转换unicode
	 * @param string
	 * @return
	 */
	public static String string2Unicode(String string) {
		StringBuffer unicode = new StringBuffer();
		for (int i = 0; i < string.length(); i++) {
			// 取出每一个字符
			char c = string.charAt(i);
			// 转换为unicode
			unicode.append("\\u" + Integer.toHexString(c));
		}
 
		return unicode.toString();
	}
 
	/**
	 * unicode 转字符串
	 * @param unicode 全为 Unicode 的字符串
	 * @return
	 */
	public static String unicode2String(String unicode) {
		StringBuffer string = new StringBuffer();
		String[] hex = unicode.split("\\\\u");
 
		for (int i = 1; i < hex.length; i++) {
			// 转换出每一个代码点
			int data = Integer.parseInt(hex[i], 16);
			// 追加成string
			string.append((char) data);
		}
 
		return string.toString();
	}
	
	public static void main(String[] args) {
		String str = "abc";
		String str2 = string2Unicode(str);
		System.out.println(str2);
		System.out.println(unicodeStr2String(str2));
		System.out.println(unicodeStr2String("\\u61HJ\\u62\\u63(sfkfdsl)"));
	}
}

代码运行结果图:

Java String字符串和Unicode字符相互转换代码详解

重要代码讲解:

代码的实现其实很简单,因此只对核心主要代码进行讲解,如对代码有疑惑可私信或留下评论!

1、正则匹配规则:

String regex = \\\\u[a-f0-9A-F]{1,4};

这个是正则匹配的规则,可能你会疑惑为什么使用“\\\\u”来匹配javan字符串的“\\u”,原因很简单,因为这样才匹配得上嘛(开个玩笑)直接看测试图1-2

测试图1:

Java String字符串和Unicode字符相互转换代码详解

测试图2:

Java String字符串和Unicode字符相互转换代码详解

很明显在菜鸟上使用两种匹配方式匹配到的结果是不同的,而java字符串需要转义,上图的“\u”java就应该是“\\u”,因此就要使用“\\\\u”来进行匹配!

[a-f0-9A-F]{1,4}

”[a-f0-9A-F]“ :这个意思就是a到f,0到9,A到F出现的数都符合要求,“{1,4}”意思是前面的字符出现1到4个(其实一般的Unicode都是“\u”后面家4个字符的,如“\u0061”代表“a”,因此该式子可改为“\\\\u[a-f0-9A-F]{4}”,这样可能更符合实际要求)

其余的代码部分可查看源文件的注释,应该是可以理解的,慢慢推敲一下,应该不难。

以上所述是小编给大家介绍的Java String字符串和Unicode字符相互转换代码详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对码农之家网站的支持!


参考资料

相关文章

  • Java中的内存泄露代码详细分析

    发布:2019-06-04

    这篇文章主要介绍了Java语言中的内存泄露代码详解,具有一定借鉴价值,需要的朋友可以参考下。


  • Java整合Jackson实现反序列化器流程

    发布:2023-03-07

    Jackson是一个开源的Java序列化和反序列化工具,可以将Java对象序列化为XML或JSON格式的字符串,以及将XML或JSON格式的字符串反序列化为Java对象。由于其使用简单,速度较快,且不依靠除JDK外的其他库,被众多用户所使用


  • pandas批量处理矢量化字符串实例分析

    发布:2019-08-07

    今天小编就为大家分享一篇使用pandas批量处理矢量化字符串的实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧


  • Java中判断对象是否为空的实例代码

    发布:2019-07-02

    这篇文章主要介绍了Java中判断对象是否为空的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧


  • 详解Java如何实现百万数据excel导出功能

    发布:2023-04-16

    这篇文章主要为大家详细介绍了Java如何实现百万数据excel导出功能,文中的示例代码讲解详细,具有一定的借鉴价值,需要的可以参考一下


  • mysql字符串函数收集比较全

    发布:2022-06-17

    给网友朋友们带来一篇关于mysql的教程,mysql 字符串函数收集,需要的朋友可以参考下。


  • Java异常处理操作实例讲解

    发布:2021-05-06

    这篇文章主要介绍了Java基础之异常处理操作,涉及java异常捕获、抛出异常、自定义异常处理相关操作技巧,需要的朋友可以参考下


  • Java实现自定义枚举值校验器的示例代码

    发布:2023-03-27

    这篇文章主要为大家详细介绍了Java实现自定义枚举值校验器的相关资料,文中的示例代码讲解详细,具有一定的借鉴价值,需要的可以参考一下


网友讨论