在很多 网站(或者很多 WebService),
我们总能看到 Ӓ &#A22A; 这种格式 的编码。
如何将这种编码 转换成 实际文本,C#代码如下:
1 //各种 幺蛾子网页图标 请参见: https://dev.w3.org/html5/html-author/charref 2 3 string str = "中国"; 4 string str2 = "中国"; 5 string str3 = "♣♣♣♣█"; 6 7 8 string decode = System.Web.HttpUtility.HtmlDecode(str); 9 Console.WriteLine(decode); //中国 10 decode = System.Web.HttpUtility.HtmlDecode(str2); 11 Console.WriteLine(decode); //中国 12 decode = System.Web.HttpUtility.HtmlDecode(str3); 13 Console.WriteLine(decode); //♣♣♣♣█ //有些 ♣ 格式, 识别不了. 14 15 Console.WriteLine(System.Web.HttpUtility.HtmlEncode("我爱中国")); //不会被再次转义为 � 格式
最后的废话:
> ࢮ 这种编码 是 UTF8 网页编码时用到。
> 这类编码 和 ≶ &tg; 这类编码 基本是 一伙的。
> 但: ࢮ 这类编码 目测毫无价值。