网络编程 | 站长之家 | 网页制作 | 图形图象 | 操作系统 | 冲浪宝典 | 软件教学 | 网络办公 | 邮件系统 | 网络安全 | 认证考试 | 系统进程
Firefox | IE | Maxthon | 迅雷 | 电驴 | BitComet | FlashGet | QQ | QQ空间 | Vista | 输入法 | Ghost | Word | Excel | wps | Powerpoint
asp | .net | php | jsp | Sql | c# | Ajax | xml | Dreamweaver | FrontPages | Javascript | css | photoshop | fireworks | Flash | Cad | Discuz!
当前位置 > 网站建设学院 > 网络编程 > Java
Tag:注入,存储过程,分页,安全,优化,xmlhttp,fso,jmail,application,session,防盗链,stream,无组件,组件,md5,乱码,缓存,加密,验证码,算法,cookies,ubb,正则表达式,水印,索引,日志,压缩,base64,url重写,上传,控件,Web.config,JDBC,函数,内存,PDF,迁移,结构,破解,编译,配置,进程,分词,IIS,Apache,Tomcat,phpmyadmin,Gzip,触发器,socket
网络编程:ASP教程,ASP.NET教程,PHP教程,JSP教程,C#教程,数据库,XML教程,Ajax,Java,Perl,Shell,VB教程,Delphi,C/C++教程,软件工程,J2EE/J2ME,移动开发
本月文章推荐
.关于 MVC 模式中的通知机制.
.3. Building View Components.
.instanceof 运算符.
.IntelliJ IDEA 5.1&nb.
.J2SE 5.0新特性之static import.
.怎样用javascript计算两日期间相.
.Java多线程编程详解.
.java的线程安全四种方式五个等级.
.用Java编写的记事本程序(2).
.Enterprise JavaBeans导论2.
.核心API最佳实践——JDK日志分级.
.程序员应用EJB 3.0必要的准备.
.用JBossEclipseIDE开发J2EE应用系.
.书评:Java的盛宴(上).
.Java网络编程基础(一) InetAddre.
.取余赋值运算符 (%=).
.servlet.
.新Java技术工具亮相游戏开发商大.
.Sun JDK/JRE 执行禁止类漏洞.
.全面分析Java的垃圾回收机制.

Java中文处理, 资源包后缀详解

发表日期:2008-1-5


作者: 车东 Email: chedongATbigfoot.com/chedongATchedong.com

写于:2002/07 最后更新: 02/22/2006 14:42:55

版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明
http://www.chedong.com/tech/hello_unicode.Html

要害词:Linux Java mutlibyte encoding locale i18n i10n chinese  ISO-8859-1 GB2312 BIG5 GBK UNICODE

内容摘要:

     

不知道你有没有这样的感受:为什么PHP很少有乱码问题而用Java做WEB应用却这么麻烦呢?为什么在Google上能用简体中文查到繁体中文,甚至日文的结果?而且用Google的时候发现它居然能自动根据我使用浏览器的语言选择自动调出中文界面?

很多国际化应用的让我理解了这么一个道理:Unicode是为更方便的做国际化应用设计的,而Java核心的字符是基于UNICODE的,这一机制为应用提供了对中文“字”的控制(而不是字节)。但假如不仔细理解其中的规范,这种自由反而会成为累赘,从而导致更多的乱码问题:

  1. 关于字符集的一些基本概念;
  2. 试验1:显示系统的环境设置和支持的编码方式;
  3. 试验2:系统缺省编码方式对Java应用的输入输出影响;
  4. 试验3:在WEB应用中输出和输出中的字符集问题;

关于字符集的预备知识:
ISO-8859-1 GB2312 BIG5 GBK GB18030 UNICODE 为什么会有这么多字符集编码方式?

注重:以下说明不是严格定义,一些比喻仅作为方便理解使用。

假设一个字符就是棋盘上的一个棋子,有其固定的坐标,假如需要区别所有的字符,就需要有足够的棋格容纳不同的“字符”。 

英文和欧洲其他语言的单字节字符集(SingleByte Charsets):
首先对于ISO-8859系列的字符集都想象成一个:2^8 = 16 * 16 = 256个格子的棋盘,这样所有的西文字符(英文)用这样一个16×16的坐标系就基本可以覆盖全了。而英文实际上只用其中小于128(\x80)的部分就够了。利用大于128部分的空间的不同定义规则形成了真对其他欧洲语言的扩展字符集:ISO-8859-2 ISO-8859-4等……

ISO-8859-1
ISO-8859-7
其他语言
英文 其他西欧字符   ōē
英文 希腊字符
  μγ 英文 其他单字节   字符集


上一篇:发现一个技术升级了的带毒网站(第1版) 人气:662
下一篇:我的第一个j2me程序 人气:735
浏览全部Java的内容 Dreamweaver插件下载 网页广告代码 祝你圣诞节快乐 2009年新年快乐