长话短说,直接说说Java,尤其是Tomcat对于编码解码的一点了解。

Get提交

对于直接 url 请求和表单的 get 提交,都是把数据串联在 url 后面作为参数。而Tomcat对此的态度是:首先获取Connector的解码集进行解码,可配置server.xml:<Connector URIEncoding="utf-8" useBodyEncodingForURI="true"/>。如果没有定义则会采用默认编码 ISO-8859-1 来解析。
乱码原因探究:大部分浏览器在没有指定页面编码的情况下(如),都是使用UTF-8或GBK进行编码,而server.xml大部分同学也都没有进行配置,故默认都是用 ISO-8859-1 来解码。因此 get 请求出现乱码频率很高。
代码解决方式new String(request.getParameter("name").getBytes("iso-8859-1″),"utf-8") 的形式来获取正确数据。

Post提交

对于Tomcat而言:默认使用页面编码方式的 ContentType 中设置的字符集来进行解码,如没有指定,则默认使用 iso-8859-1 进行解码。
代码解决方式request.setCharacterEncoding("utf-8")可以指定解码方式。
更多文章,请关注:开猿笔记