jsp/SERVLET上载的难点 1、支持任意格式、任意数量的文件上载;2、上载控制的实现;3、表单信息的取得;4、“即插即用”的应用方法;我个人认为,制约通用 上载组件的实现主要是这四个难点。 JSP/SERVLET上传的原理 JSP/SERVLET文件 上载是通过ServletInputStream类来实现的,ServletInputStream类是Java.io.InputStream的一个扩展抽象类,实质上也是一个输入流,通过ReadLine方法从Request端一行一行读取,可见,JSP/SERVLET上载根本上是用流来实现的,理解了这个就不难理解整个 上载的原理。ServletInputStream实现文件 上载必须采用HTTP POST或者HTTP PUT协议,HTTP GET协议只能传递很少的数据,是不能实现文件上载的。 下面我们来看一下上传的数据流的结构,首先要在BROWSER端给出一个请求,我们的请求如下(文件名为test1.jsp): <%@ page contentType="text/Html; charset=GBK" %> <html> <head> <title>文件上载</title> </head> <body> <form action="test2.jsp" enctype="MULTIPART/FORM-DATA" method=post> 说明一: <input type="text" name="eXPlain1" /> <br /> 说明二: <input type="text" name="explain2" /> <br /> 请选择上载文件1 <input type="file" name="file1" /> <br /> 请选择上载文件2 <input type="file" name="file2" /> <br /> 说明三: <input type="text" name="explain3" /> <br /> <input type="submit" value=" 上 载 " /> </form> </body> </html> 显示如下: 说明一: 说明二: 请选择上载文件一: 请选择上载文件二: 说明三: 在上载请求页中混杂了表单的三个输入框,及两个上载文件,当然输入框可以更多、更杂,可以有选择框、单选及多选按钮,待上传的文件也可以有三个、四个或所需要的更多。 action="test2.jsp"表示表单将提交到"test2.jsp",另外注重表单属性中必须要有这句:enctype="MULTIPART/FORM-DATA",enctype指定 Form 输入资料的编码方式,“method”属性必须为“post”,这样表单才能提交大量数据,也表示本表单的数据传递将用流操作,“method=get”表示数据将通过地址栏进行传递,虽然方便快捷,但只适合很少的数据量。 响应端“test2.jsp”页面如下: <%@ page contentType="text/html; charset=GBK" %> <html> <head> <title>文件上载</title> </head> <body> <jsp:useBean id="upBean" scope="page" class="com.upload.UpBean"/> <% upBean.doUpload(request); out.println("上载已完成,请查看输出文件"); %> </body> </html> test2.jsp收到请求后,调用一个java bean执行doUpload(request)操作,本操作将完成流(unicode格式)的接收并不做任何处理地将流顺序写入一个文本文件里,读写操作中用了一个缓冲区byte[] readByte,用了一个ServletInputStream 的一个方法readLine(byte[] b, int off,int len)方法读取流,请大家注重,ServletInputStream 流的read Line方法是一次读入指定大小的行,java bean (UpBean.java)代码如下: [code]package com.upload; import java.io.*; import javax.servlet.*; import javax.servlet.http.HttpServletRequest; import javax.servlet.ServletInputStream; public class UpBean { public void doUpload(HttpServletRequest req) throws ServletException, IOExcept ion{ //首先定义一个文本文件 File file = new File("out.txt"); //readCount 记录从输入流中实际读取的字符数 int readCount; //输入流缓冲区 byte[] readByte = new byte[1024]; //初始化输入流 ServletInputStream servletInputStream = req.getInputStream(); //初始化一个输出流(到文件) FileOutputStream fileOutputStream = new FileOutputStream(file); //循环从读取输入流中读取字节 readCount = servletInputStream.readLine(readByte, 0,readByte.length); while(readCount != -1){ fileOutputStream.write(readByte,0,readCount); readCount = servletInputStream.readLine(readByte, 0, 1024); } //关闭文件流 fileOutputStream.flush(); } }[/code] 为了便于我们阅读流,上载的两个文件为两个简单的文本文件(有格式的文件,不便于直接分析):one.txt及two.txt,文件内容如下,实验时请建立对应文本文件,内容请直接copy以下所示: one.txt: one one one one one one two.txt two two two two two two 都预备好以后,我们就可以运行了,运行时请注重,文本部分及文件部分最好不要出现汉字,或其他双字符集字符,尽量采用英文,因为接收是采用的Unicode字符集,我们未对输入做任何处理。 我们在三个输入框输入的字符为,说明一:explain1;说明二:explain2;说明三:explain3,out.txt接收到如下字符: -----------------------------7d2623a3e0286 Content-Disposition: form-data; name="explain1" explain1 -----------------------------7d2623a3e0286 Content-Disposition: form-data; name="explain2" explain2 -----------------------------7d2623a3e0286 Content-Disposition: form-data; name="file1"; filename="C:\test\one.txt" Content-Type: text/plain one one one one one one -----------------------------7d2623a3e0286 Content-Disposition: form-data; name="file2"; filename="C:\test\two.txt" Content-Type: text/plain two two two two two two -----------------------------7d2623a3e0286 Content-Disposition: form-data; name="explain3" explain3 -----------------------------7d2623a3e0286-- 可以很明显的看到,out.txt被“-----------------------------7d2623a3e0286”分成了五 节,即表单的每个输入部分都对应一节,结尾部分是“-----------------------------7d2623a3e0286--”,刚好比开始的一段字符在最后多出两个“-”, 每节的第一行是输入内容的说明“Content-Disposition: form-data”,“name="explain1"”表示 上载请求项的name,文本输入部分仅这两个说明,假如输入的是文件还用两项说明:“filename="C:\test\one.txt"”,表示输入源,基于ms-windows的ie上载带有完整的路径,netscape及其他浏览器可能只有一个文件名;还有一项是关于输入格式的“Content-Type:text/plain”;表示输入格式是文本类型,假如我们上载的是bmp文件则为“Content-Type: image/bmp”,Word文件为“application/msword”...,说明的下面紧接着是一个空行,然后下面才是我们所需的内容。 仔细分析未加修改的输入流格式,有助于我们实现文件与输入文本的准确分离。 通过以上的分析可以看出,准确分离上载的文件及文本信息需要以下要素:1、数据段分割符、结束符(比分割符多出两个“-”);2、输入文本及上载的文件区分标志(文本为“name=”,文件为“filename=”);3、编码格式,可以通过HttpServletRequest 类getCharacterEncoding() 方法取得。4、表单文本部分名称及内容,名称为“name=”后面的字符,内容为该段第三行及以后的内容;5、文件名称及内容,名称为“filename=”后面的字符,内容为该段第三行及以后的内容。 下面我们将讨论输入流的分离。 程序实现分析 我们首先画出程序实现的主体结构图,请注重判定文件标志(indexOf("filename=")>0),与判定文本标志(indexOf("name=")>0)的顺序,当(indexOf("filename=")>0)成立时,(indexOf("name=")>0)一定也是成立的,所以判定文件要在判定文本前。 分离文件及输入文本,为完整保存上载的文件信息及输入的文本信息,本程序建立了两个类:public class FileInfo 、public class InputField,及两个线性表private ArrayList upFilesList、private ArrayList inputFieldList,用于动态增加文件信息及文本信息,定义如下: FileInfo.java(记录上载文件信息) package com.upload; public class FileInfo { private String fileName; private boolean validFlag; private String filePath; private long fileSize; //设置文件信息 //上载文件是否有效标志 public void setValidFlag(boolean validFlag){ this.validFlag = validFlag; } //文件名 public void setFileName(String filename){ this.fileName = filename; } //存贮路径
|