poi解析doc文件内容_JAVA_编程开发_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 编程开发 > JAVA > poi解析doc文件内容

poi解析doc文件内容

 2013/7/21 0:56:47  jilong-liang  程序员俱乐部  我要评论(0)
  • 摘要:packagecom.app.doc;importjava.io.File;importjava.io.FileInputStream;importjava.io.InputStream;importorg.apache.poi.hwpf.extractor.WordExtractor;/***poi-3.9-20121203.jar*poi-examples-3.9-20121203.jar*poi-excelant-3.9-20121203.jar*poi-ooxml-3.9
  • 标签:文件 内容 解析
class="java" name="code">package com.app.doc;

import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;

import org.apache.poi.hwpf.extractor.WordExtractor;

/**
 *poi-3.9-20121203.jar
 *poi-examples-3.9-20121203.jar
 *poi-excelant-3.9-20121203.jar
 *poi-ooxml-3.9-20121203.jar
 *poi-ooxml-schemas-3.9-20121203.jar
 *poi-scratchpad-3.9-20121203.jar
 */
public class DocWord {

	/**
	 * @param args
	 */
	public static void main(String[] args) throws Exception{
		String path="D:/ecmall数据字典.doc";
		String text =readWordDoc(path);
		System.out.println(text);
	}
	/**
	 * 读word文件的内容
	 * @param path
	 * @return
	 * @throws Exception
	 */
	public static String readWordDoc(String path) throws Exception { 
		InputStream input=new FileInputStream(new File(path));
		WordExtractor extractor = null;
        // 创建WordExtractor
        extractor = new WordExtractor(input);
        // 对doc文件进行提取
		return extractor.getText();
	}
}

?

发表评论
用户名: 匿名