java word转HTML

前一段时间为这个问题头疼的不得了,后来查阅了资料终于解决了;现将程序放出,以便以后参考。


//------------------------------------------------------------------------------
//文件名称: wordtohtml           文件版本: 1.00.00
//作    者: 郭铸     作者邮箱:
[email protected] 完成日期: 2004-10-20
//文件描述:
//其它描述:
//类 列 表:
//  wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
//修改历史:
//  #   版本     修改日期    作者                 修改内容
//  ----------------------------------------------------------------------------
//  1   1.00.01  2004-10-14  作者姓名             修改内容描述
//  ----------------------------------------------------------------------------
//------------------------------------------------------------------------------

import com.jacob.com.*;
import com.jacob.activeX.*;
import java.io.*;

//取得指定目录下面所有的doc文件名称
public class wordtohtml
{
//------------------------------------------------------------------------------
//方法原型: change(String paths)
//功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
//输入参数: String
//输出参数: 无
//返 回 值: 无
//其它说明: 递归
//------------------------------------------------------------------------------ 
 public static void change(String paths, String savepaths)
 { 
   
  File d = new File(paths);
  //取得当前文件夹下所有文件和目录的列表
  File lists[] = d.listFiles();
  String pathss = new String("");

  //对当前目录下面所有文件进行检索
  for(int i = 0; i < lists.length; i ++)
  {
   if(lists[i].isFile())
   {
    String filename = lists[i].getName();
    String filetype = new String("");
    //取得文件类型
    filetype = filename.substring((filename.length() - 3), filename.length());
    
    //判断是否为doc文件
    if(filetype.equals("doc"))
    {
     System.out.println("当前正在转换......");
     //打印当前目录路径
     System.out.println(paths);
     //打印doc文件名
     System.out.println(filename.substring(0, (filename.length() - 4)));
     
     ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word
     
     String docpath = paths + filename;
     String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));
     
     String inFile = docpath;
    //要转换的word文件
     String tpFile = htmlpath;
    //HTML文件

     boolean flag = false;
     
     try
     {
      app.setProperty("Visible", new Variant(false));
        //设置word不可见
      Object docs = app.getProperty("Documents").toDispatch();
      Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
        //打开word文件
      Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
        //作为html格式保存到临时文件
      Variant f = new Variant(false);
      Dispatch.call(doc, "Close", f);
      flag = true;
     }
     catch (Exception e)
     {
      e.printStackTrace();
     }
     finally
     {
      app.invoke("Quit", new Variant[] {});
     }
     System.out.println("转化完毕!");
    }
   }
   else
   {
    pathss = paths;
    //进入下一级目录
    pathss = pathss + lists[i].getName() + "//";    
    //递归遍历所有目录
    change(pathss, savepaths);
   }
  }
  
 } 
//------------------------------------------------------------------------------
//方法原型: main(String[] args)
//功能描述: main文件
//输入参数: 无
//输出参数: 无
//返 回 值: 无
//其它说明: 无
//------------------------------------------------------------------------------
  
 public static void main(String[] args)
 {
  
  String paths = new String("D://Work//2004.10.8//test system//test01//word//");
  String savepaths = new String ("D://Work//2004.10.8//test system//test01//html//");

  change(paths, savepaths);

 }
}

其中import的jar包是一个开源的东东,网上搜索即得。
Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
修改
Variant(8)},里面得参数即可将Word转化为各种类型。

发表于 @ 2004年12月07日 16:52:00|评论(5 )|编辑

新一篇: 将指定目录下面得所有文件名从大写转化为小写 | 旧一篇: 做Blog...HTML...

Java 多线程与并发编程技术请进!
Java 编程语言,挑战性的选择
内部揭密:深入了解Scala 控制结构
面向 Java 开发人员的 Scala 指南

评论

# 狼骑兵 发表于2005-04-23 16:29:00  IP:
TrackBack来自 《jacob配置方法及两个常见错误解决》

Ping Back来自:blog.csdn.net
# 改名转存就叫转,you are funny,不能在线编辑,发布都嫌太肿大,不过市面上全这样理解,我有 发表于2005-04-21 03:47:00  IP: 218.93.138.*
不过那些言必谈平台无关的“假发”们对你的批评也不对,除了使用MS的com,这个世界上好象暂时还有出现第二种转二进制doc的方法,不过,ifilter是个例外,我想MS有时真的是很矛盾的,产品线一多,有那么多无法两全的保密策略。所以只好保密、保密、再保密。

提示一下,frontpage has a secret!想出来算你聪明,想不出来写信给我,可以再提示你。
[email protected]
# 小兽 发表于2005-04-23 16:37:00  IP: 61.133.74.*
我有 看起来是高手
我对jacob也就是当时工作是需要用到了才研究了一下
肯定还有好多不了解的地方
如果有哪些不对的看法就请在这里告诉我
使用ms的com的方法还有一些,个人感觉jacob还算是比较好的一种
frontpage我倒是还没有试过,改天不加班的时候试一下,呵呵~
如果你有什么高招不妨指点一二?
# dyfangdy 发表于2007-06-04 10:52:23  IP: 59.37.133.*
如果是jdk1.5是不是不能用插件jacob???
# zhucheng8 发表于2007-12-04 09:52:34  IP: 218.3.243.*
我把jacob.dll放在C:/WINDOWS/system32/文件中,jacob.jar放在了%JAVA_HOME%/lib/jacob.jar中,环境变量中在CLASSPATH中加上了%JAVA_HOME%/lib/jacob.jar,Path中加上了C:/WINDOWS/system32/jacob.dll;

import com.jacob.com.*;
import com.jacob.activeX.*;
在eclipse中上面这两句都有这样的错误The import com.jacob cannot be resolved,在概的意思好像就是找不到这个包,请您指点一下这是什么原因!

你可能感兴趣的:(java word转HTML)