java将Word转换成PDF三种方法

2年前 (2022) 程序员胖胖胖虎阿
364 0 0

网上有很多将Word转换成PDF的方式,这里找了三种比较简单的工具:poi、jacob和aspose。

1.POI

依赖

<dependency>
	<groupId>org.apache.poi</groupId>
	<artifactId>poi-ooxml</artifactId>
	<version>3.17</version>
</dependency>
<dependency>
	<groupId>fr.opensagres.xdocreport</groupId>
	<artifactId>fr.opensagres.poi.xwpf.converter.pdf-gae</artifactId>
	<version>2.0.1</version>
</dependency>

工具类

FileInputStream fileInputStream = new FileInputStream("F:\\poi笔记.docx");
XWPFDocument xwpfDocument = new XWPFDocument(fileInputStream);
PdfOptions pdfOptions = PdfOptions.create();
FileOutputStream fileOutputStream = new FileOutputStream("F:\\poi笔记.pdf");
PdfConverter.getInstance().convert(xwpfDocument,fileOutputStream,pdfOptions);
fileInputStream.close();
fileOutputStream.close();

2.jacob

jacob 缺点:需要 window 环境,而且速度是最慢的需要安装 msofficeWord 以及 SaveAsPDFandXPS.exe ( word 的一个插件,用来把 word 转化为 pdf )

开发流程:

SaveAsPDFandXPS 下载地址: http://www.microsoft.com/zh-cn/download/details.aspx?id=7

jacob 包下载地址: http://sourceforge.net/projects/jacob-project/
  1、安装SaveAsPDFandXPS
  2、下载 jacob 解压后存放路径:
    jacob.jar 放在 C:\Program Files\Java\jdk1.8.0_171\jre\lib\ext目录下
    jacob.dll 放在 C:\Program Files\Java\jdk1.8.0_171\jre\bin 目录下

工具类

public class Word2PdfJacobUtil {
 
	/* 转PDF格式值 */
	private static final int wdFormatPDF = 17;
	/**
	 * Word文档转换
	 * 
	 * @param inputFile
	 * @param pdfFile
	 */
	public static boolean word2PDF(String inputFile, String pdfFile) {
		ComThread.InitMTA(true);
	    long start = System.currentTimeMillis();
	    ActiveXComponent app = null;
	    Dispatch doc = null;
	    try {
	        app = new ActiveXComponent("Word.Application");// 创建一个word对象
	        app.setProperty("Visible", new Variant(false)); // 不可见打开word
	        app.setProperty("AutomationSecurity", new Variant(3)); // 禁用宏
	        Dispatch docs = app.getProperty("Documents").toDispatch();// 获取文挡属性
 
	        System.out.println("打开文档 >>> " + inputFile);
	        // Object[]第三个参数是表示“是否只读方式打开”
	        // 调用Documents对象中Open方法打开文档,并返回打开的文档对象Document
	        doc = Dispatch.call(docs, "Open", inputFile, false, true).toDispatch();
	        System.out.println("转换文档 [" + inputFile + "] >>> [" + pdfFile + "]");
            // 调用Document对象的SaveAs方法,将文档保存为pdf格式
            // word保存为pdf格式宏,值为17
            Dispatch.call(doc, "SaveAs", pdfFile, wdFormatPDF);// word保存为pdf格式宏,值为17
 
	        long end = System.currentTimeMillis();
 
	        System.out.println("用时:" + (end - start) + "ms.");
	        return true;
	    } catch (Exception e) {
	        e.printStackTrace();
	        System.out.println("========Error:文档转换失败:" + e.getMessage());
	    } finally {
	        Dispatch.call(doc, "Close", false);
	        System.out.println("关闭文档");
	        if (app != null)
	            app.invoke("Quit", new Variant[] {});
            // 如果没有这句话,winword.exe进程将不会关闭
            ComThread.Release();
            ComThread.quitMainSTA();
        }
	    return false;
	}
	}

测试运行:

public static void main(String[] arg){
		String docPath = "C:\\Users\\Administrator\\Desktop\\test.docx";
		String pdfPath = "C:\\Users\\Administrator\\Desktop\\test.pdf";
        boolean res = Word2PdfJacobUtil.word2PDF(docPath, pdfPath);
        System.out.println(res);
}

结果如下:
java将Word转换成PDF三种方法

3.aspose

当文档中含有中文字符时,该段代码的执行需要调用操作系统的本地字体库支持,否则所有中文字符都将乱码。

该段代码如果想要在Linux服务器上完美运行,需要给Linux服务器安装中文字体库

如何在Linux环境安装Windows字体库,将在本人的另一篇文章里详细讲解
Java使用Spire.Pdf或Aspose-Words实现Word转换Pdf在Linux服务器上的中文乱码问题

建议将jar包下载下来并上传私服里去
依赖

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>15.8.0</version>
</dependency>

使用aspose不需要像jacob那样往jdk里加入ddl文件,但是需要在项目里加入一个license.xml,不然生成的pdf会有水印
license.xml如下:

<?xml version="1.0" encoding="UTF-8" ?> 
<License>
  <Data>
    <Products>
      <Product>Aspose.Total for Java</Product>
      <Product>Aspose.Words for Java</Product>
    </Products>
    <EditionType>Enterprise</EditionType>
    <SubscriptionExpiry>20991231</SubscriptionExpiry>
    <LicenseExpiry>20991231</LicenseExpiry>
    <SerialNumber>8bfe198c-7f0c-4ef8-8ff0-acc3237bf0d7</SerialNumber>
  </Data>
  <Signature>sNLLKGMUdF0r8O1kKilWAGdgfs2BvJb/2Xp8p5iuDVfZXmhppo+d0Ran1P9TKdjV4ABwAgKXxJ3jcQTqE/2IRfqwnPf8itN8aFZlV3TJPYeD3yWE7IT55Gz6EijUpC7aKeoohTb4w2fpox58wWoF3SNp6sK6jDfiAUGEHYJ9pjU=</Signature>
</License>

工具类:

public class Word2PdfAsposeUtil {
 
	
	public static boolean getLicense() {
        boolean result = false;  
        try {  
            InputStream is = Test.class.getClassLoader().getResourceAsStream("\\license.xml"); // license.xml应放在..\WebRoot\WEB-INF\classes路径下
            License aposeLic = new License();  
            aposeLic.setLicense(is);  
            result = true;  
        } catch (Exception e) {
            e.printStackTrace();  
        }  
        return result;  
    }  
  
    public static boolean doc2pdf(String inPath, String outPath) {
        if (!getLicense()) { // 验证License 若不验证则转化出的pdf文档会有水印产生  
            return false;  
        }
        FileOutputStream os = null;
        try {  
            long old = System.currentTimeMillis();
            File file = new File(outPath); // 新建一个空白pdf文档
            os = new FileOutputStream(file);
            Document doc = new Document(inPath); // Address是将要被转化的word文档  
            doc.save(os, SaveFormat.PDF);// 全面支持DOC, DOCX, OOXML, RTF HTML, OpenDocument, PDF,  
                                         // EPUB, XPS, SWF 相互转换  
            long now = System.currentTimeMillis();
            System.out.println("pdf转换成功,共耗时:" + ((now - old) / 1000.0) + "秒"); // 转化用时
        } catch (Exception e) {
            e.printStackTrace();
            return false;
        }finally {
            if (os != null) {
                try {
                    os.flush();
                    os.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
        return true;
    }  
  }

测试运行:

 public static void main(String[] arg){
        String docPath = "C:\\Users\\Administrator\\Desktop\\test.docx";
        String pdfPath = "C:\\Users\\Administrator\\Desktop\\test.pdf";
        Word2PdfAsposeUtil.doc2pdf(docPath,pdfPath);
}

结果:
java将Word转换成PDF三种方法

jacob和aspose相关jar下载

链接:https://pan.baidu.com/s/1D10sJOihQc551tZPv9uWwQ
提取码:zsgg

微信扫一扫即可获取文件(已包含提取码)
java将Word转换成PDF三种方法

版权声明:程序员胖胖胖虎阿 发表于 2022年9月27日 下午11:24。
转载请注明:java将Word转换成PDF三种方法 | 胖虎的工具箱-编程导航

相关文章

暂无评论

暂无评论...