Java中使用模板引擎+WordXML导出复杂Word的步骤
处理Word文档动态生成,一个绕不开的难题就是如何优雅地融合样式与数据。直接操作Word对象模型(如Apache POI)功能强大,但代码冗长,样式控制也颇为繁琐。今天,我们来探讨一种更为“曲线救国”但极其灵活的方案:利用Word文档的XML本质,结合模板引擎来实现动态填充。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
实现原理
这个方案的核心思路非常巧妙:它利用了Word文档(无论是.doc还是.docx)本质上是一种结构化XML文档的特性。我们不必在代码里费力地调整段落格式、设置字体,而是把这件事交给最擅长的工具——Microsoft Word本身。
- 设计静态模板:首先,在Microsoft Word里精心设计好文档的所有样式、版式和固定内容,保存为Word 2003 XML文档格式(.xml),或者直接使用一个.docx文件(它其实是一个ZIP压缩包,核心内容在
word/document.xml里)。 - 植入动态标记:然后,在这个XML文件里,找到需要插入动态数据的位置,嵌入模板引擎的占位符,比如
${name}、<#list>之类的语法。这里需要小心操作,确保这些标记不会破坏XML本身的结构。 - 引擎渲染数据:在Ja va程序中,读取这个“改装”过的XML文件,把它当作一个FreeMarker或Velocity模板来对待。准备好你的数据模型,让模板引擎完成渲染,动态数据就被填充到占位符的位置了。
- 重新打包输出:最后,将渲染得到的新XML内容,替换回原始的.docx压缩包内的对应文件,或者直接保存为最终的文档格式。一个样式完美、数据新鲜的Word文档就诞生了。
示例步骤(以 FreeMarker + docx 为例)
光说不练假把式,我们来看一个结合FreeMarker和.docx格式的具体操作流程:
- 准备模板:创建一个标准的
.docx文件作为模板,用任何ZIP工具(或直接修改文件后缀为.zip)解压它,找到位于word/目录下的document.xml文件,这就是文档的主体内容。 - 编辑XML:用文本编辑器打开
document.xml,在需要动态填入姓名、日期、列表数据的地方,插入FreeMarker语法。处理时要特别注意转义问题,必要时可以使用CDATA区块来包裹模板语法,以免与XML标签冲突。 - Ja va端渲染:在Ja va代码中,将上一步修改好的
document.xml作为FreeMarker模板文件加载。构建你的数据模型(通常是一个Map),调用模板引擎进行渲染,得到一段填充好数据的XML字符串。 - 替换与打包:将这段新生成的XML字符串,写回之前解压的
document.xml文件中,然后将整个文件夹重新打包成.zip格式,再把文件后缀改回.docx。当然,这个过程可以通过程序自动化完成。
// BeanUtil使用的是Hutool中的工具类 MapdataMap = BeanUtil.beanToMap(report); try { // 1. 创建 FreeMarker 配置 Configuration cfg = new Configuration(Configuration.VERSION_2_3_31); // 模板所在目录 cfg.setDirectoryForTemplateLoading(new File(templateDir)); cfg.setDefaultEncoding("UTF-8"); cfg.setTemplateExceptionHandler(TemplateExceptionHandler.RETHROW_HANDLER); cfg.setLogTemplateExceptions(false); cfg.setWrapUncheckedExceptions(true); cfg.setFallbackOnNullLoopVariable(false); // 2. 加载模板(已按上述要求修改的 XML 文件) Template template = cfg.getTemplate(templatePath); // 4. 渲染模板 try (Writer out = new BufferedWriter(new OutputStreamWriter( new FileOutputStream(templateOutputPath), StandardCharsets.UTF_8))) { template.process(dataMap, out); response.setContentType("application/vnd.openxmlformats-officedocument.wordprocessingml.document"); String fileName = report.getUnitName() + "年度自评报告.docx"; String encodedFileName = URLEncoder.encode(fileName, StandardCharsets.UTF_8.toString()).replace("+", "%20"); response.setHeader("Content-Disposition", "attachment; filename*=UTF-8''" + encodedFileName); // yaml配置示例 //yearSelfEvaluation: // # 模板目录 // templateDir: G:\\templates // # 模板路径 // templatePath: template\\word\\document.xml // # 输出路径 // templateOutputPath: G:\\templates\\output2.xml // # 模板docx路径 // templateDocxPath: G:\\templates\\template.docx // 调用工具类,将渲染后的XML打包成docx并通过response输出 XmlToDocx.convert(templateDocxPath, templateOutputPath, response); } } catch (Exception e) { log.error("渲染模板失败", e); } // 以下是关键的 XmlToDocx 工具类实现 import ja vax.servlet.http.HttpServletResponse; import ja va.io.*; import ja va.nio.charset.StandardCharsets; import ja va.nio.file.Files; import ja va.nio.file.Path; import ja va.nio.file.Paths; import ja va.util.zip.ZipEntry; import ja va.util.zip.ZipInputStream; import ja va.util.zip.ZipOutputStream; public class XmlToDocx { /** * 将渲染后的 Word 2003 XML 文件内容替换到 docx 模板中,并将生成的 docx 写入 HttpServletResponse 输出流 * @param docxTemplate 原始的 docx 模板路径(由 XML 另存得来) * @param renderedXmlPath 渲染后的 XML 文件路径 * @param response HttpServletResponse 对象,用于输出 docx */ public static void convert(String docxTemplate, String renderedXmlPath, HttpServletResponse response) throws IOException { // 读取渲染后的 XML 文件内容(Ja va 8 兼容) Path xmlPath = Paths.get(renderedXmlPath); byte[] xmlBytes = Files.readAllBytes(xmlPath); String renderedXml = new String(xmlBytes, StandardCharsets.UTF_8); // 创建临时目录存放解压后的文件 Path tempDir = Files.createTempDirectory("docx"); try (ZipInputStream zis = new ZipInputStream(new FileInputStream(docxTemplate))) { ZipEntry entry; while ((entry = zis.getNextEntry()) != null) { File outFile = new File(tempDir.toFile(), entry.getName()); if (entry.isDirectory()) { outFile.mkdirs(); } else { outFile.getParentFile().mkdirs(); try (FileOutputStream fos = new FileOutputStream(outFile)) { byte[] buffer = new byte[8192]; int len; while ((len = zis.read(buffer)) != -1) { fos.write(buffer, 0, len); } } } zis.closeEntry(); } } // 替换 document.xml Path docXmlPath = tempDir.resolve("word/document.xml"); Files.write(docXmlPath, renderedXml.getBytes(StandardCharsets.UTF_8)); // 重新打包为 docx 并直接写入 response 输出流 try (ZipOutputStream zos = new ZipOutputStream(response.getOutputStream())) { Files.walk(tempDir).forEach(path -> { if (Files.isRegularFile(path)) { String entryName = tempDir.relativize(path).toString().replace('\\', '/'); try { zos.putNextEntry(new ZipEntry(entryName)); Files.copy(path, zos); zos.closeEntry(); } catch (IOException e) { throw new UncheckedIOException(e); } } }); zos.finish(); // 确保 ZIP 文件正确结束 } finally { // 清理临时目录 Files.walk(tempDir) .map(Path::toFile) .forEach(File::delete); } } /** * 将渲染后的 Word 2003 XML 文件内容替换到 docx 模板中,生成最终的 docx 文件 * @param docxTemplate 原始的 docx 模板路径(由 XML 另存得来) * @param renderedXmlPath 渲染后的 XML 文件路径 * @param outputDocx 输出 docx 文件路径 */ public static void convert(String docxTemplate, String renderedXmlPath, String outputDocx) throws IOException { // 读取渲染后的 XML 文件内容(Ja va 8 兼容) Path xmlPath = Paths.get(renderedXmlPath); byte[] xmlBytes = Files.readAllBytes(xmlPath); String renderedXml = new String(xmlBytes, StandardCharsets.UTF_8); // 创建临时目录存放解压后的文件 Path tempDir = Files.createTempDirectory("docx"); try (ZipInputStream zis = new ZipInputStream(new FileInputStream(docxTemplate))) { ZipEntry entry; while ((entry = zis.getNextEntry()) != null) { File outFile = new File(tempDir.toFile(), entry.getName()); if (entry.isDirectory()) { outFile.mkdirs(); } else { outFile.getParentFile().mkdirs(); try (FileOutputStream fos = new FileOutputStream(outFile)) { byte[] buffer = new byte[8192]; int len; while ((len = zis.read(buffer)) != -1) { fos.write(buffer, 0, len); } } } zis.closeEntry(); } } // 替换 document.xml Path docXmlPath = tempDir.resolve("word/document.xml"); Files.write(docXmlPath, renderedXml.getBytes(StandardCharsets.UTF_8)); // 重新打包为 docx try (ZipOutputStream zos = new ZipOutputStream(new FileOutputStream(outputDocx))) { Files.walk(tempDir).forEach(path -> { if (Files.isRegularFile(path)) { String entryName = tempDir.relativize(path).toString().replace('\\', '/'); try { zos.putNextEntry(new ZipEntry(entryName)); Files.copy(path, zos); zos.closeEntry(); } catch (IOException e) { throw new UncheckedIOException(e); } } }); } finally { // 清理临时目录 Files.walk(tempDir) .map(Path::toFile) .forEach(File::delete); } } public static void main(String[] args) throws IOException { convert("G:\\templates\\template.docx", "G:\\templates\\output2.xml", "F:\\test2.docx"); System.out.println("docx 文件已生成, haha "); } }
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Python怎么处理类名冲突_使用模块化命名空间管理同名类
Python中同名类冲突的根源与解决方案:模块化命名空间管理详解 Python同名类冲突的底层原理 要彻底理解Python中同名类冲突问题,必须把握其核心机制:类名本质上是绑定在当前命名空间内的变量标识符。当你在不同模块中定义了相同名称的类(例如多个模块都包含名为User的类),若采用from mo
Python怎样在不同数据尺度的特征间做归一化_基于Scikit-learn的MinMaxScaler转化
Python如何对不同量纲特征进行归一化处理:基于Scikit-learn的MinMaxScaler详解 使用MinMaxScaler进行特征归一化时,必须仅用训练集数据拟合参数,测试集应使用相同的参数进行同构变换。若误对测试集执行fit操作,将导致特征维度错误或状态混乱。同时需确保列顺序与数据类型
如何在 Pandas DataFrame 中动态传入多列名进行索引
如何在 Pandas DataFrame 中动态传入多列名进行索引 在 Pandas 中,若需将多个列名以变量形式动态传入 DataFrame 的双括号索引(如 df[[ ]]),必须将列名存储为字符串列表,并通过列表拼接(而非字符串拼接)构建完整列名列表。 在数据分析工作中,我们经常需要从Da
Python怎么实现运算符重载_通过魔术方法定制类的加减乘除行为
Python运算符重载实战指南:通过魔术方法自定义类的加减乘除运算 为什么 __add__ 方法调用失败?核心在于返回值类型 许多开发者在精心编写 __add__ 方法后,执行 a + b 操作时却遇到 TypeError: unsupported operand type(s) 错误。这通常不是方
Python3.12怎么快速遍历深层目录下的所有文件_使用os.walk与glob递归检索
Python3 12怎么快速遍历深层目录下的所有文件_使用os walk与glob递归检索 在文件系统操作中,os walk 通常比 glob(“** ”) 更稳健。原因在于,os walk 是原生为目录遍历设计的,天生支持错误捕获,能自动跳过不可读的目录。反观 glob,要实现递归必须显式设置 r
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

