商城首页欢迎来到中国正版软件门户

您的位置:首页 >Java简单实现两个Word文档的差异比对

Java简单实现两个Word文档的差异比对

  发布于2026-05-20 阅读(0)

扫一扫,手机访问

在文档管理和版本控制的日常工作中,对比两个Word文档的差异,是个绕不开的活儿。无论是审阅合同条款的修改、核对报告版本的迭代,还是检查模板内容的更新,都需要一个可靠的方法来精准定位“哪里变了”。今天,我们就来聊聊如何用Ja va,借助Spire.Doc for Ja va这个库,高效地实现这个功能。

Ja va简单实现两个Word文档的差异比对

一、环境准备

动手写代码之前,得先把“家伙事儿”备齐。核心就是要在你的Ja va项目里引入Spire.Doc for Ja va库。这个库提供了一套完整的API,用来操作Word文档的结构,其中自然包含了我们需要的文档比较功能。

如果你的项目用的是Ma ven管理依赖,那直接在pom.xml文件里加上下面这段配置就行:


    
        com.e-iceblue
        e-iceblue
        https://repo.e-iceblue.com/nexus/content/groups/public/
    


    
        e-iceblue
        spire.doc
        14.4.9
    

对于不用Ma ven的项目,手动下载对应的JAR包,然后添加到项目的classpath里也是一样的。

二、文档比较的基本原理

知其然,也要知其所以然。文档比较的核心逻辑其实不难理解:把两个文档都加载到内存里,然后逐段、逐行、逐字地进行比对分析。最终生成的比较结果,通常会以Word的“修订模式”来呈现。也就是说,原始文档的内容保持不变,而新文档相对于旧文档的所有增、删、改操作,都会被清晰地标记出来。

这么做的最大好处是什么?就是生成的对比文档可以直接用Microsoft Word打开,审阅者可以利用Word内置的“接受”或“拒绝修订”功能,来逐条处理每一处差异,流程非常顺畅。

三、基础比较示例

话不多说,直接看代码。Spire.Doc的Document类提供了一个非常直接的compare方法。下面这个例子展示了如何比较两个文档,并把结果存成一个新文件。

import com.spire.doc.Document;

public class CompareDocumentsExample {
    public static void main(String[] args) {
        // 加载需要比较的两个文档
        Document doc1 = new Document();
        doc1.loadFromFile("Document_V1.docx");
        
        Document doc2 = new Document();
        doc2.loadFromFile("Document_V2.docx");

        // 执行文档比较
        // 参数说明:第二个文档,比较者的姓名,比较日期
        doc1.compare(doc2, "Reviewer", new ja va.util.Date());

        // 保存比较结果
        doc1.sa veToFile("ComparisonResult.docx", com.spire.doc.FileFormat.Docx_2013);
        
        System.out.println("文档比较完成,结果已保存");
        
        doc1.dispose();
        doc2.dispose();
    }
}

这段代码里,doc1被视作原始文档,doc2则是修改后的版本。比较的结果会直接反映在doc1对象上,所有差异都会以修订标记的形式插入。最后保存的ComparisonResult.docx,用Word打开就能看到,哪些内容被“删除”了(通常带删除线),哪些是“新增”的(通常带下划线),一目了然。

四、比较结果的呈现方式

执行比较后,生成的文档里,修订标记的显示有以下几个特点:

  • 被删除的内容:通常会显示为带红色删除线的文本。
  • 新增的内容:通常会显示为带红色下划线的文本。
  • 未变动的内容:则保持原样不变。

如果你觉得默认的红色标记太扎眼,或者想调整显示样式,完全可以在Word软件里搞定。在“审阅”选项卡下找到“修订”选项,里面的设置足够你调出喜欢的样式了。这部分属于Word客户端的功能,API本身并不控制具体的显示颜色和样式。

五、高级比较选项

基础功能能满足大部分需求,但有些场景需要更精细的控制。比如,你只想对比文字内容,不想关心字体、颜色这些格式变化。好在,compare方法提供了一个布尔参数,专门用来控制是否忽略格式差异。

import com.spire.doc.Document;

public class AdvancedCompareExample {
    public static void main(String[] args) {
        Document doc1 = new Document();
        doc1.loadFromFile("Document_V1.docx");
        
        Document doc2 = new Document();
        doc2.loadFromFile("Document_V2.docx");

        // 执行文档比较,传入 false 表示不忽略格式差异
        // 即格式差异也会被标记为修订
        doc1.compare(doc2, "Reviewer", new ja va.util.Date(), false);

        doc1.sa veToFile("ComparisonWithFormat.docx", com.spire.doc.FileFormat.Docx_2013);
        
        System.out.println("带格式比较的文档已保存");
        
        doc1.dispose();
        doc2.dispose();
    }
}

上面代码中,最后一个参数传了false,这意味着连格式变动都会被揪出来标记上。如果你只想关注纯文本的增删改,把这个参数改成true就行,这样字体、字号、颜色之类的变化就不会产生修订记录了。

六、实际应用示例

把功能封装成一个更通用的工具方法,用起来会更顺手。下面这个示例就展示了如何将比较逻辑嵌入到一个实际的工作流程中,接收文件路径,输出比较结果。

import com.spire.doc.Document;
import ja va.text.SimpleDateFormat;
import ja va.util.Date;

public class DocumentComparator {
    
    /**
     * 比较两个 Word 文档
     * @param originalPath 原始文档路径
     * @param revisedPath 修改后的文档路径
     * @param outputPath 比较结果输出路径
     * @param reviewerName 比较者姓名
     * @return 比较是否成功
     */
    public static boolean compareDocuments(String originalPath, 
                                           String revisedPath, 
                                           String outputPath, 
                                           String reviewerName) {
        try {
            Document original = new Document();
            original.loadFromFile(originalPath);
            
            Document revised = new Document();
            revised.loadFromFile(revisedPath);
            
            original.compare(revised, reviewerName, new Date());
            
            original.sa veToFile(outputPath, com.spire.doc.FileFormat.Docx_2013);
            
            original.dispose();
            revised.dispose();
            
            return true;
        } catch (Exception e) {
            System.err.println("文档比较失败: " + e.getMessage());
            return false;
        }
    }
    
    public static void main(String[] args) {
        String original = "./docs/Contract_v1.docx";
        String revised = "./docs/Contract_v2.docx";
        String output = "./docs/Contract_Comparison.docx";
        
        boolean success = compareDocuments(original, revised, output, "System");
        
        if (success) {
            System.out.println("比较完成,结果已保存至: " + output);
        } else {
            System.out.println("比较失败,请检查文档路径是否正确");
        }
    }
}

七、注意事项

用起来方便,但有些细节和限制也得心里有数:

  • 文档格式支持:这个比较功能主要针对的是.docx格式。如果手头是老旧的.doc文件,建议先转换成.docx再进行比较,结果会更可靠。
  • 表格与图像:对于纯文本的比对很拿手,但涉及到复杂的表格内容修改或者嵌入的图像变化,其比对精度可能不如文本那么完美,复杂文档建议做好测试验证。
  • 性能考量:处理几十页的文档轻轻松松,但如果遇到动辄数百页的超长文档,比较操作可能会消耗较多的内存和时间。在服务器端应用时,记得给JVM分配足够的堆内存。
  • 修订模式依赖:比较结果的“可视化”严重依赖Word的修订模式。如果你用其他不支持修订模式的阅读器打开结果文档,那些删除线和下划线标记可能就看不到了。

总结

总的来说,用Ja va实现Word文档比对,步骤非常清晰:加载两个文档,调用一个compare方法,然后保存结果。输出的对比文档直接继承了Word修订模式的所有优点,审阅者可以在熟悉的Word环境里高效工作。无论是合同版本管理、文案修改审核,还是定期模板差异检查,这个方案都能派上用场。

相较于人工逐字逐句地“找不同”,程序化比对不仅能将人从繁琐重复的劳动中解放出来,更能从根本上避免人为的疏忽和遗漏。对于需要处理大量文档版本或建立自动化审核流程的场景,这套方法无疑能带来显著的效率提升。

本文转载于:https://www.jb51.net/program/3641594ya.htm 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注