【pdf表格解析神器】

pdf表格解析神器

    • 依赖
    • 代码
    • 说明

依赖

	
	
        org.apache.pdfbox
        pdfbox
        2.0.24
    
	
        technology.tabula
        tabula
        1.0.3
    
    
    
        com.fasterxml.jackson.core
        jackson-databind
        2.9.5
    

代码

//-f导出格式,默认CSV (一定要大写)
//-p 指导出哪页,al1是所有
//path D:\\1xx.pdf
//-1 强制使用点阵模式提取PDF (关键在于这儿)
private static void parse() throws ParseException, IOException {
    long start = System.currentTimeMillis();
    St

你可能感兴趣的:(pdf,java,json)