聊聊Spring AI Alibaba的PdfTablesParser

序

本文主要研究一下Spring AI Alibaba的PdfTablesParser
PdfTablesParser

community/document-parsers/spring-ai-alibaba-starter-document-parser-pdf-tables/src/main/java/com/alibaba/cloud/ai/parser/pdf/tables/PdfTablesParser.java
public class PdfTablesParser implements DocumentParser {

    /**
     * The page number of the PDF file to be parsed. Default value is 1.
     */
    private final Integer page;

    /**
     * The metadata of the PDF file to be parsed.
     */
    private final Map metadata;

    public PdfTablesParser() {

        this(1);
    }

    public PdfTablesParser(Integer pageNumber) {

        this(pageNumber, Map.of());
    }

    public PdfTablesParser(Integer pageNumber, Map metadata) {

        this.page = pageNumber;
        this.metadata = metadata;
    }

    @Override
    public List parse(InputStream inputStream) {

        try {
            return data2Document(parseTables(extraTableData(inputStream)));
        }
        catch (Exception e) {
            throw new RuntimeException(e);
        }
    }

    protected List extraTableData(InputStream in) throws Exception {

        PDDocument document = PDDocument.load(in);

        // check pdf files
        int numberOfPages = document.getNumberOfPages();
        if (numberOfPages < 0) {

            throw new RuntimeException("No page found in the PDF file.");
        }

        if (page > numberOfPages) {

            throw new RuntimeException("The page number is greater than the number of pages in the PDF file.");
        }

        SpreadsheetExtractionAlgorithm sea = new SpreadsheetExtractionAlgorithm();

        // extract page by page numbers.
        Page extract = new ObjectExtractor(document).extract(this.page);

        return sea.extract(extract);
    }

    protected List parseTables(List data) {

        if (data.isEmpty()) {
            return Collections.emptyList();
        }

        return data.stream()
            .flatMap(table -> table.getRows()
                .stream()
                .map(cells -> cells.stream()
                    .map(content -> content.getText().replace("\r", "").replace("\n", " "))
                    .reduce((first, second) -> first + "|" + second)
                    .orElse("") + "|"))
            .collect(Collectors.toList());
    }

    private List data2Document(List data) {

        List documents = new ArrayList<>();

        if (data.isEmpty()) {
            return null;
        }

        for (String datum : data) {
            Document doc = new Document(datum);
            documents.add(addMetadata(doc));
        }

        return documents;
    }

    private Document addMetadata(Document document) {

        if (metadata.isEmpty()) {
            return document;
        }

        for (Map.Entry entry : metadata.entrySet()) {
            document.getMetadata().put(entry.getKey(), entry.getValue());
        }

        return document;
    }

} 
 
   PdfTablesParser使用tabula来解析pdf，它先执行extraTableData、再执行parseTables，最后执行data2Document；extraTableData方法使用SpreadsheetExtractionAlgorithm去解析为List
，parseTables则将List
解析为List，data2Document方法则将List解析为List示例
class PdfTablesParserTests {

    private Resource resource;

    private Resource resource2;

    @BeforeEach
    void setUp() {

        resource = new DefaultResourceLoader().getResource("classpath:/pdf-tables.pdf");
        resource2 = new DefaultResourceLoader().getResource("classpath:/sample1.pdf");

        if (!resource.exists()) {
            throw new RuntimeException("Resource not found: " + resource);
        }
    }

    /**
     * tabula-java use.
     */
    @Test
    void PdfTableTest() throws IOException {

        InputStream in = new FileInputStream(resource.getFile());
        try (PDDocument document = PDDocument.load(in)) {
            SpreadsheetExtractionAlgorithm sea = new SpreadsheetExtractionAlgorithm();
            PageIterator pi = new ObjectExtractor(document).extract();
            while (pi.hasNext()) {
                // iterate over the pages of the document
                Page page = pi.next();
                List
 
  
  
 
 table = sea.extract(page);
                // iterate over the tables of the page
                for (Table tables : table) {
                    List> rows = tables.getRows();
                    // iterate over the rows of the table
                    for (List cells : rows) {
                        // print all column-cells of the row plus linefeed
                        for (RectangularTextContainer content : cells) {
                            // Note: Cell.getText() uses \r to concat text chunk
                            String text = content.getText().replace("\r", " ");
                            System.out.print(text + "|");
                        }
                        System.out.println();
                    }
                }
            }
        }

    }

    @Test
    void PdfTablesParseTest() throws IOException {

        String res = """
                |name|age|sex|
                |zhangsan|20|m|
                |lisi|21|w|
                |wangwu|22|m|
                |zhangliu|23|w|
                |songqi|24|w|
                """;

        InputStream in = new FileInputStream(resource.getFile());
        PdfTablesParser pdfTablesParser = new PdfTablesParser();
        List docs = pdfTablesParser.parse(in);

        StringBuilder sb = new StringBuilder();
        docs.subList(1, docs.size()).forEach(doc -> sb.append(doc.getText() + "\n"));

        Assert.equals(res, sb.toString());
    }

    @Test
    void PdfTablesParseTest2() throws IOException {

        String res = """
                Sample Date:|May 2001|
                Prepared by:|Accelio Present Applied Technology|
                Created and Tested Using:|•Accelio Present Central 5.4•Accelio Present Output Designer 5.4|
                Features Demonstrated:|•Primary bookmarks in a PDF file.•Secondary bookmarks in a PDF file.|
                """;

        InputStream in = new FileInputStream(resource2.getFile());
        PdfTablesParser pdfTablesParser = new PdfTablesParser();
        List docs = pdfTablesParser.parse(in);

        StringBuilder sb = new StringBuilder();
        docs.forEach(doc -> sb.append(doc.getText() + "\n"));

        Assert.equals(res, sb.toString());

    }

    @Test
    void PdfTablesParseTest3() throws IOException {

        String res = """
                |Filename|||escription|escription||
                |||||||
                ap_bookmark.IFD|The template design.||||||
                ap_bookmark.mdf|The template targeted for PDF output.||||||
                ap_bookmark.dat|A sample data file in DAT format.||||||
                ap_bookmark.bmk|A sample bookmark file.||||||
                ap_bookmark.pdf|Sample PDF output.||||||
                ap_bookmark_doc.pdf|A document describing the sample.||||||
                |To bookmark by|Use the command line parameter||
                |Invoices|-abmkap_bookmark.bmk -abmsinvoices||
                |Type|-abmkap_bookmark.bmk -abmstype||
                |Amount|-abmkap_bookmark.bmk -abmsamount||
                """;

        InputStream in = new FileInputStream(resource2.getFile());
        PdfTablesParser pdfTablesParser = new PdfTablesParser(3);
        List docs = pdfTablesParser.parse(in);

        StringBuilder sb = new StringBuilder();
        docs.forEach(doc -> sb.append(doc.getText() + "\n"));

        Assert.equals(res, sb.toString());

    }

}小结
Spring AI Alibaba的spring-ai-alibaba-starter-document-parser-pdf-tables提供了PdfTablesParser用于解析pdf文件中的表格数据到Document。
doc
 
  java2ai 
  tabula-java 
 

                    
                        
                        
                             
                        
                        
                        
                            
                        
                        
                        
                            
                        
                    
                

        你可能感兴趣的:(人工智能)
        
            
                
                    为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点
                        睿邸管家

                        澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
                    
                    人工智能应用研究快讯 2021-11-30
                        峰谷皆平

                        [HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
                    
                    从振动信号到精准预警：AI 如何重塑工业设备健康管理？
                        缘华工业智维
人工智能计算机视觉边缘计算信息与通信
                        在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
                    
                    AI 生成虚拟宠物：24 小时陪你聊天解闷
                        大力出奇迹985
人工智能宠物
                        本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
                    
                    GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求
                        AIGC应用创新大全
AI人工智能与大数据应用开发MCP&Agent云算力网络AIGCai
                        GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
                    
                    AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容
                        AI大模型应用工坊
AI大模型开发实战AIGCchatgptai
                        AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
                    
                    数据分析领域中AI人工智能的发展前景展望
                        AI大模型应用工坊
AI大模型开发实战数据分析人工智能数据挖掘ai
                        数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
                    
                    AI人工智能中的数据挖掘：提升智能决策能力
                        

                        AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
                    
                    【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？
                        三桥君
《三桥君MCP落地方法论》《三桥君AI大模型落地方法论》#《三桥君AI产品方法论》人工智能AI产品经理MCPAPI三桥君系统架构llama
                        你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
                    
                    深入理解卷积神经网络（CNN）与循环神经网络（RNN）
                        CodeJourney.
cnnrnn人工智能
                        在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
                    
                    今年校招竞争真激烈
                        12_05

                        程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
                    
                    如何运用深度学习打造高效AI人工智能系统
                        AI智能探索者
AIAgent智能体开发实战人工智能深度学习ai
                        如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
                    
                    非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）
                        九章云极AladdinEdu
空间计算神经网络人工智能gpu算力算法java开发语言
                        一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
                    
                    响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务
                        fanxbl957
Webspringboot后端java
                        博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
                    
                    企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱
                        南七小僧
AI技术产品经理网站开发人工智能数据库知识图谱人工智能
                        如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
                    
                    【人工智能入门必看的最全Python编程实战（1）】
                        DFCED
人工智能python开发语言深度学习找工作就业
                        --------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
                    
                    2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
                        

                        随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
                    
                    从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）
                        荣华富贵8
程序员的知识储备2程序员的知识储备3深度学习pytorch人工智能
                        摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
                    
                    人工智能概念之九：深度学习概述
                        

                        文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
                    
                    H800核心技术突破与行业应用实战
                        智能计算研究中心
其他
                        内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
                    
                    智慧建筑：科技引领房地产与建筑业的未来
                        RedPhoenix45

                        最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
                    
                    智慧施工：AI技术赋能建筑安全监测新纪元
                        

                        开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
                    
                    智慧工地系统：建筑行业数字化变革的引领者
                        青云智慧园区
java
                        在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
                    
                    AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
                        

                        Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
                    
                    新一代数据库：融合多模智能，重塑数据价值
                        

                        一、场景重塑产业格局：数据库“融合进化”AI浪潮奔涌而至，数字产业格局加速重构。云计算、移动互联、万物互联（IoT）、人工智能（AI）等技术的深度融合与快速落地，正以前所未有的速度重塑着企业的应用形态。新业务场景层出不穷——从高并发的在线交易、实时精准的分析决策，到海量物联网设备监控、基于图关系的风控反欺诈，再到AI驱动的智能推荐与内容生成，应用场景的多样性与复杂性已突破传统数据库的能力边界。这对
                    
                    基于知识图谱技术增强大模型RAG知识库应用效果
                        罗伯特之技术屋
知识图谱人工智能
                        【摘要】本文是AI落地实践的优秀案例，利用RAG技术（Retrieval-AugmentedGeneration，检索增强生成）的知识库实践为背景，介绍了RAG技术的发展及存在的不足，以及知识图谱相关的知识，利用RAG技术去完善和智能化知识图谱。在AI技术大量涌现，但应用不足的情况下，指明了现有应用场景、技术与AI结合的具体做法。1.引言随着人工智能技术的加速演进，AI大模型如雨后春笋般纷纷涌现，
                    
                    BGE-M3模型结合Milvus向量数据库强强联合实现混合检索
                        

                        在基于生成式人工智能的应用开发中，通过关键词或语义匹配的方式对用户提问意图进行识别是一个很重要的步骤，因为识别的精准与否会影响后续大语言模型能否检索出合适的内容作为推理的上下文信息（或选择合适的工具）以给出用户最符合预期的回答。在本篇文章中，我将尽可能详细地介绍想达成准确识别用户提问意图的解决方案之一，即基于功能强大的BGE-M3模型和Milvus向量数据库实现混合检索（稠密向量densevect
                    
                    朋友圈发的原力元宇宙项目到底能不能挣钱
                        口碑信息传播者

                        原力元宇宙项目正如其名，是一场前所未有的数字化革命，融合了虚拟现实（VR）、人工智能（AI）、区块链（Blockchain）等前沿技术，开辟了全新的商业模式和赚钱机会。在朋友圈中频繁看到对该项目的推广宣传，确实反映了其在赚钱方面的潜力。本文将从多个角度解析原力元宇宙项目的盈利机制，揭示其中的商机所在。13分钟视频内容讲明白原力元宇宙创富项目，中国区运营服务对接微信：ForceZen激发兴趣的独特魅
                    
                    构建高效 RAG 流程的七个关键点及其落地实践
                        charles666666
搜索引擎大数据需求分析交互笔记数据库
                        人工智能应用浪潮中，检索增强生成（RAG）技术凭借着结合大型语言模型（LLMs）的生成能力和信息检索系统的独特优势，成为了各企业挖掘数据价值、提升业务智能化水平的关键手段之一。然而，构建一个高效且精准的RAG流程并非易事，其中存在着诸多关键点和挑战。作为一名非资深IT技术顾问，我将基于丰富的实战经验，为大家深入剖析构建高效RAG流程的七个关键点及其落地实践。一、文档解析：混合格式的“第一道坎”在企
                    
                    智能网关芯片：物联网连接的核心引擎
                        

                        在物联网（IoT）生态系统中，智能网关芯片扮演着至关重要的角色，它是实现设备互联、数据转换和边缘计算的核心硬件。随着5G、人工智能（AI）和低功耗通信技术的快速发展，智能网关芯片的性能和功能不断提升，推动着智慧家居、工业物联网（IIoT）、智慧城市等领域的创新。智能网关芯片的关键技术智能网关芯片的核心能力在于其多协议支持能力。由于物联网设备采用不同的通信标准（如Wi-Fi、蓝牙、Zigbee、Lo
                    
                                Js函数返回值
                                    _wy_
jsreturn
                                    一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果 二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果 在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
                                
                                MySQL 的 char 与 varchar
                                    bylijinnan
mysql
                                     
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 
 
测试举例： 
 

CREATE TABLE `varcharLessThan4` (
  `lastName` varchar(3)
) ;

mysql> desc varcharLessThan4;
+----------+---------+------+-
                                
                                Quartz——TriggerListener和JobListener
                                    eksliang
TriggerListenerJobListenerquartz
                                    转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 
listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。 
  二.JobListener监听器 
 j
                                
                                oracle层次查询
                                    18289753290
oracle；层次查询；树查询
                                    .oracle层次查询(connect  by) 
oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， 
select   empno,mgr,ename,sal  from e
                                
                                通过反射把map中的属性赋值到实体类bean对象中
                                    酷的飞上天空
javaee泛型类型转换
                                    使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中 
但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。 
好吧，那就自己再造一个轮子吧。 
原理都知道，就是利用反射进行字段的赋值，下面贴代码 
主要类如下： 
  
import java.lang.reflect.Field;
imp
                                
                                SAP HANA数据存储：传统硬盘的瓶颈问题
                                    蓝儿唯美
HANA
                                    SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。 
在 《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
                                
                                Java Socket 多线程实现文件传输
                                    随便小屋
javasocket
                                            高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。 
客户端类： 
  
package edu.logic.client;

import java.io.BufferedInputStream;
import java.io.Buffered
                                
                                java初学者路径
                                    aijuans
java
                                    学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
                                
                                APP推广
                                    aoyouzi
APP推广
                                    一，免费篇 
1，APP推荐类网站自主推荐 
最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 
2，各大应用商店首发合作 
老实盯着排期，多给应用市场官方负责人献殷勤。 
3，论坛贴吧推广 
百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
                                
                                JSP转发与重定向
                                    百合不是茶
jspservletJava Webjsp转发
                                      
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 
  
转发包括;forward和include   
  
例子;forwrad转发;  将请求装法给reg.html页面 
  
关键代码; 
   
   req.getRequestDispatcher("reg.html
                                
                                web.xml之jsp-config
                                    bijian1013
javaweb.xmlservletjsp-config
                                    1.作用：主要用于设定JSP页面的相关配置。 
2.常见定义： 
<jsp-config>
 <taglib>
  <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri>
  <taglib-location>
   TLD文件所在的位置

                                
                                JSF2.2 ViewScoped Using CDI
                                    sunjing
CDIJSF 2.2ViewScoped
                                    JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
                                
                                【分布式数据一致性二】Zookeeper数据读写一致性
                                    bit1129
zookeeper
                                    很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 
  
  Zookeeper的数据同步协议 
Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
                                
                                Java开发笔记
                                    白糖_
java开发
                                    1、Map<key,value>的remove方法只能识别相同类型的key值 
  
Map<Integer,String> map = new HashMap<Integer,String>();
map.put(1,"a");
map.put(2,"b");
map.put(3,"c"
                                
                                图片黑色阴影
                                    bozch
图片
                                     .event{ padding:0;    width:460px;    min-width: 460px;    border:0px solid #e4e4e4;    height: 350px;    min-heig
                                
                                编程之美-饮料供货-动态规划
                                    bylijinnan
动态规划
                                    

import java.util.Arrays;
import java.util.Random;

public class BeverageSupply {

	/**
	 * 编程之美 饮料供货
	 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。
	 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
                                
                                ajax大参数（大数据）提交性能分析
                                    chenbowen00
WebAjax框架浏览器prototype
                                    近期在项目中发现如下一个问题 
项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。 
根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
                                
                                [宇宙与天文]在太空采矿,在太空建造
                                    comsci

                                         我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 
 
     地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
                                
                                ORACLE中CONSTRAINT的四对属性
                                    daizj
oracleCONSTRAINT
                                    ORACLE中CONSTRAINT的四对属性 
summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
                                
                                Gradle入门教程
                                    dengkane
gradle
                                    一、寻找gradle的历程 
一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
                                
                                C语言简单循环示例
                                    dcj3sjt126com
c
                                    # include <stdio.h>

int main(void)
{
	int i;
	int count = 0;
	int sum = 0;
	float avg;
	
	for (i=1; i<=100; i++)
	{
		if (i%2==0) 
		{
			count++;
			sum += i;
		}
	}

	avg
                                
                                presentModalViewController 的动画效果
                                    dcj3sjt126com
controller
                                    系统自带(四种效果)： 
presentModalViewController模态的动画效果设置：        
[cpp]  
view plain 
copy       
 
 UIViewController *detailViewController = [[UIViewController al
                                
                                java 二分查找
                                    shuizhaosi888
二分查找java二分查找
                                    需求：在排好顺序的一串数字中，找到数字T 
  
一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 
	/**
	 * 
	 * @param array
	 *            顺序数组
	 * @param t
	 *            要查找对象
	 * @return
	 */
	public stati
                                
                                Spring Security（07）——缓存UserDetails
                                    234390216
ehcache缓存Spring Security
                                     
       Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
                                
                                Dozer 深层次复制
                                    jayluns
VOmavenpo
                                    最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
                                
                                CSS规范整理（摘自懒人图库）
                                    a409435341
htmlUIcss浏览器
                                       刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。 
 
 
一、文件规范 
 
1、文件均归档至约定的目录中。 
 
具体要求通过豆瓣的CSS规范进行讲解： 
 
所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中： 
 
基本样式库 /css/core 

                                
                                C++动态链接库创建与使用
                                    你不认识的休道人
C++dll
                                    一、创建动态链接库 
1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 
2.在test.h中添加 
extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 
3.在test.cpp中最后写 
 
extern “C” 返回类型 _decls
                                
                                Android代码混淆之ProGuard
                                    rensanning
ProGuard
                                    Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 
 
ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。 
 
官网： 
http://proguard.sourceforge.net/
                                
                                程序员在编程中遇到的奇葩弱智问题
                                    tomcat_oracle
jquery编程ide
                                    　　现在收集一下： 
   
  
  
　　排名不分先后，按照发言顺序来的。 
  
1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 
2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：   在汤匙
                                
                                解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported
                                    xp9802
dependency
                                    解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： 
     
[html]  
view plain 
copy       
 
 <build>   
         <pluginManagement
                                
                
            
        
    

    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    

    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.