木觞清

使用 n8n 实现你的第一个爬虫程序：从零到自动化

在当今数据驱动的时代，网络爬虫（Web Scraping）是获取和分析数据的重要方式之一。传统爬虫需要编写代码（如 Python + Scrapy），但如果你不想折腾代码，又想快速实现爬虫功能，n8n 是一个绝佳的选择！

n8n 是一个 开源、可视化、低代码的自动化工具，可以轻松搭建爬虫工作流，甚至能自动存储、清洗和转换数据。

在这篇教程中，我将带你 从零开始，用 n8n 实现第一个爬虫程序，目标是从一个示例网站（比如 Quotes to Scrape）抓取名言数据，并保存为结构化格式（如 JSON 或 CSV）。

准备工作

在开始之前，确保你已经安装好 n8n：

在线体验：n8n.cloud（免费试用）
本地安装（推荐）：
```
npm install n8n -g
n8n start
```
访问 http://localhost:5678 即可进入 n8n 面板。

第一步：创建你的第一个爬虫工作流

1. 新建 Workflow

进入 n8n 面板，点击 Workflows → + New Workflow
命名为 First Web Scraper

2. 添加 HTTP Request 节点（获取网页内容）

点击 + Add Node，搜索 HTTP Request 并选择
配置节点：
- URL: http://quotes.toscrape.com/
- Method: GET
点击 Execute Node 测试，你应该能看到网页的 HTML 内容

3. 使用 HTML Extract 节点（提取数据）

现在我们需要从 HTML 中提取 名言、作者、标签 等信息。

添加 HTML Extract 节点，并连接到 HTTP Request
配置提取规则（示例）：
- Extraction Values:
  - quote（名言）: .quote .text（CSS 选择器）
  - author（作者）: .quote .author
  - tags（标签）: .quote .tags
点击 Execute Node，你应该能看到结构化数据

4. 存储数据（可选）

你可以将数据保存到 文件、数据库或 Google Sheets，例如：

JSON 文件：使用 Write Binary File 节点
CSV/Excel：使用 Spreadsheet File 节点
数据库：使用 PostgreSQL / MySQL 节点

进阶优化

1. 分页爬取

如果想爬取多页数据，可以使用 Loop 节点（如 Function 或 HTTP Request 循环）：

http://quotes.toscrape.com/page/1/
http://quotes.toscrape.com/page/2/
...

2. 动态网页爬取（如 JavaScript 渲染）

如果目标网站是 SPA（单页应用），可以使用：

Puppeteer（Headless Chrome） 节点
Playwright 节点

3. 定时自动爬取

使用 Cron 节点，让爬虫每天自动运行：

0 8 * * *  # 每天 8:00 运行

最终效果

完成后的工作流大致如下：

HTTP Request → HTML Extract → (可选: 数据清洗) → 存储（JSON/CSV/Database）

你可以在 n8n 的 JSON 导出 里保存这个工作流，方便下次复用！

总结

n8n 是一个强大的低代码爬虫工具，比传统爬虫更简单
无需写代码，只需拖拽节点即可完成数据抓取
支持动态网页、分页爬取、定时任务等高级功能
数据可自动存储到文件、数据库或云端

如果你遇到问题，欢迎在 评论区留言！

下一篇预告：《如何用 n8n 爬取动态渲染网页（Puppeteer 实战）》

（附：完整 n8n 爬虫 JSON 配置，可在评论区获取！）

你可能感兴趣的:(爬虫,自动化,运维)

三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
K8S 常用命令全解析：高效管理容器化集群恩爸编程 docker kubernetes 容器 k8s常用命令 k8s有哪些常用命令 k8s命令有哪些 K8S常用命令有哪些
K8S常用命令全解析：高效管理容器化集群一、引言Kubernetes（K8S）作为强大的容器编排平台，其丰富的命令行工具（kubectl）为用户提供了便捷的方式来管理集群中的各种资源。熟练掌握K8S常用命令对于开发人员和运维人员至关重要，能够有效提高容器化应用的部署、监控与维护效率。本文将详细介绍一些K8S常用命令及其使用案例。二、基础资源操作命令（一）kubectlcreate功能：用于创建K8
Gerapy爬虫管理框架深度解析：企业级分布式爬虫管控平台 Python×CATIA工业智造爬虫分布式 python pycharm
引言：爬虫工程化的必然选择随着企业数据采集需求指数级增长，传统单点爬虫管理模式面临三重困境：管理效率瓶颈：手动部署耗时占开发总时长的40%以上系统可靠性低：研究显示超过65%的爬虫故障源于部署或调度错误资源利用率差：平均爬虫服务器CPU利用率不足30%爬虫管理方案对比：┌───────────────┬─────────────┬───────────┬───────────┬──────────
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
Docker ℡余晖^ 黑马点评项目相关问题和笔记 docker eureka 容器
在黑马点评项目中，在谈到Redisson解决redis的主从一致性问题时，弹幕提到了Docker，本文来简单了解一下Docker，我的初步理解运维是维护多个集群的稳定，那它和VM虚拟机的区别又是什么？，如果要更深入地理解与学习（运维工程师），可以到b站搜索专门的课程（SpringCloud）。一、Docker是什么？重新理解“容器化”的本质1.1Docker的定义Docker是一个开源的容器化平台
Spring Boot与云原生：微服务架构的创新实践 tmjpz04412 spring kubernetes 云原生 java graphql
引言：Spring生态的演进与现状Spring框架的发展历程与核心设计理念当前Spring生态的核心组件（SpringBoot、SpringCloud、SpringData等）行业对Spring生态的依赖与创新需求SpringBoot的创新实践1.自动化配置与启动优化条件装配（@Conditional）的深度定制案例启动类加载机制与类路径扫描优化示例：通过自定义Starter实现快速集成第三方服务
Spring AI与机器学习：智能应用开发新范式 tmjpz04412 人工智能 spring 机器学习
SpringAI与机器学习的整合SpringAI是一个基于Spring生态的AI开发框架，旨在简化智能应用的开发流程。通过SpringAI，开发者可以快速集成机器学习模型，构建高效的智能应用。SpringAI支持多种机器学习库和框架，如TensorFlow、PyTorch和Scikit-learn，提供统一的API接口。SpringAI的核心优势在于其模块化设计和自动化配置。开发者无需关心复杂的依
建筑施工场景下漏检率↓76%！陌讯多模态融合算法在工程安全监控的落地实践 2501_92722744 大数据算法目标跟踪人工智能计算机视觉目标检测
原创声明本文为原创技术解析，核心技术参数与架构设计引用自《陌讯技术白皮书》，转载请注明来源。一、行业痛点：建筑施工监控的技术瓶颈建筑施工场景的安全监控长期面临多重技术挑战：数据支撑：据《2023建筑施工安全自动化监控报告》显示，传统监控系统对“未佩戴安全帽”“高空抛物”等危险行为的漏检率超35%，误报率高达42%，导致安全事故响应滞后[7]。场景难点：工地存在强光直射（正午阳光）、动态遮挡（塔吊/
JAVA后端开发——用 Spring Boot 实现定时任务 1candobetter JAVA开发 java spring boot 开发语言
在后端开发中，执行定时任务是一个极其常见的需求，无论是每日的数据报表生成、定时的缓存清理，还是自动化同步第三方数据。借助SpringBoot内置的强大功能，我们只需几个简单的注解，就能实现稳定、可靠且极易维护的定时任务。第一步：开启定时任务的总开关(@EnableScheduling)我们首先要告诉SpringBoot：“嘿，我准备在这个项目里使用定时任务功能了，请帮我把相关的组件都准备好！”这个
MutationObserver接口性能分析与优化：DOM监控利器背后的性能陷阱与内存危机 coding随想 JavaScript javascript 前端开发语言
一、DOM的“哨兵”：MutationObserver的崛起在Web开发的江湖中，MutationObserver是一个低调却强大的角色。它像一位忠诚的哨兵，时刻监控着DOM树的风吹草动——属性变化、子节点增删、文本内容更新……开发者们用它来实现动态内容监听、表单验证、甚至自动化测试。然而，这位“哨兵”的背后，却隐藏着不容忽视的性能陷阱和内存危机。1.1MutationObserver的诞生背景在
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
胶棒天线选购指南：2025十大通信天线品牌盘点与应用方案解析 2501_91398178 胶棒天线
胶棒天线选购指南：2025十大品牌盘点与应用方案解析随着无线通信技术的迅猛发展，胶棒天线（RubberDuckAntenna）作为一种轻便、经济且高效的天线解决方案，广泛应用于物联网（IoT）、无线局域网（WLAN）、工业自动化、无人机以及各类通信设备中。2025年的市场竞争更加激烈，新兴技术与经典产品并存，行业用户在选购时需要全面了解品牌、产品性能与应用方案。本文将结合权威性数据平台的分析，详细
分布式IO详解：2025年分布式无线远程IO采集控制方案选型指南 2501_91398178 分布式分布式IO
随着工业物联网（IIoT）和智能制造的快速发展，分布式远程IO（输入/输出）采集控制技术作为工业自动化系统的重要组成部分，正逐步取代传统集中式控制架构。这种技术广泛应用于工厂自动化、能源管理、智慧城市、过程控制等领域。2025年，分布式无线远程IO系统凭借其灵活性、低功耗和高可靠性，成为工业控制领域的核心解决方案。本文基于权威数据平台分析，详细解读分布式无线远程IO技术，盘点全球领先厂商及其产品优
9、Docker Compose 实战小醉你真好 #部署不求人 docker 容器运维
DockerCompose实战教程（含完整Nginx案例+配置项详解）适合读者：开发者、后端工程师、运维工程师、初学者环境要求：CentOS9+Docker已安装教程亮点：实战驱动、配置项详解、挂载说明、可直接复制使用标签：#Docker#DockerCompose#运维实战#Nginx部署一、什么是DockerCompose？DockerCompose是Docker官方推出的多容器应用编排工具，
【分享】软件测试（功能、接口、性能、自动化）详解南瓜_c889
一、软件测试功能测试测试用例编写是软件测试的基本技能；也有很多人认为测试用例是软件测试的核心；软件测试中最重要的是设计和生成有效的测试用例；测试用例是测试工作的指导，是软件测试的必须遵守的准则。黑盒测试常见测试用例编写方法1、等价类选取少数有代表性的数据，这一类数据等价于这一类的其它值；找出最小的子集，可以发现最多的错误；特性：必须设计的用例；涵盖了大部分情况；2、边界值所谓边界条件，是指输入和输
【实战】Java应用一键复制部署+基础数据自动迁移，这套方案绝了！混进IT圈 Java部署 Docker 数据迁移一键部署 MySQL升级 Flyway 镜像管理
前言：还在为部署和数据迁移头疼？作为Java开发者，你是否遇到过这些场景：辛辛苦苦搭好的应用环境，给同事复现一份要手把手教3小时？部署时要手动装JDK、数据库、配置环境变量，步骤繁琐还容易出错？基础数据（如管理员账号、字典表）每次都要手动导入，版本不同还会报错？今天就给大家分享一套一站式解决方案：从应用打包、环境复制到基础数据自动迁移，全程自动化，小白也能一键搞定！一、先搞定“系统打包复制”：环境
塔能科技物联运维平台及城市照明市场竞争力分析塔能物联运维大数据
关于塔能科技的物联运维平台，就其在城市照明领域所具备的市场竞争力而言，可以从技术架构层面、行业适配的实际情况、市场策略方面以及所面临的种种挑战等不同角度展开剖析。一、物联运维平台的核心竞争力1.技术架构优势-全协议兼容的物联网接入能力其能够适配诸如LPWAN（涵盖LoRa、NB-IoT等）、4G/5G、Zigbee这类多种多样的协议，并且可以同时接入像照明设备、环境监测仪器以及电力设施等各不相同类
Halcon试用与许可指南：2022年7月版我就是夏迎春
本文还有配套的精品资源，点击获取简介：本文件提供了Halcon软件的试用证书和许可证相关资料的集合，为潜在用户提供免费体验Halcon各项功能的途径，包括图像处理、形状匹配、OCR和条形码读取等。用户可以通过试用版全面了解软件功能，评估是否符合项目需求，并指导如何正确管理和优化许可证使用，以符合预算和需求。1.Halcon软件概述在当今高度自动化的工业时代，机器视觉系统发挥着至关重要的作用。Hal
在 CentOS 中安装 MySQL 的过程与问题解决方案二向箔reverse centos mysql linux
MySQL是一款广泛使用的开源关系型数据库管理系统，在CentOS系统中安装MySQL是很多开发者和运维人员常做的工作。下面将详细介绍安装过程以及可能遇到的问题和解决方案。一、安装前的准备工作在安装MySQL之前，需要做好一些准备工作，以确保安装过程顺利进行。检查系统版本：确认CentOS的版本，不同版本在安装MySQL时可能会有一些差异。可以使用cat/etc/centos-release命令查
DevOps CI/CD流水线配置实战：GitHub Actions与Jenkins详细教程火烧屁屁lo devops ci/cd github
现代软件开发中，持续集成与持续交付（CI/CD）是DevOps核心实践。通过自动化构建、测试和部署流程，团队能够快速交付高质量软件。本文将深入探讨两种主流工具（GitHubActions和Jenkins）的配置方法，并提供完整代码示例。GitHubActions配置指南GitHubActions是GitHub原生的CI/CD工具，直接集成在代码仓库中。以下为典型工作流配置：创建基础工作流文件在项目
HEI-612：工业协议转换的全能网关，让设备通信更简单高效
在工业自动化的复杂网络中，不同协议设备的“语言壁垒”常常成为数据流通的阻碍——HART设备的精准监测数据难以接入EtherNet/IP或ModbusTCP网络，多点设备联动时的通信延迟、调试繁琐等问题更是让工程师头疼。而HEI-612HART/工业以太网网关的出现，正是为了打破这些壁垒，以强大的技术特性和易用性，成为工业数据互通的“桥梁”。全能协议转换：无缝实现HART协议与EtherNet/IP
第二阶段-第二章—8天Python从入门到精通【itheima】-137节（Python操作MySQL的数据插入） Patrick_kafka mysql 数据库 sql python 数据分析大数据开发语言
目录137节——Python操作MySQL的数据插入1.学习目标2.commit提交3.commit手动确认的执行代码4.commit自动确认：添加在conn的类对象中一个参数autocommit=True5.小节总结6.为什么要用Python操作MySQL？一、从“手动记账”到“自动化账本”：理解技术演进的本质1.SQL的“强项”与“短板”2.Python的“赋能”作用二、Python+PyMy
深入剖析Nginx 书火网_firebook
想邀看书之《深入剖析Nginx》一个不会点运维的后端程序员，不是个合格的码农传送门：https://fire100.top/detail?rId=155少年辛苦终身事，莫向光阴惰寸功！
影刀RPA_批量添加用户至企业微信_源码解读 RPA+AI十二工作室影刀 python 开发语言影刀 rpa 企业微信自动化
一、项目简介本项目是一个基于影刀RPA（RoboticProcessAutomation）开发的自动化工具，主要功能是通过手机号码批量添加用户至企业微信。项目利用企业微信客户端自动化操作，实现了从手机号导入、去重处理到批量发送好友请求的全流程自动化。项目特点：支持通过数据表格或Excel导入手机号自动去重和格式清洗企业微信窗口自动化控制操作结果分类统计与导出二、项目结构xbot_robot/├──
【自动化运维神器Ansible】Ansible常用模块之archive模块详解 IT成长日记 Ansible自动化运维指南自动化运维技术探索运维自动化 ansible archive 常用模块
目录1Ansiblearchive模块概述1.1archive模块的核心功能1.2为什么需要archive模块2archive模块工作原理3archive模块参数详解3.1必需参数：path3.2常用可选参数3.2.1dest3.2.2format3.2.3exclude3.3高级参数3.3.1remove3.3.2owner/group/mode4archive模块使用场景与示例4.1基础使用场
【自动化运维神器Ansible】Ansible常用模块之unarchive模块详解
目录1unarchive模块概述1.1unarchive模块的核心价值2unarchive模块工作原理3unarchive模块参数详解3.1源文件相关参数3.1.1src3.1.2remote_src3.2目标路径参数3.2.1dest3.2.2extra_opts3.3高级控制参数3.3.1keep_newer3.3.2validate_certs4unarchive模块使用场景与示例4.1基础
运维-资产梳理
资产梳理一、明确目标与范围1.1、确定梳理目的网络安全：缩小攻击面、识别风险点。资源配置：优化资源利用率、降低成本。合规要求：满足法律法规或行业标准（如等保、ISO27001）。1.2、界定资产范围物理资产：服务器、网络设备、终端设备、IoT设备等。数字资产：操作系统、数据库、应用程序、域名、IP地址、云资源、容器/K8s集群、SaaS应用。数据资产：敏感数据（如客户信息、财务数据）、业务数据、备
Linux工作常见的面试题老率的IT私房菜
linux运维工程师在面试的时候经常会被问到各种问题，接下来小编根据自己的经验将面试题整理下来供大家参考。取出文件aaa.txt的第4到7行[root@localhost~]#cataaa.txt1.aaa2.bbbbbbb3.ccccccccccccc4.dddddddddddddddddddddd5.eeeeeeeeeeeeeeeeee6.fffffffffffffffffffffffffff
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他