大大的肥猫

Python爬虫：爬取拉勾网数据分析岗位数据

1 JSON介绍

JSON（JavaScript Object Notation）已经成为通过HTTP请求在Web浏览器和其他应用程序之间发送数据的标准格式之一。比CSV格式更加灵活。Json数据格式，非常接近于有效的Pyhton代码，其特点是：JSON对象所有的键都必须是字符串。
可以通过json.loads()将JSON字符串转化为Python的字典形式，方便对其进行进一步操作。
json.loads()：将字符串转化为Python形式
json.load()：将file文件读取，并转换为Python形式

JSON标准格式

https://blog.csdn.net/assholeu/article/details/43037373

Python字典与JSON的区别

https://blog.csdn.net/GitzLiu/article/details/54296971

2 源代码

import requests
import pandas as pd
import json
import time
#数据分析岗位，拉勾网总共的职位是23页

position_info_all = []
for page_num in range(1,24):
    url = "https://www.lagou.com/jobs/positionAjax.json?px=default&city=%E6%B7%B1%E5%9C%B3&needAddtionalResult=false"
    #my_header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'}
    #上述伪装的不够彻底
    my_header = {
        'Host':'www.lagou.com',
        'Origin':'https://www.lagou.com',
        'Referer':'https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90?px=default&city=%E6%B7%B1%E5%9C%B3',
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0',
        'X-Anit-Forge-Code':'0',
        'X-Anit-Forge-Token':'None',
        'X-Requested-With':'XMLHttpRequest'}

    # my_header = {  
    # 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',  
    # 'Host':'www.lagou.com',  
    # 'Referer':'https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90?labelWords=&fromSearch=true&suginput=',  
    # 'X-Anit-Forge-Code':'0',  
    # 'X-Anit-Forge-Token': 'None',  
    # 'X-Requested-With':'XMLHttpRequest'  
    #             }

    #page_num用于修改页码，抓取全部页码的信息
    my_data = {'first':'true','pn':page_num,'kd':'数据分析'}
    #注意查看post请求还是get请求
    response = requests.post(url,headers = my_header,data =my_data  )
    # print(response)
    # print(response.text)

    dict_all = json.loads(response.text)
    dict_position_results = dict_all["content"]["positionResult"]["result"]
    for position_item in dict_position_results:
        position_info_single = []
        position_info_single.append(position_item["companyFullName"])
        position_info_single.append(position_item["companyShortName"])
        position_info_single.append(position_item["companySize"])
        position_info_single.append(position_item["financeStage"])
        position_info_single.append(position_item["district"])
        position_info_single.append(position_item["positionName"])
        position_info_single.append(position_item["workYear"])
        position_info_single.append(position_item["education"])
        position_info_single.append(position_item["salary"])
        position_info_single.append(position_item["jobNature"])
        position_info_single.append(position_item["positionAdvantage"])
        position_info_single.append(position_item["createTime"])
        position_info_all.append(position_info_single)
    time.sleep(20)
    #print(position_info_all)
df = pd.DataFrame(data = position_info_all,columns = ['公司全名','公司简称','公司规模','融资阶段','区域','职位名称','工作经验','学历要求','工资','工作形式','职位福利','发布时间'])   
df.to_csv('lagou_jobs_1.csv',index = False,encoding="utf_8_sig")
print("文件写入成功！")

3 Pyhton爬虫

（1）网页信息准备

本文爬取拉勾网-深圳市“数据分析”岗位的数据信息，并对其进行数据清洗及可视化操作。图1为拉勾网深圳数据分析网页界面。

爬虫的方式分为很多种，基础的爬虫通常分为网页源代码爬取和JSON数据包爬取。前者，网站内信息在网页代码中，通过发送HTTP请求网页页面代码，对其进行目标内容提取即可采集数据；后者，较前者则增加一定的难度，通常用以“爬虫攻防战”，网站将数据存于JSON数据包，爬虫开发者需要通过查看网页元素信息，找到该数据包，并通过GET或POST等请求方式，结合其他诸如“伪装成浏览器”等形式的反“反爬虫”机制手段，进行数据的爬取。

本文基于JSON数据包，进行抓包数据爬取。F12键，可快速查看页面信息。一般情况，JSON数据包存于Network - XHR或JS - Preview中，开发者需要自行找到该数据包，并与页面显示的信息进行对比，准确无误，即为要爬取的数据包。

通过查看Network - XHR或JS - Headers，找到 Request URL \ Request Method \ Request Headers \ Form Data等信息。如下图所示：（下面将详细介绍其用途）

（2）JSON数据在线解析

通过json数据在线解析，找到要爬取的关键值的索引，进行取值。

（3）总结

（1）深圳数据分析岗位招聘一共343，每页显示15个岗位信息，一共23页数据；
（2）网站上数据分析岗位的招聘信息，存于JSON数据包，其具体信息如下：

Request URL： https://www.lagou.com/jobs/positionAjax.json?city=%E6%B7%B1%E5%9C%B3&needAddtionalResult=false（通过向该网址发送HTTP请求，接收服务器响应）
Request Method ：POST（HTTP请求方式，这点很重要，将GET和POST方式弄错，导致请求的数据与页面源代码的数据不一致）
Request Headers ：User-Agent:**Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0（一级反反爬机制，将代码请求伪装成浏览器请求，防止反爬）
Form Data：（修改pn，可以修改爬取的页面数）

first: true
pn: 1
kd: 数据分析

4 第一页数据爬取

（1）源代码

import requests
import pandas as pd
import json
#数据分析岗位，拉勾网总共的职位是23页

#指定爬取的页面，首先爬取第一页的岗位数据
page_num =1
url = "https://www.lagou.com/jobs/positionAjax.json?px=default&city=%E6%B7%B1%E5%9C%B3&needAddtionalResult=false"
#my_header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'}
#上述伪装的不够彻底

my_header = {
    'Host':'www.lagou.com',
    'Origin':'https://www.lagou.com',
    'Referer':'https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90?px=default&city=%E6%B7%B1%E5%9C%B3',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0',
    'X-Anit-Forge-Code':'0',
    'X-Anit-Forge-Token':'None',
    'X-Requested-With':'XMLHttpRequest'}

#page_num用于修改页码，抓取全部页码的信息
my_data = {'first':'true','pn':page_num,'kd':'数据分析'}

#注意查看post请求还是get请求
response = requests.post(url,headers = my_header,data =my_data  )

#通过json.loads方法，将服务器响应的json格式数据转换为Python形式的数据，方便后续调用。
dict_all = json.loads(response.text)
dict_position_results = dict_all["content"]["positionResult"]["result"]

#数据预处理，未经处理的数据的列数有46columns，本文只需要提取其中关键的12列数据即可。
#方法：将字典内数据循环读取，装进列表中。
position_info_all = []
for position_item in dict_position_results:
    position_info_single = []
    position_info_single.append(position_item["companyFullName"])
    position_info_single.append(position_item["companyShortName"])
    position_info_single.append(position_item["companySize"])
    position_info_single.append(position_item["financeStage"])
    position_info_single.append(position_item["district"])
    position_info_single.append(position_item["positionName"])
    position_info_single.append(position_item["workYear"])
    position_info_single.append(position_item["education"])
    position_info_single.append(position_item["salary"])
    position_info_single.append(position_item["jobNature"])
    position_info_single.append(position_item["positionAdvantage"])
    position_info_single.append(position_item["createTime"])
    position_info_all.append(position_info_single)

#将爬取的数据写进CSV文件    
df = pd.DataFrame(data = position_info_all,columns = ['公司全名','公司简称','公司规模','融资阶段',
                                                      '区域','职位名称','工作经验','学历要求','工资','工作形式','职位福利','发布时间'])   
df.to_csv('lagou_jobs_page1.csv',index = False,encoding="utf_8_sig")
print("数据存储成功（CSV格式）！")

（2）建立HTTP请求并发送，获取响应

注意是POST请求
my_header：用于伪装成浏览器访问（爬虫攻防）
my_data：用于修改页数

（3）json数据转化、数据清洗、按格式存储数据

json.loads方法，将json格式数据转换成Python可用数据
数据清洗，通过按索引从字典中提取关键数据，存入列表
存储数据成CSV格式
注意：存储成CSV格式，用Excel打开的时候，容易出现乱码现象。

需加上如图的encoding = ‘utf_8_sig’

（4）CSV数据展示（15个数据）

5 循环爬取所有信息

（1）源代码

import requests
import pandas as pd
import json
import time
#数据分析岗位，拉勾网总共的职位是23页

position_info_all = []
for page_num in range(1,24):
    url = "https://www.lagou.com/jobs/positionAjax.json?px=default&city=%E6%B7%B1%E5%9C%B3&needAddtionalResult=false"
    #my_header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'}
    #上述伪装的不够彻底
    my_header = {
        'Host':'www.lagou.com',
        'Origin':'https://www.lagou.com',
        'Referer':'https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90?px=default&city=%E6%B7%B1%E5%9C%B3',
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0',
        'X-Anit-Forge-Code':'0',
        'X-Anit-Forge-Token':'None',
        'X-Requested-With':'XMLHttpRequest'}

    #page_num用于修改页码，抓取全部页码的信息
    my_data = {'first':'true','pn':page_num,'kd':'数据分析'}
    #注意查看post请求还是get请求
    response = requests.post(url,headers = my_header,data =my_data  )

    dict_all = json.loads(response.text)
    dict_position_results = dict_all["content"]["positionResult"]["result"]
    for position_item in dict_position_results:
        position_info_single = []
        position_info_single.append(position_item["companyFullName"])
        position_info_single.append(position_item["companyShortName"])
        position_info_single.append(position_item["companySize"])
        position_info_single.append(position_item["financeStage"])
        position_info_single.append(position_item["district"])
        position_info_single.append(position_item["positionName"])
        position_info_single.append(position_item["workYear"])
        position_info_single.append(position_item["education"])
        position_info_single.append(position_item["salary"])
        position_info_single.append(position_item["jobNature"])
        position_info_single.append(position_item["positionAdvantage"])
        position_info_single.append(position_item["createTime"])
        position_info_all.append(position_info_single)
    time.sleep(20)
    #print(position_info_all)
df = pd.DataFrame(data = position_info_all,columns = ['公司全名','公司简称','公司规模','融资阶段','区域','职位名称','工作经验','学历要求','工资','工作形式','职位福利','发布时间'])   
df.to_csv('lagou_jobs_page_all.csv',index = False,encoding="utf_8_sig")
print("全部数据存储成功（CSV格式）！")

（2）for循环的加入

time.sleep()暂停进程
import time，加入限时函数，模拟人为点击爬虫，以免被网站封杀
在没有加入time.sleep(20)的时候，出现KeyError: ‘content’，在加入sleep之后，就解决了。
可能原因1：https://blog.csdn.net/u011089523/article/details/72887163
可能原因2：https://segmentfault.com/q/1010000007079342?_ea=1232968

（3）CSV数据展示（所有数据）

你可能感兴趣的:(编程学习笔记)

如何高效记录并整理编程学习笔记？ FrostedLotus·霜莲数据挖掘
如何高效记录并整理编程学习笔记？在编程学习的海洋中，高效的笔记记录和整理方法就像一张珍贵的航海图，能够帮助我们在浩瀚的知识中找到方向。如何建立一个既能快速记录又易于回顾的笔记系统？如何在繁忙的学习中保持笔记的条理性？让我们一起探讨如何打造属于自己的编程学习“知识宝库”!方向一：笔记工具选择选择合适的笔记工具是高效记录编程学习笔记的第一步。不同的工具有其独特的优势，适合不同的学习风格和需求。以下是一
嵌入式linux编程学习笔记游园子嵌入式软件 linux
**Ubuntu系统基础**1.系统更新sudoapt-getupdatesudoapt-getupgrade2.跨版本升级sudoaptinstallupdate-manager-coresudodo-release-upgrade-mdesktop-d3.文件操作tar-vcjfrootfs.tar.bz2*tar-vcjftest.tar.bz2testtar-vczftest.tar.gz
C#异步编程学习笔记之-async和await ahe82105 c#
一、异步方法介绍（async和await）：如果使用async修饰符将某种方法指定为异步方法，即启用以下两种功能。1、标记的异步方法可以使用await来指定暂停点。await运算符通知编译器异步方法：在等待的异步过程完成后才能继续通过该点。同时，控制返回至异步方法的调用方。异步方法在await表达式执行时暂停并不构成方法退出，只会导致finally代码块不运行。2、标记的异步方法本身可以通过调用它
Linux/C++多线程编程学习笔记——线程同步、锁 mwz18959217316 学习 c++linux
目录1.为什么要线程同步2.线程同步的方式2.1互斥锁2.2读写锁2.3条件变量2.4信号量1.为什么要线程同步多个线程同时对内存中的共享资源进行访问时，当一个线程对共享资源进行修改时，其他线程得到的依然是修改前的内容，这样就存在巨大的隐患比如三个ABC人共用一张银行卡，这三个人就是三个线程，银行卡就是共享资源，假如银行卡里有100块钱，这三个人同时取这100块钱，如果不做线程同步，那么三个人都能
c#并发编程学习笔记1（多线程） _cab_ 计基学习笔记 c#
一.关于并发编程的一些个人理解并发编程的核心是让程序具备同时处理多个任务的能力，常见的情况是用以解决某些任务太慢但不能让其阻塞总流程以及有某些任务需要同时等待和处理等。而实现并发编程的方法也有很多种，目前我所认知范围中的是多线程（Thread），协程（Continue），多进程（Process）以及异步I/O。二.多线程的基本概念首先需要明确一下线程vs进程：进程是操作系统进行资源分配和调度的基本
C#异步编程学习笔记3 之异步原理 SQWH_SSGS C##C#异步编程 c#.net
C#异步编程学习笔记3之异步原理异步原理同步vs异步什么是异步编程异步编程的两种用途一点建议异步编程和Continuation异步原理同步vs异步同步操作会在返回调用者之前完成它的工作异步操作会在返回调用者之后去做它的（大部分）工作异步的方法更为少见，会启用并发，因为它的工作会与调用者并行执行异步方法通常很快（立即）就会返回到调用者，所以叫非阻塞方法目前见到的大部分的异步方法都是通用目的的：Thr
黑马程序员C++核心编程学习笔记为了前进而后退，为了走直路而走弯路 C++c++学习笔记
《黑马程序员》C++核心编程本阶段主要针对C++面向对象编程技术做详细讲解，探讨C++中的核心和精髓。文章目录《黑马程序员》C++核心编程1内存分区模型1.1程序运行前1.2程序运行后1.3new操作符2引用2.1引用的基本使用2.2引用注意事项2.3引用做函数参数2.4引用做函数返回值2.5引用的本质2.6常量引用3函数提高3.1函数默认参数3.2函数占位参数3.3函数重载3.3.1函数重载概述
C++编程学习笔记：函数相关特性、引用与编译流程共享家9527 C++c++
目录一、函数的缺省参数（一）全缺省参数（二）半缺省参数二、函数重载（一）参数类型不同（二）参数个数不同（三）参数类型顺序不同三、引用相关问题（一）引用的基本概念与初始化（二）引用在函数中的应用-以Swap函数为例1.普通变量交换（值传递方式存在问题）2.使用指针引用实现交换3.使用普通引用实现交换（更简洁常用）四、C++编译流程（一）预处理（二）编译（三）汇编（四）链接在深入学习C++编程的过程中
C++ 并发编程实战学习笔记 myc13381 c++笔记
C++并发编程学习笔记目录一.基本接口二.初步了解多线程三.线程所属权管理四.线程间共享数据五.同步并发操作六.C++内存模型和原子类型操作七.基于锁的并发数据结构设计八.无锁数据结构九.并发代码设计十.高级线程管理十一.并行算法十二.参考资料基本接口std::thread常用成员函数构造和析构函数//默认构造函数，创建一个线程，什么也不做thread()noexcept;//初始化构造函数，创建
Socket编程学习笔记之TCP与UDP 辩证法写Bug tcp/ip udp 网络协议
Socket：Socket是什么呢？是一套用于不同主机间通讯的API，是应用层与TCP/IP协议族通信的中间软件抽象层。是一组接口。在设计模式中，Socket其实就是一个门面模式，它把复杂的TCP/IP协议族隐藏在Socket接口后面，对用户来说，一组简单的API就是全部，让Socket去处理数据并符合指定的协议。门面模式（FacadePattern）是一种常见的封装模式，它要求一个子系统的的外部
【C语言基础习题】C语言练习题——bite 寒假班作业（7）拾贰_C 【bite就业课】作业习题 c语言算法开发语言
如何高效记录并整理编程学习笔记？在编程学习的海洋中，高效的笔记记录和整理方法就像一张珍贵的航海图，能够帮助我们在浩瀚的知识中找到方向。如何建立一个既能快速记录又易于回顾的笔记系统？如何在繁忙的学习中保持笔记的条理性？让我们一起探讨如何打造属于自己的编程学习“知识宝库”!2024-01-28_函数的概念等_作业文章目录如何高效记录并整理编程学习笔记？2024-01-28_函数的概念等_作业习题第1题
编程学习笔记秘籍：开启高效学习之旅青云交 java学习教学学习笔记传统纸质笔记本笔记工具选择笔记结构设计实践与复习策略掌握了高效记录并整理笔记的方法
目录引言：正文：方向一：笔记工具选择传统纸质笔记本电子文档类工具（如MicrosoftWord、WPS等）专业编程笔记软件（如Notion、Evernote等）在线代码托管平台（如GitHub、GitLab等）方向二：笔记结构设计分类标签化建立知识关联方向三：实践与复习策略实践复习策略结束语：引言：“计算机科学教育不能使人成为程序员，就像学画笔和颜料不能使人成为画家一样。”——埃里克·雷蒙德。在当
如何高效记录并整理编程学习笔记？编织幻境的妖学习笔记
高效地记录和整理编程学习笔记是提高学习效率和巩固知识的重要手段。以下是一些建议，帮助你更好地管理你的编程学习笔记：一、选择合适的工具：数字笔记应用：如notion,evernote,onenote,roamresearch等，它们支持云同步，方便在不同设备间查看和编辑。文本编辑器：如vscode,sublimetext,notepad++等，适合编写纯文本笔记。markdown编辑器：如typor
python网络编程学习笔记 github_czy python
知识点框架协议栈与库端口号、套接字、绑定接口、udp分组、套接字选项、广播TCP工作原理，套接字的含义，每个会话使用一个套接字，地址已被占用，绑定接口，死锁，已关闭连接，半开连接，像文件一样使用TCP流主机名与套接字，现代地址解析，DNS协议字节与字符串，封帧与引用，pickle与自定义定界符的格式，xml与json，压缩，未来异常生成证书，TLS负载移除，手动选择加密算法与完美前向安全，支持tl
如何高效记录并整理编程学习笔记 vvvae1234 学习笔记
在编程学习的旅程中，好的笔记记录和整理方法不仅能帮助我们更有效地吸收知识，还能在复习时提供清晰的参考。下面，我将为您提供一些建立高效笔记系统的建议，以帮助您在繁忙学习中保持笔记的条理性，从而打造属于自己的编程学习“知识宝库”。方向一：笔记工具选择提示：1.Notion优点：多功能性：Notion支持笔记、数据库、任务管理和项目管理，用户可以根据自己的需求创建不同工作区和模块。灵活性：支持Markd
如何高效记录并整理编程学习笔记？软件技术NINI 学习笔记
如何高效记录并整理编程学习笔记？在编程学习的海洋中，高效的笔记记录和整理方法就像一张珍贵的航海图，能够帮助我们在浩瀚的知识中找到方向。如何建立一个既能快速记录又易于回顾的笔记系统？如何在繁忙的学习中保持笔记的条理性？让我们一起探讨如何打造属于自己的编程学习“知识宝库”!提醒：在发布作品前，请把不需要的内容删掉。方向一：笔记工具选择提示：介绍适合编程学习的各类笔记工具，分析它们的优缺点及适用场景。方
Linux shell编程学习笔记73：sed命令——沧海横流任我行（上）紫郢剑侠麒麟操作系统 Linux世界编程资料 linux 学习笔记 shell编程脚本编程流编辑器 sed命令
0前言在大数据时代，我们要面对大量数据，有时需要对数据进行替换、删除、新增、选取等特定工作。在Linux中提供很多数据处理命令，如果我们要以行为单位进行数据处理，可以使用sed。1sed的帮助信息，功能，格式，选项和参数说明，退出状态1.1sed的帮助信息我们可以使用命令sed--help来获取帮助信息。1.1.1CSDN程序员研究院bash中的sed的帮助信息[purpleendurer@bas
标题：打造编程学习的知识宝库：高效笔记记录与整理 chezabo6116 学习笔记
标题：打造编程学习的知识宝库：高效笔记记录与整理在编程学习的征途中，有效的笔记记录和整理技巧对于掌握和回顾知识点至关重要。本文将从笔记工具选择、笔记结构设计、以及实践与复习策略三个方面，探讨如何高效地记录并整理编程学习笔记。方向一：笔记工具选择选择合适的笔记工具是高效记录的第一步。电子笔记应用：如Evernote、OneNote等，支持多平台同步，方便随时记录和访问。Markdown笔记工具：如T
打造编程学习的“知识宝库”：高效笔记记录与整理指南 Envyᥫᩣ 学习笔记
如何高效记录并整理编程学习笔记？在编程学习的海洋中，高效的笔记记录和整理方法就像一张珍贵的航海图，能够帮助我们在浩瀚的知识中找到方向。如何建立一个既能快速记录又易于回顾的笔记系统？如何在繁忙的学习中保持笔记的条理性？让我们一起探讨如何打造属于自己的编程学习“知识宝库”!在编程学习的广阔世界里，掌握一种高效笔记记录与整理的方法，就像是拥有一张珍贵的航海图，能帮助我们在知识的海洋中准确地找到方向。本文
Socket网络编程学习笔记（7）TCP快速入门鮀城小帅 #Socket tcp/ip 网络学习 ByteBuffer TCP
1.TCP是什么TCP，（TransmissionControlProtocol，缩写为TCP）。TCP是传输控制协议；是一种面向连接的、可靠的、基于字节流的传输层通信协议，由IETF的RFC793定义。TCP与UDP意义完成第四层传输所指定的功能与职责。（1）TCP的机制：三次握手、四次挥手具有校验机制、可靠、数据传输稳定（2）三次握手图解：（2）TCP能做的功能聊天消息传输、推送单人语音、视频
CUDA编程学习笔记（三） HHHANG___ 学习笔记
本篇记录学习cuda的执行模式，主要有几个方面的内容：理解jetsonnano上的gpu架构；理解线程束执行的本质；分支化与避免分支化；展开循环；其他；一、理解jetsonnano的gpu架构这块内容在上一篇笔记中有学习到一些，本篇就进行一个补充和复习。jetsonnano上的gpu是Maxwell架构的，整个gpu上面只有一个SM（流多处理器）。该SM上包含128个处理核心，这128个计算核心被
IEC101编程学习笔记专栏规划 six2me 学习笔记 iec101 iec04
这大半年，我编写的IEC104编程学习笔记收到广大网友的好评，有不少网友留言，想问问能不能写一下IEC101的编程思路，毕竟再通讯行业，IEC101也是有很大几率的。应广大网友的邀请，近期准备开始编写IEC101的编程笔记，打算与近期与大家见面，再这里给各位打个招呼，但是由于本人也在参加工作，只能抽出闲暇时间来编写，所以时间不能给出计划，望谅解。同时，欢迎感兴趣的网友提出建议，会一并考虑。http
java-JUC并发编程学习笔记05（尚硅谷）抹茶味的西瓜汁多线程并发编程学习笔记
我们写一段测试代码:会出现线程不安全的问题。使用Vector解决线程不安全问题：但是这个类几乎不会被使用了，因为效率太低。方法二：通过Collections解决：但是这种方案实际中也不太会使用。我们还有第三种方法使用CopyOnWriteArrayList：HashSet线程不安全的解决方案：也会出现异常。我们要怎么解决呢？HashMap线程不安全演示：也会出现异常。
【精华文章】戊子仲秋的编程学习笔记汇总戊子仲秋精华文章学习笔记
文章目录戊子仲秋的学习笔记分享算法学习后端必备知识，打牢基础操作系统Golang学习Linux学习C++学习C语言学习C语言初阶C语言进阶戊子仲秋的学习笔记分享算法学习算法学习笔记汇总后端必备知识，打牢基础操作系统进程管理理解进程、线程、协程I/O多路复用理解I/O多路复用Golang学习Golang基本语法学习Linux学习环境搭建手把手带你用云服务器搭建Linux环境Linux常见指令与权限理
java-JUC并发编程学习笔记03（尚硅谷）抹茶味的西瓜汁多线程并发编程学习笔记
线程间通信例子：对一个值+1-1交替完成，a的值就是1b的值就是0这个过程就是线程间通信Synchronized实现：虚假唤醒问题：我们再添加两个线程。我们发现我们的结果就不对了。我们只需要使用while即可。我们线程通信的最后一步就是防止虚假通信的出现。Lock实现：运行结果：这就是我们使用lock和synchronized两种方式进行线程的通信的基础学习。
C#异步编程学习笔记之-async和await（续） ahe82105
书接上文，本篇主要记录的内容要点：1、针对async和await在实际应用中的使用方式；2、异步方法返回值（有返回值和无返回值）的两种情况；示例一（无返回值）：usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Text;usingSystem.Xml.Linq;usingSystem.Text.Regu
C#异步编程学习笔记2 之 Task SQWH_SSGS C##C#异步编程 c#.net
C#异步编程学习笔记2之TaskTaskThread的问题TaskClass开始一个Task（Task.Run）Wait等待长时间运行的任务（Long-runningtasks）Task的返回值Task的异常异常与“自治”的Task未观察到的异常Continuationawaiter如果发生故障非泛型task同步上下文ContinueWithTaskCompletionSource使用TaskCo
Linux shell编程学习笔记42：hdparm命令紫郢剑侠 Linux 学习笔记磁盘操作命令硬盘操作命令 hdparm命令获取硬盘参数硬盘序列号
ChatGPT和文心一言哪个更好用？从智能回复、语言准确性、知识库丰富度等方面比较，两大AI助手哪个更胜一筹？快来和我们分享一下你的看法吧~0前言获取硬盘序列号是信息资产管理和信息安全检测中经常要收集的信息，对于Linux来说，获取硬盘序列号的方法不止一种，比如，我们可以使用上节介绍的lsblk命令来获取硬盘序列号，详见：银河麒麟桌面操作系统中获取硬盘序列号再如，我们今天学习的hdparm命令也可
Scratch 编程学习笔记秃突兔兔突秃学习
Scratch编程学习笔记1、聊一聊编程1.1-编程是什么2、Scratch3.02.1Scratch3.0安装2.2Scratch3.0介绍一、界面二、角色三、舞台四、指令积木介绍3、Scratch基础篇4、Scratch提高篇4.1、10以内的加减法学习与练习4.2、一级for循环--求1-10的和4.3、二进制转十进制4.4、冒泡排列法图解4.5、奥运五环4.6、坦克大战自制地图5、Scra
Linux shell编程学习笔记41：lsblk命令紫郢剑侠 Linux世界麒麟操作系统编程资料 linux 学习笔记 shell编程 shell脚本块设备 lsblk命令
边缘计算的挑战和机遇边缘计算面临着数据安全与隐私保护、网络稳定性等挑战，但同时也带来了更强的实时性和本地处理能力，为企业降低了成本和压力，提高了数据处理效率。因此，边缘计算既带来了挑战也带来了机遇，需要我们不断地研究0前言前几节学习我们均涉及到磁盘和文件存储，今天我们研究与块设备有关的命令。1lsblk命令的功能和格式我们可以使用命令lsblk--help命令查看它的用法：purpleEndure
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他