renyujie518

AI studio 训练分享之Python小白逆袭大神课程

缘由

最近，百度在推广自家的paddlepaddle框架，这同时就是在疯狂的送GPU资源，（真香）开了很多七日培训班，之前参加了一项cv的课程，感觉很不错，尤其是hub库和lite库的压缩和部署功能，还是相当给力，而且社区给了很多开源项目。但当时没有开通博客，所以，就着这次新的课程，一起扒一下这次课程一些可收获的点，具体的课程链接可见：百度 aistudio实训平台–Python小白逆袭大神课程.

第一课

这其实就是在介绍一些studio的相关基本操作（基于jupyter），下面列举一些比较重要的点:
1.几个基本的shell命令：
查看当前挂载的数据集目录

!ls /home/aistudio/data/
输出：data269

显示当前路径

!pwd
输出：/home/aistudio

如果需要进行持久化安装, 需要使用持久化路径, 如下方代码示例:

!mkdir /home/aistudio/external-libraries#建立文件夹
!pip install beautifulsoup4 -t /home/aistudio/external-libraries  #安装到文件夹

同时添加如下代码, 这样每次环境(kernel)启动的时候只要运行下方代码即可:

import sys
sys.path.append('/home/aistudio/external-libraries')

git的应用：

!git clone https://github.com/PaddlePaddle/Paddle.git  #Paddle官方模型

这里提供了一个非常好的插件工具：注意: Paddle的Git体积过大, 同步会非常迟缓. 建议使用浏览器插件, 对指定目录进行下载, 然后上传至AI Studio的项目空间中. gitzip

2.关于调试
Notebook执行Python代码的原理和传统IDE略有不同.
传统IDE, 当点击Run按钮时, 编译器/解释器开始构建一个进程. 用户通过单步执行/设置断点进行代码调试和变量监控. 当代码出错, 或用户点击Stop按钮时, 进程被杀死, 资源回收.

而Notebook, 一旦启动, 就是开始创建一个"进程"(kernel). 每一个Cell, 都是一个天然的断点. 当代码出错, 或用户点击Stop按钮时, “进程"通常也不会被杀死.因此如果代码陷入死循环等情况, 需要用户手动关闭并重启该"进程”.**此外, Notebook的Cell是可以随意颠倒顺序来执行的. 这点和传统IDE有很大不同.
作为前端的Notebook, 与后端的进程(kernel), 建立有一个Session. 未来本平台将支持terminal功能. 也就可以同时支持多个Session来控制kernel.
关于调试，可以去看一个包：PDB来进行代码调试, 可以打印变量和单步执行 PDB

3.关于上传大文件

4. Magic命令（简易版的终端）
Magic命令是Notebook的高级用法了. 可以运行一些特殊的指令. Magic 命令的前面带有一个或两个百分号（% 或 %%），分别代表行 Magic 命令和单元格 Magic 命令。行 Magic 命令仅应用于编写 Magic 命令时所在的行，而单元格 Magic 命令应用于整个单元格。
Magic命令查询

举个例子:
显示全部可用的Magic命令 %lsmagic

%lsmagic

Available line magics:
%alias  %alias_magic  %autoawait  %autocall  %automagic  %autosave  %bookmark  %cat  %cd  %clear  %colors  %config  %connect_info  %cp  %debug  %dhist  %dirs  %doctest_mode  %ed  %edit  %env  %gui  %hist  %history  %killbgscripts  %ldir  %less  %lf  %lk  %ll  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %lx  %macro  %magic  %man  %matplotlib  %mkdir  %more  %mv  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %popd  %pprint  %precision  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %rep  %rerun  %reset  %reset_selective  %rm  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%debug  %%file  %%html  %%javascript  %%js  %%latex  %%markdown  %%perl  %%prun  %%pypy  %%python  %%python2  %%python3  %%ruby  %%script  %%sh  %%svg  %%sx  %%system  %%time  %%timeit  %%writefile

Automagic is ON, % prefix IS NOT needed for line magics.

列举几个常用的:
%run: 运行python代码

%run work/SampleOfRun.py

%%writefile magic可以把cell的内容保存到外部文件里。而%pycat则可把外部文件展示在Cell中

%env：设置环境变量使用该命令, 可以在不必重启Kernel的情况下管理notebook的环境变量

第二课

这一课是python基础课，这我还是推荐去B站学习，这个得练习，不断去用才行。
列举几个重要的：
break语句可以跳出 for 和 while 的循环体


n = 1
while n <= 100:
    if n > 10:
        break
    print(n)
    n += 1

continue语句跳过当前循环，直接进行下一轮循环

n = 1
while n < 10:
    n = n + 1
    if n % 2 == 0:
        continue
    print(n)

pass是空语句，一般用做占位语句，不做任何事情

 for letter in 'Room':
    if letter == 'o':
        pass
        print('pass')
    print(letter)

Tuple（元组）
tuple与list类似，不同之处在于tuple的元素不能修改。tuple写在小括号里，元素之间用逗号隔开。
元组的元素不可变，但可以包含可变对象，如list。

t1 = ('abcd', 786 , 2.23, 'runoob', 70.2)
t2 = (1, )
t3 = ('a', 'b', ['A', 'B'])
t3[2][0] = 'X'  #将第二个元组项的第一个改为X
print(t3)
输出：('a', 'b', ['X', 'B'])

dict（字典）字典是无序的对象集合，使用键-值（key-value）存储，具有极快的查找速度。
键(key)必须使用不可变类型。同一个字典中，键(key)必须是唯一的。

d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
print(d['Michael'])
输出：95

set（集合）
set和dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key。set是无序的，重复元素在set中自动被过滤。

s = set([1, 1, 2, 2, 3, 3])
print(s)
输出：{1, 2, 3}

这里再总结一些自己之前没有注意到的点:

种子数：调用 random.random() 生成随机数时，每一次生成的数都是随机的。但是，当预先使用 random.seed(x) 设定好种子之后，其中的 x 可以是任意数字，此时使用 random() 生成的随机数将会是同一个。种子一样，生成的radom一样

import random
ran = random.random()
print(ran)  #输出0.3009718634018812
print ("------- 设置种子 seed -------")
random.seed(10)
print ("Random number with seed 10 : ", random.random())
# 生成同一个随机数
random.seed(10)
print ("Random number with seed 10 : ", random.random())
输出：------- 设置种子 seed -------
Random number with seed 10 :  0.5714025946899135
Random number with seed 10 :  0.5714025946899135

ran = random.randint(1,20)用作生成指定范围内的随机数

针对list的操作

join():以字符作为分隔符，将字符串中所有的元素合并为一个新的字符串

new_str = '-'.join('Hello')
print(new_str)
输出：H-e-l-l-o

insert():指定位置添加到一个列表中

girls.insert(1,'虞书欣')
print(girls)
输出：['杨超越', '虞书欣', '刘雯', '奚梦瑶']
原先：['杨超越', '刘雯', '奚梦瑶']

del 删除

words = ['cat','hello','pen','pencil','ruler']
del words[1] #或者    words.remove('cat')  再或者 words.pop(1)
print(words)
['cat', 'pen', 'pencil', 'ruler']

关于切片

nimals = ['cat','dog','tiger','snake','mouse','bird']
print(animals[2:5])  #总共三个 左开右闭
print(animals[-1:]) #最后一个
print(animals[-3:-1])#总共两个 左开右闭，所以最后一个没有
print(animals[-5:-1:2])#-5到-1(-1不取)每隔2个取
print(animals[::2])  #从头开始，每隔两个
输出：
['tiger', 'snake', 'mouse']
['bird']
['snake', 'mouse']
['dog', 'snake']
['cat', 'tiger', 'mouse']

关于排序

#默认升序
new_list = sorted(random_list)
print(new_list)
#降序
new_list = sorted(random_list,reverse =True)
print(new_list)
#逆序
原先：(14, 10, 9, 15, 6, 10, 12, 5, 15, 8)
print(random_tuple[::-1])
现在：(8, 15, 5, 12, 10, 6, 15, 9, 10, 14)

针对元组的操作

元组中只有一个元素时，需要在后面加逗号

tuple3 = ('hello',)
print(type(tuple3))
输出：<class 'tuple'>

元组不能修改，所以不存在往元组里加入元素

t1 = (1,2,3)+(4,5)
print(t1)
(1, 2, 3, 4, 5)

解释对元组中*的操作：

#当元组中元素个数与变量个数不一致时
#定义一个元组，包含5个元素
t4 = (1,2,3,4,5)
#将t4[0],t4[1]分别赋值给a,b;其余的元素装包后赋值给c
a,b,*c = t4
print(a,b,c)
print(c)
print(*c)
输出：
1 2 [3, 4, 5]
[3, 4, 5]
3 4 5

针对字典的操作

list可以转成字典，但前提是列表中元素都要成对出现

dict3 = dict([('name','杨超越'),('weight',45)])
print(dict3)
输出：{'name': '杨超越', 'weight': 45}


dict4 = {}
dict4['name'] = '虞书欣'
dict4['weight'] = 43
print(dict4)
输出：{'name': '虞书欣', 'weight': 43}

字典中item的是干啥的：可以理解为列表的实例化，为读取和调用做准备

#字典里的函数 items()  keys() values()
dict5 = {'杨超越':165,'虞书欣':166,'上官喜爱':164}
print(dict5.items())
for key,value in dict5.items():
    if value > 165:
        print(key)
        
输出：
dict_items([('杨超越', 165), ('虞书欣', 166), ('上官喜爱', 164)])
虞书欣

#values() 取出字典中所有的值,保存到列表中
results = dict5.values()
print(results)
结果：dict_values([165, 166, 164])

字典中的get函数：
print(dict5.get(‘赵小棠’,170)) #如果能够取到值，则返回字典中的值，否则返回默认值170

针对类

定义一个类Animals:
(1)init()定义构造函数，与其他面向对象语言不同的是，Python语言中，会明确地把代表自身实例的self作为第一个参数传入
(2)创建一个实例化对象 cat，init()方法接收参数
(3)使用点号 . 来访问对象的属性。

class Animal:

    def __init__(self,name):
        self.name = name
        print('动物名称实例化')
    def eat(self):
        print(self.name +'要吃东西啦！')
    def drink(self):
        print(self.name +'要喝水啦！')

cat =  Animal('miaomiao')
print(cat.name)
cat.eat()
cat.drink()

输出：
动物名称实例化
miaomiao
miaomiao要吃东西啦！
miaomiao要喝水啦！

针对JSON

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式，易于人阅读和编写。
json.dumps 用于将 Python 对象编码成 JSON 字符串。

import json
data = [ { 'b' : 2, 'd' : 4, 'a' : 1, 'c' : 3, 'e' : 5 } ]
json = json.dumps(data)
print(json)
输出：[{"b": 2, "d": 4, "a": 1, "c": 3, "e": 5}]

为了提高可读性，dumps方法提供了一些可选的参数。
sort_keys=True表示按照字典排序(a到z)输出。
indent参数，代表缩进的位数
separators参数的作用是去掉,和:后面的空格，传输过程中数据越精简越好

json = json.dumps(data, sort_keys=True, indent=4,separators=(',', ':'))
输出：{
        "a":1,
        "b":2,
        "c":3,
        "d":4,
        "e":5
    }

json.loads 用于解码 JSON 数据。该函数返回 Python 字段的数据类型。

import json
jsonData = '{"a":1,"b":2,"c":3,"d":4,"e":5}'
text = json.loads(jsonData)  #将string转换为dict
print(text)
输出：{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}

try/except语句用来检测try语句块中的错误，从而让except语句捕获异常信息并处理。finally中的内容，退出try时总会执行

常见linux命令

!ls /home ls 命令显示当前目录的内容 常见linux命令大全
!ls ./ 上一节目录
ls -l -l：以长格式显示目录下的内容列表。
!pwd 以绝对路径的方式显示用户当前工作目录
cp 复制文件或目录

将文件file复制到目录/usr/men/tmp下，并改名为file1
cp file /usr/men/tmp/file1

mv 移动文件与目录，或修改文件与目录的名称

!mv /home/aistudio/work/test_copy.txt /home/aistudio/data/   #将txt文件移动到data文件夹里
mv ex3 new1      #将文件ex3改名为new1

rm 移除文件或目录

!rm /home/aistudio/data/test_copy.txt

很多大型文件或者数据从服务器上传或者下载的时候都需要打包和压缩解压，这时候知道压缩和解压的各种命令是很有必要的。
常见的压缩文件后缀名有.tar.gz，.gz，和.zip，下面来看看在Linux上它们分别的解压和压缩命令。
gzip:
linux压缩文件中最常见的后缀名即为.gz，gzip是用来压缩和解压.gz文件的命令。
常用参数:
-d或–decompress或–uncompress：解压文件；
-r或–recursive：递归压缩指定文件夹下的文件（该文件夹下的所有文件被压缩成单独的.gz文件）；
-v或–verbose：显示指令执行过程。
注：gzip命令只能压缩单个文件，而不能把一个文件夹压缩成一个文件（与打包命令的区别）。

#会将文件压缩为文件 test.txt.gz，原来的文件则没有了，解压缩也一样
!gzip /home/aistudio/work/test.txt

解压：

!gzip -d /home/aistudio/test.gz

tar:
tar本身是一个打包命令，用来打包或者解包后缀名为.tar。配合参数可同时实现打包和压缩。
常用参数:
-c或–create：建立新的备份文件；
-x或–extract或–get：从备份文件中还原文件；
-v：显示指令执行过程；
-f或–file：指定备份文件；
-C：指定目的目录；
-z：通过gzip指令处理备份文件；
-j：通过bzip2指令处理备份文件。
最常用的是将tar命令与gzip命令组合起来，直接对文件夹先打包后压缩：

!tar -zcvf /home/aistudio/work/test.tar.gz /home/aistudio/work/test.txt
!tar -zxvf /home/aistudio/work/test.tar.gz

zip和unzip
zip命令和unzip命令用在在Linux上处理.zip的压缩文件。
常用参数
zip:
-v：显示指令执行过程；
-m：不保留原文件；
-r：递归处理。

unzip:
-v：显示指令执行过程；
-d：解压到指定目录。

!zip -r /home/aistudio/work/test.zip /home/aistudio/work/test.txt
!unzip  /home/aistudio/work/test.zip

第三课

第三课即爬虫，爬虫的过程，就是模仿浏览器的行为，往目标站点发送请求，接收服务器的响应数据，提取需要的信息，并进行保存的过程。 Python为爬虫的实现提供了工具:requests模块、BeautifulSoup库
上网的全过程:
普通用户:
打开浏览器 --> 往目标站点发送请求 --> 接收响应数据 --> 渲染到页面上。
爬虫程序:
模拟浏览器 --> 往目标站点发送请求 --> 接收响应数据 --> 提取有用的数据 --> 保存到本地/数据库。

爬虫的过程：

1.发送请求（requests模块）requests.get(url)可以发送一个http get请求，返回服务器响应内容
2.获取响应数据（服务器返回）
3.解析并提取数据（BeautifulSoup查找或者re正则）
BeautifulSoup 是一个可以从HTML或XML文件中提取数据的Python库。BeautifulSoup官网网址BeautifulSoup支持Python标准库中的HTML解析器,还支持一些第三方的解析器,其中一个是 lxml。
BeautifulSoup(markup, “html.parser”)或者BeautifulSoup(markup, “lxml”)，推荐使用lxml作为解析器,因为效率更高。
4.保存数据

安装如下：

#!pip install beautifulsoup4 -t /home/aistudio/external-libraries
#!pip install lxml -t /home/aistudio/external-libraries

# 同时添加如下代码, 这样每次环境(kernel)启动的时候只要运行下方代码即可:
import sys
sys.path.append('/home/aistudio/external-libraries')

备注：以下的信息不是完整的程序，完整程序可参照链接link
本次主要是爬取百度百科中《青春有你2》中参赛选手信息，返回html
具体流程：先requests.get得到response（http请求）->BeautifulSoup解析

import json
import re
import requests
import datetime
from bs4 import BeautifulSoup
import os

#获取当天的日期,并进行格式化,用于后面文件命名，格式:20200420
today = datetime.date.today().strftime('%Y%m%d')    

def crawl_wiki_data():
    """
    爬取百度百科中《青春有你2》中参赛选手信息，返回html
    """
    headers = { 
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
    }　＃目的是预防反爬虫程序，模仿浏览器的请求行为
    url='https://baike.baidu.com/item/青春有你第二季'                         

    try:
        response = requests.get(url,headers=headers)
        print(response.status_code)

        #将一段文档传入BeautifulSoup的构造方法,就能得到一个文档的对象, 可以传入一段字符串
        soup = BeautifulSoup(response.text,'lxml')  #lxml解析器解析
        
        #返回的是class为table-view log-set-param的所有标签
        tables = soup.find_all('table',{'class':'table-view log-set-param'})

        crawl_table_title ="参赛学员"for table in  tables:#对当前节点前面的标签和字符串进行查找
            table_titles = table.find_previous('div').find_all('h3')for title in table_titles:if(crawl_table_title in title):return table       
    except Exception as e:print(e)网页的前端内容如下：
 
 需要爬取的信息位置即下图的tbody下的各个tr ，但有很多
 

                   
            
            
                
                    
        
 
  

 解析的内容：
def parse_wiki_data(table_html):
    '''
    从百度百科返回的html中解析得到选手信息，以当前日期作为文件名，存JSON文件,保存到work目录下
    '''
    bs = BeautifulSoup(str(table_html),'lxml')  #先解析
    all_trs = bs.find_all('tr')  #是一个列表

    error_list = ['\'','\"']  #引号和单引号

    stars = []

    for tr in all_trs[1:]: #爬回来的第一行是标题，所以从第二行开始
         all_tds = tr.find_all('td')   #td代表每个单元格

         star = {}

         #姓名
         star["name"]=all_tds[0].text
         #个人百度百科链接
         star["link"]= 'https://baike.baidu.com' + all_tds[0].find('a').get('href')
         #籍贯
         star["zone"]=all_tds[1].text
         #星座
         star["constellation"]=all_tds[2].text
         #身高
         star["height"]=all_tds[3].text
         #体重
         star["weight"]= all_tds[4].text

         #花语,去除掉花语中的单引号或双引号
         flower_word = all_tds[5].text
         for c in flower_word:
             if  c in error_list:
                 flower_word=flower_word.replace(c,'')  #将引号和单引号替换 为空格
         star["flower_word"]=flower_word 
         
         #公司
         if not all_tds[6].find('a') is  None:
             star["company"]= all_tds[6].find('a').text  #有链接的取链接
         else:
             star["company"]= all_tds[6].text   #没链接的取值

         stars.append(star)

    json_data = json.loads(str(stars).replace("\'","\""))   
    with open('work/' + today + '.json', 'w', encoding='UTF-8') as f:
        json.dump(json_data, f, ensure_ascii=False)   #汉字形式存储

 存储的结果：
 
def crawl_pic_urls():
    '''
    爬取每个选手的百度百科图片，并保存
    ''' 
    with open('work/'+ today + '.json', 'r', encoding='UTF-8') as file:
         json_array = json.loads(file.read())

    headers = { 
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36' 
     }

    for star in json_array:

        name = star['name']
        link = star['link']

        #请在以下完成对每个选手图片的爬取，将所有图片url存储在一个列表pic_urls中
        #为了获取选手的图像，从个人的百度百科发送get请求
        response = requests.get(link ,headers=headers)
        #将文档传入BeautifulSoup,得到一个文档的对象
        bs = BeautifulSoup(response.text,'lxml')
        #从页面中选择链接，链接指向图片
        pic_list_url = bs.select('.summary-pic a')[0].get('href')
        pic_list_url = 'https://baike.baidu.com'+pic_list_url
        #向链接发送get请求
        pic_list_response = requests.get(pic_list_url,headers=headers)
        #图片列表解析并获得所有图片链接
        bs = BeautifulSoup(pic_list_response.text,'lxml')
        pic_list_html = bs.select('.pic-list img')

        pic_urls =[]
        for pic_html in pic_list_html:
            pic_url = pic_html.get('src')
            pic_urls.append(pic_url)
        #图片链接列表pic_urls，下载图片，保存在name文件夹
        down_pic(name,pic_urls)
        #！！！根据图片链接列表pic_urls, 下载所有图片，保存在以name命名的文件夹中！！！
        down_pic(name,pic_urls)
下载（f.write(pic.content)）指定文件到指定路径下
def down_pic(name,pic_urls):
    '''
    根据图片链接列表pic_urls, 下载所有图片，保存在以name命名的文件夹中,
    '''
    path = 'work/'+'pics/'+name+'/'

    if not os.path.exists(path):
      os.makedirs(path)

    for i, pic_url in enumerate(pic_urls):
        try:
            pic = requests.get(pic_url, timeout=15)
            string = str(i + 1) + '.jpg'
            with open(path+string, 'wb') as f:
                f.write(pic.content)
                print('成功下载第%s张图片: %s' % (str(i + 1), str(pic_url)))
        except Exception as e:
            print('下载第%s张图片时失败: %s' % (str(i + 1), str(pic_url)))
            print(e)
            continue
然后可以在如下文件夹中得到以名字命名的文件，里面放置爬到的图片
 
 最后再加一个打印信息的功能：
def show_pic_path(path):
    '''
    遍历所爬取的每张图片，并打印所有图片的绝对路径
    '''
    pic_num = 0
    for (dirpath,dirnames,filenames) in os.walk(path):
        for filename in filenames:
           pic_num += 1
           print("第%d张照片：%s" % (pic_num,os.path.join(dirpath,filename)))           
    print("共爬取《青春有你2》选手的%d照片" % pic_num)
所以，爬取指定文件的具体流程（前向）放在main下：
if __name__ == '__main__':

     #爬取百度百科中《青春有你2》中参赛选手信息，返回html
     html = crawl_wiki_data()

     #解析html,得到选手信息，保存为json文件
     parse_wiki_data(html)

     #从每个选手的百度百科页面上爬取图片,并保存
     crawl_pic_urls()

     #打印所爬取的选手图片路径
     show_pic_path('/home/aistudio/work/pics/')

     print("所有信息爬取完成！")
总结：主要还是熟悉:requests模块、BeautifulSoup库的调用和解析过程，同时去网站的源码页面自己找找需要的关键字很重要，一定要找准确，最后就是返回html，保存为json文件，爬取图片,并保存，打印所爬取的选手图片路径的过程
第四天
主要是介绍一些深度学习常用的库，这个我确实经常在用，所以只总结自己之前忽略的
 numpy是Python科学计算库的基础。包含了强大的N维数组对象和向量运算。
 pandas是建立在numpy基础上的高效数据分析处理库，是Python的重要数据分析库。
 Matplotlib是一个主要用于绘制二维图形的Python库。用途：绘图、可视化
 PIL库是一个具有强大图像处理能力的第三方库。用途：图像处理
DataFrame是一个表格型的数据结构，类似于Excel或sql表
 它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）
 DataFrame既有行索引也有列索引，它可以被看做由Series组成的字典（共用同一个索引）
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'], 'year': [2000, 2001, 2002, 2001, 2002], 'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
frame = pd.DataFrame(data)
print(frame)
输出：
    state  year  pop
0    Ohio  2000  1.5
1    Ohio  2001  1.7
2    Ohio  2002  3.6
3  Nevada  2001  2.4
4  Nevada  2002  2.9

d = {'one': pd.Series([1., 2., 3.], index=['a', 'b', 'c']),
     'two': pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
print(pd.DataFrame(d))
结果：
   one  two
a  1.0  1.0
b  2.0  2.0
c  3.0  3.0
d  NaN  4.0
PIL库图片增强的操作：
from PIL import Image
import matplotlib.pyplot as plt
#显示matplotlib生成的图形
%matplotlib inline

#读取图片
img = Image.open('/home/aistudio/street.jpg') 

#显示图片
#img.show() #自动调用计算机上显示图片的工具,aistudio没有直接相连windows的图片工具，所以不能直接show()

plt.imshow(img)  
plt.show(img)   

#获得图像的模式
img_mode = img.mode
print(img_mode)

width,height = img.size
print(width,height)
图片旋转：img_rotate = img.rotate(45)

剪切：
#打开图片
img1 = Image.open('/home/aistudio/work/yushuxin.jpg') 
#剪切 crop()四个参数分别是：(左上角点的x坐标，左上角点的y坐标，右下角点的x坐标，右下角点的y坐标)
img1_crop_result = img1.crop((126,0,381,249))
#保存图片
img1_crop_result.save('/home/aistudio/work/yushuxin_crop_result.jpg')

缩放：
img2 = Image.open('/home/aistudio/work/yushuxin.jpg') 
width,height = img2.size
#缩放
img2_resize_result = img2.resize((int(width*0.6),int(height*0.6)),Image.ANTIALIAS)
print(img2_resize_result.size)
#保存图片
img2_resize_result.save('/home/aistudio/work/yushuxin_resize_result.jpg')

镜像效果：左右旋转、上下旋转：
#打开图片
img3 = Image.open('/home/aistudio/work/yushuxin.jpg') 
#左右镜像
img3_lr = img3.transpose(Image.FLIP_LEFT_RIGHT)
#展示左右镜像图片
plt.imshow(img3_lr)  
plt.show(img3_lr)   
#上下镜像
img3_bt = img3.transpose(Image.FLIP_TOP_BOTTOM)
#展示上下镜像图片
plt.imshow(img3_bt)  
plt.show(img3_bt)  
Matplotlib库绘图
import matplotlib.pyplot as plt
import numpy as np 
#显示matplotlib生成的图形
%matplotlib inline
x = np.linspace(-1,1,50) #等差数列
y = 2*x + 1
#传入x,y,通过plot()绘制出折线图 
plt.plot(x,y)
#显示图形
plt.show()

折线图：
l1, = plt.plot(x,y1,color='red',linewidth=1)
l2, = plt.plot(x,y2,color='blue',linewidth=5)
plt.legend(handles=[l1,l2],labels=['aa','bb'],loc='best')
plt.xlabel('x')
plt.ylabel('y')
#plt.xlim((0,1))  #x轴只截取一段进行显示
#plt.ylim((0,1))  #y轴只截取一段进行显示
plt.show()

柱状图：
x = np.arange(10)
y = 2**x+10
plt.bar(x,y,facecolor='#9999ff',edgecolor='white')
for ax,ay in zip(x,y):
    plt.text(ax,ay,'%.1f' % ay,ha='center',va='bottom')
plt.show()

散点图：
#dots1 = np.array([2,3,4,5,6])
#dots2 = np.array([2,3,4,5,6])
dots1 =np.random.rand(50)
dots2 =np.random.rand(50)
plt.scatter(dots1,dots2,c='red',alpha=0.5) #c表示颜色，alpha表示透明度
plt.show()
下面是本次课程一些作业的中需要注意的点，我这里总结的更加注重数据清洗这里，具体画饼图的操作我之前在cv的课程里已经掌握
matplotlib绘图时需要下载中文的字体：
#下载中文字体
!wget https://mydueros.cdn.bcebos.com/font/simhei.ttf
#将字体文件复制到matplotlib字体路径
!cp simhei.ttf /opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/mpl-data/fonts/ttf/
#一般只需要将字体文件复制到系统字体目录下即可，但是在aistudio上该路径没有写权限，所以此方法不能用
#!cp simhei.ttf /usr/share/fonts/
#创建系统字体文件路径
!mkdir .fonts
#复制文件到该路径
!cp simhei.ttf .fonts/
!rm -rf .cache/matplotlib
import matplotlib.pyplot as plt
import numpy as np 
import json
import matplotlib.font_manager as font_manager

#显示matplotlib生成的图形
%matplotlib inline

with open('data/data31557/20200422.json', 'r', encoding='UTF-8') as file:
         json_array = json.loads(file.read())

#绘制小姐姐区域分布柱状图,x轴为地区，y轴为该区域的小姐姐数量

zones = []
for star in json_array:
    zone = star['zone']
    zones.append(zone)
print(len(zones))
print(zones)


zone_list = []
count_list = []

for zone in zones:
    if zone not in zone_list:
        count = zones.count(zone)
        zone_list.append(zone)
        count_list.append(count)

print(zone_list)
print(count_list)

#设置显示中文
plt.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体

plt.figure(figsize=(20,15))

plt.bar(range(len(count_list)), count_list,color='r',tick_label=zone_list,facecolor='#9999ff',edgecolor='white')

#这里是调节横坐标的倾斜度，rotation是度数，以及设置刻度字体大小
plt.xticks(rotation=45,fontsize=20)
plt.yticks(fontsize=20)

plt.legend()
plt.title('''《青春有你2》参赛选手''',fontsize = 24)
plt.savefig('/home/aistudio/work/result/bar_result.jpg')
plt.show()
结果：
['中国湖北', '中国四川', '中国山东', '中国浙江', '中国山东', '中国台湾', '中国陕西', '中国广东', '中国黑龙江', '中国上海', '中国四川', '中国山东', '中国安徽', '中国安徽', '中国安徽', '中国北京', '中国贵州', '中国吉林', '中国四川', '中国四川', '中国江苏', '中国山东', '中国山东', '中国山东', '中国山东', '中国江苏', '中国四川', '中国山东', '中国山东', '中国广东', '中国浙江', '中国河南', '中国安徽', '中国河南', '中国北京', '中国北京', '马来西亚', '中国湖北', '中国四川', '中国天津', '中国黑龙江', '中国四川', '中国陕西', '中国辽宁', '中国湖南', '中国上海', '中国贵州', '中国山东', '中国湖北', '中国黑龙江', '中国黑龙江', '中国上海', '中国浙江', '中国湖南', '中国台湾', '中国台湾', '中国台湾', '中国台湾', '中国山东', '中国北京', '中国北京', '中国浙江', '中国河南', '中国河南', '中国福建', '中国河南', '中国北京', '中国山东', '中国四川', '中国安徽', '中国河南', '中国四川', '中国湖北', '中国四川', '中国陕西', '中国湖南', '中国四川', '中国台湾', '中国湖北', '中国广西', '中国江西', '中国湖南', '中国湖北', '中国北京', '中国陕西', '中国上海', '中国四川', '中国山东', '中国辽宁', '中国辽宁', '中国台湾', '中国浙江', '中国北京', '中国黑龙江', '中国北京', '中国安徽', '中国河北', '马来西亚', '中国四川', '中国湖南', '中国台湾', '中国广东', '中国上海', '中国四川', '日本', '中国辽宁', '中国黑龙江', '中国浙江', '中国台湾']
['中国湖北', '中国四川', '中国山东', '中国浙江', '中国台湾', '中国陕西', '中国广东', '中国黑龙江', '中国上海', '中国安徽', '中国北京', '中国贵州', '中国吉林', '中国江苏', '中国河南', '马来西亚', '中国天津', '中国辽宁', '中国湖南', '中国福建', '中国广西', '中国江西', '中国河北', '日本']
[6, 14, 13, 6, 9, 4, 3, 6, 5, 6, 9, 2, 1, 2, 6, 2, 1, 4, 5, 1, 1, 1, 1, 1]
第五天
今晚主要讲的是PaddleHub就是为了解决对深度学习模型的需求而开发的工具。基于飞桨领先的核心框架，精选效果优秀的算法，提供了百亿级大数据训练的预训练模型，方便用户不用花费大量精力从头开始训练一个模型。说白了就是更加集成和高级的深度学习API.
 最主要的优势下面两个ppt很明了：
 
 
 然后本节课给了几个案例，可以记录一下
情感分析
情感倾向分析（Sentiment Classification，简称Senta）针对带有主观描述的中文文本，可自动判断该文本的情感极性类别并给出相应的置信度，能够帮助企业理解用户消费习惯、分析热点话题和危机舆情监控，为企业提供有利的决策支持。
#安装情感分析模型
!hub install senta_lstm==1.1.0
可以得到如下的结果：
 
口罩检测
PyramidBox-Lite是基于2018年百度发表于计算机视觉顶级会议ECCV 2018的论文PyramidBox而研发的轻量级模型，模型基于主干网络FaceBoxes，对于光照、口罩遮挡、表情变化、尺度变化等常见问题具有很强的鲁棒性。该PaddleHub Module基于WIDER FACE数据集和百度自采人脸数据集进行训练，支持预测，可用于检测人脸是否佩戴口罩。
#安装口罩检测模型
!hub install pyramidbox_lite_mobile_mask==1.1.0
对这个图像检测：
 
!hub run pyramidbox_lite_mobile_mask --input_path "data/data31681/test.jpeg"

 
 
 其他cv方面的举例
#人像抠图
import paddlehub as hub
humanseg = hub.Module(name="deeplabv3p_xception65_humanseg")
import matplotlib.pyplot as plt 
import matplotlib.image as mpimg 
path = ["data/data31681/test.jpeg"]
results = humanseg.segmentation(data={"image":path})
#预测结果展示
test_img_path = result["processed"]
img = mpimg.imread(test_img_path)
#展示预测结果图片
plt.figure(figsize=(10,10))
plt.imshow(img) 
plt.axis('off') 
plt.show()
#风格迁移
import paddlehub as hub
import cv2
stylepro_artistic = hub.Module(name="stylepro_artistic")

results = stylepro_artistic.style_transfer(images=[{
        'content': cv2.imread("data/data31681/main.png"),
        'styles': [cv2.imread("data/data31681/style1.png")]}],
        alpha = 1.0,
        visualization = True)
        # 原图展示
test_img_path = "data/data31681/main.png"
img = mpimg.imread(test_img_path)

plt.figure(figsize=(10,10))
plt.imshow(img) 
plt.axis('off') 
plt.show()

#原图展示
test_img_path = "data/data31681/style1.png"
img = mpimg.imread(test_img_path)

plt.figure(figsize=(10,10))
plt.imshow(img) 
plt.axis('off') 
plt.show()
#预测结果展示
test_img_path = "transfer_result/ndarray_1587809892.1425676.jpg"
img = mpimg.imread(test_img_path)

#展示预测结果图片
plt.figure(figsize=(10,10))
plt.imshow(img) 
plt.axis('off') 
plt.show()

 其他NLP方面的举例
 
 总结：现拿现用，开箱即用，直接出结果，毕设和作业利器
涉及到本次的作业，是个图像分类的任务
下面列举关键步骤：
 加载预训练模型
 接下来我们要在PaddleHub中选择合适的预训练模型来Finetune，由于是图像分类任务，因此我们使用经典的ResNet-50作为预训练模型。PaddleHub提供了丰富的图像分类预训练模型，包括了最新的神经网络架构搜索类的PNASNet，我们推荐您尝试不同的预训练模型来获得更好的性能。
module = hub.Module(name="resnet_v2_50_imagenet")
然后做了一个很简单的二分类任务：
 加载数据 这里要着重说明下，利用PaddleHub提供的预训练模型进行具体任务的Fine-tune。您只需要对自定义数据进行相应的预处理，随后输入预训练模型中，即可得到相应的结果。
 那么他的结构如下：
 ├─data: 数据目录 
   ├─train_list.txt：训练集数据列表 
   ├─test_list.txt：测试集数据列表 
   ├─validate_list.txt：验证集数据列表 
 ├─label_list.txt：标签列表 
   └─……
具体需要在微调时需要遵循的树形结构参见链接: 预训练结构demo.
 本例中，二分类问题，结构如下：
 
from paddlehub.dataset.base_cv_dataset import BaseCVDataset
   
class DemoDataset(BaseCVDataset):	
   def __init__(self):	
       # 数据集存放位置
       
       self.dataset_dir = "data"
       super(DemoDataset, self).__init__(
           base_path=self.dataset_dir,
           train_list_file="train_list.txt",
           validate_list_file="validate_list.txt",
           test_list_file="test_list.txt",
           #predict_file="predict_list.txt",
           label_list_file="label_list.txt",
           )
dataset = DemoDataset()
生成数据读取器
 接着生成一个图像分类的reader，reader负责将dataset的数据进行预处理，接着以特定格式组织并输入给模型进行训练。
 当我们生成一个图像分类的reader时，需要指定输入图片的大小
data_reader = hub.reader.ImageClassificationReader(
    image_width=module.get_expected_image_width(),
    image_height=module.get_expected_image_height(),
    images_mean=module.get_pretrained_images_mean(),
    images_std=module.get_pretrained_images_std(),
    dataset=dataset)
    输出：
    [2020-04-19 22:38:30,752] [    INFO] - Dataset label map = {'许佳琪': 0, '虞书欣': 1}
配置参数
 配置策略
 在进行Finetune前，我们可以设置一些运行时的配置，例如如下代码中的配置，表示：
 use_cuda：设置为False表示使用CPU进行训练。如果您本机支持GPU，且安装的是GPU版本的PaddlePaddle，我们建议您将这个选项设置为True；
 epoch：迭代轮数；
 batch_size：每次训练的时候，给模型输入的每批数据大小为32，模型训练时能够并行处理批数据，因此batch_size越大，训练的效率越高，但是同时带来了内存的负荷，过大的batch_size可能导致内存不足而无法训练，因此选择一个合适的batch_size是很重要的一步；
 log_interval：每隔10 step打印一次训练日志；
 eval_interval：每隔50 step在验证集上进行一次性能评估；
 checkpoint_dir：将训练的参数和数据保存到cv_finetune_turtorial_demo目录中； 
 strategy：使用DefaultFinetuneStrategy策略进行finetune；
 同时PaddleHub提供了许多优化策略，如AdamWeightDecayStrategy、ULMFiTStrategy、DefaultFinetuneStrategy等，详细信息:Strategy类封装了一系列适用于迁移学习的Fine-tuning策略。Strategy包含了对预训练参数使用什么学习率变化策略，使用哪种类型的优化器，使用什么类型的正则化等。
config = hub.RunConfig(
    use_cuda=True,                              #是否使用GPU训练，默认为False；
    num_epoch=3,                                #Fine-tune的轮数；
    checkpoint_dir="cv_finetune_turtorial_demo",#模型checkpoint保存路径, 若用户没有指定，程序会自动生成；
    batch_size=3,                              #训练的批大小，如果使用GPU，请根据实际情况调整batch_size；
    eval_interval=10,                           #模型评估的间隔，默认每100个step评估一次验证集；
    strategy=hub.finetune.strategy.DefaultFinetuneStrategy())  #Fine-tune优化策略；
组建Finetune Task
 其实就是由于该数据设置是一个二分类的任务，而我们下载的分类module是在ImageNet数据集上训练的千分类模型，所以我们需要对模型进行简单的微调，把模型改造为一个二分类模型：
 获取module的上下文环境，包括输入和输出的变量，以及Paddle Program；
 从输出变量中找到特征图提取层feature_map；
 在feature_map后面接入一个全连接层，生成Task；
input_dict, output_dict, program = module.context(trainable=True)
img = input_dict["image"]
feature_map = output_dict["feature_map"]
feed_list = [img.name]

task = hub.ImageClassifierTask(
    data_reader=data_reader,
    feed_list=feed_list,
    feature=feature_map,
    num_classes=dataset.num_labels,
    config=config)
开始Finetune
 我们选择finetune_and_eval接口来进行模型训练，这个接口在finetune的过程中，会周期性的进行模型效果的评估，以便我们了解整个训练过程的性能变化
run_states = task.finetune_and_eval()
预测
 当Finetune完成后，我们使用模型来进行预测，先通过以下命令来获取测试的图片
import numpy as np
import matplotlib.pyplot as plt 
import matplotlib.image as mpimg

data = ["data/xu/16.jpg","data/yu/16.jpg"]

label_map = dataset.label_dict()
index = 0
run_states = task.predict(data=data)  #得到预测结果
results = [run_state.run_results for run_state in run_states]

for batch_result in results:
    print(batch_result)
    batch_result = np.argmax(batch_result, axis=2)[0]
    print(batch_result)
    for result in batch_result:
        index += 1
        result = label_map[result]
        print("input %i is %s, and the predict result is %s" %
              (index, data[index - 1], result))

img = mpimg.imread(data[0]) 
img1 = mpimg.imread(data[1]) 
plt.figure(figsize=(10,10))
plt.subplot(1,2,1)
plt.imshow(img)
plt.axis('off') 
plt.subplot(1,2,2)
plt.imshow(img1)
plt.axis('off') 
plt.show()
print("             input1 许佳琪                             input2 虞书欣")
结果;
 
 当然作为另一个作业，主要还是其实是如何按照
 ├─data: 数据目录 
   ├─train_list.txt：训练集数据列表 
   ├─test_list.txt：测试集数据列表 
   ├─validate_list.txt：验证集数据列表 
 ├─label_list.txt：标签列表 
   └─…… 
   这个结构来制作自己的数据集，然后大的话又涉及如何上传等等
   在最终的预测结果显示和上述例子不同，其余一模一样
import numpy as np
import matplotlib.pyplot as plt 
import matplotlib.image as mpimg

with open("dataset/test_list.txt","r") as f:
    filepath = f.readlines()

data = [filepath[0].split(" ")[0],filepath[1].split(" ")[0],filepath[2].split(" ")[0],filepath[3].split(" ")[0],filepath[4].split(" ")[0]]

label_map = dataset.label_dict()
index = 0
run_states = task.predict(data=data)
results = [run_state.run_results for run_state in run_states]

for batch_result in results:
    print(batch_result)
    batch_result = np.argmax(batch_result, axis=2)[0]
    print(batch_result)
    for result in batch_result:
        index += 1
        result = label_map[result]
        print("input %i is %s, and the predict result is %s" %
              (index, data[index - 1], result))
结果如下：
 
总结
主要还是了解hub在预训练到微调这期间的步骤和一些集成 的API ,然后NLP方面的还需去社区去逛一逛，有时间去用一下
最后一天及大作业
这次的课我是补的录播。通过本次课程，主要了解的一下方面，首先就是Esaydl,在视屏的讲解中这个开发平台追求的是傻瓜式开发，可能需要做的就是标注少量数据集，根据官方文档，智能标注的模式下只要标注30%左右就可以保证精度，但目前大部分还是在cv领域，这个平台也是刚开放，相信后面会有更多的补充和优化。老师在视屏中搭建了一个3分类目标检测的全部过程包括云端的部署和调用，我去官方的文档也去看了看，直接的云部署的demo示例是有的，但感觉还是处于学生试验显示利器的阶段。直到看到下面的工业部署，感觉以后结合自己的课题在金属瑕疵检测方面可能要采取这个方案，又刚好是cv检测（现在发现aistudio中的项目对cv模型的搭建和复现很多）所以先在这里码着，回所可能要用到（当然是收费的 )
 在线调用API、离线SDK方式参考.
 
 
这次的大作业
这次的大作业我并没有尝试去去复现，主要还是在视屏中参照老师的demo着重去理解了下爬取网站评论的过程（这次的爬虫我觉得学会了里面的数据清理的过程，文本类的爬虫和清洗就么得问题了）
 首先按照老师所说，找到类似这种不能一次性爬取很多需要点击查看的过程，通过在Network里实时观察发现是根据将last id不断更新再当做请求的过程访问新的评论，即get_commend_action的操作，得到的头文件如下：
 Request URL: https://sns-comment.iqiyi.com/v3/comment/get_comments.action?agent_type=118&agent_version=9.11.5&authcookie=null&business_type=17&content_id=15068699100&hot_size=0&last_id=240780654021&page=&page_size=20&types=time&callback=jsonp_1587976708193_50432
 再依据群里讨论所示，把请求url最后的callback参数去掉，就得到标准的json数据了
 
 
得到json文件对其进行解析，这里的url+=str(lastId)就是之前所说的循环将last id不断更新再当做请求的过程，分开data下的conments字段，如果key是content字段的就是评论保留下来。
 
def saveMovieInfoToFile(lastId,arr):
    '''
    解析json数据，获取评论
    参数  lastId:最后一条评论ID  arr:存放文本的list
    :return: 新的lastId
    '''
    url ="https://sns-comment.iqiyi.com/v3/comment/get_comments.action?agent_type=118&agent_version=9.11.5&business_type=17&content_id=15068699100&page=&page_size=10&types=time&last_id="
    url += str(lastId)
    responesTxt = getMovieinfo(url)
    responesJson = json.loads(responesTxt)
    comments = responesJson['data']['comments']
    for val in comments:
        if 'content' in val.keys():
            print(val['content'])
            arr.append(val['content'])
        lastId = str(val['id'])
    return lastId
然后很多特殊字符，比如什么表情或者颜文字什么的需要去除，这里借鉴了一位大佬写的（参考：https://blog.csdn.net/yinyiyu/article/details/105778673）
 （其实可以在网上查）用的是正则的规则，re模块
 
    s = re.sub(r"| |\t|\r","",content)
    s = re.sub(r"\n","",s)
    s = re.sub(r"\*","\\*",s)
    s = re.sub("[^\u4e00-\u9fa5^a-z^A-Z^0-9]","",s)
    s = re.sub("[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+","", s)
    s = re.sub("[a-zA-Z]","",s)
    s = re.sub("^d+(\.\d+)?$","",s)
然后就是对评论进行分词，用的是jieba分词，因为后面要做一个词云，还要做次频统计，和我想研究的不太相关，所以这里就大致的了解下即可：
 
 这里的add_text是自定义的，也可以没有，网上也可以下载，目的是将一些网络新词加到分词的规则里面，刚开始觉得不重要，后来发现在群里有人反映了这么一个问题，所以还是有作用的
 
 
 再接着这一步的数据清洗还是可以学习的，就是在词频统计的时候，一些，的，了，哈。。。这样类似的词在评论中很多，但我们的关注点又不是这里，所以设置停用词：根据自己设置的一个txt文件设置为列表。去除停用词的方法很简单if word not in stopwords，就.get()
 
 然后进行词频的topk统计和画图：
 
 这里涉及到中文字体在matlib中的显示，里面有些坑，可以参加这个博客：
 https://blog.csdn.net/qinqinbaobei23344/article/details/105783127
 字体下载相关问题，报403错误，可以自己手动下载相关字体，然后进行上传
#!wget https://mydueros.cdn.bcebos.com/font/simhei.ttf # 下载中文字体
##创建字体目录fonts
!mkdir .fonts
##复制字体文件到该路径
!cp simhei.ttf .fonts/
这里包括路径的设置和查看隐藏文件 !ls -a等注意事项可以看这个;
 https://blog.csdn.net/yinyiyu/article/details/105778673
#设置显示中文
    matplotlib.rcParams['font.sans-serif']=['simhei']
    matplotlib.rcParams['axes.unicode_minus']=False
然后就是一个词云的显示和保存图片，这里不是太感兴趣，就略过不做分析：
 
 可以大概看看结果的样子:
 
 最后这个老师又一次调用了hub里的敏感词分析模型porn_detection_lstm对评论做了分析：
 
porn_detection_lstm = hub.Module(name="porn_detection_lstm")
f = open('aqy.txt','r',encoding='UTF-8')
for line in f:
    if len(line.strip()) == 1:  #判断评论长度是否为1
        continue
    else:
        test_text.append(line)
f.close()
显示的结果类似下图：
 
 最后将前面的类放在main函数里顺序调用;
 
总结
至此，这次课程所有我想来接的学习的就结束了，收获还是颇丰，后来的目标还是多在paddle的官网上多看看教程和示例项目，收获会很多。

                    
                        
                        
                             
                        
                        
                        
                            
                        
                        
                        
                            
                        
                    
                

        你可能感兴趣的:(平台实操)
        
            
                
                    男士护肤品哪个牌子好？十大男士护肤品排行榜
                        高省APP珊珊

                        很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
                    
                    日更50天有什么收益？
                        星湾二宝

                        坚持在平台上日更50天了，平台也为我生成了日更50天徽章，小开心一下这份坚持。日更50天徽章那坚持50天都有哪些收益呢？收益一，就是最直观的那些钻和贝，我这边确实不太高，但是这些贝足够支撑我保持会员的资格，能够在发文的时候帮助友友们去除广告，方便阅读。钻和贝收益二，文章的收获，日更50天，坚持写作3.7万文字，书写的文字也从开始的流水账/碎碎念逐渐加入自己的思考和观点。以前，一个念头会一晃而过，如
                    
                    深入解析JVM工作原理：从字节码到机器指令的全过程
                        

                        一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
                    
                    企业级区块链平台Hyperchain核心原理剖析
                        boyedu
区块链区块链企业级区块链平台Hyperchain
                        Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
                    
                    在线人数统计业务设计（场景八股文）
                        

                        业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
                    
                    JAVA接口机结构解析
                        秃狼
SpringBoot八股文Javajava学习
                        什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
                    
                    氧惠官方邀请码333777，氧惠邀请码怎么获得？氧惠邀请码有什么套路？
                        知行导师

                        问：氧惠邀请码怎么获得？答：氧惠官方邀请码333777返点高佣金高真的高。问：氧惠邀请码有什么套路？答：氧惠官方邀请码333777返点高佣金高真的高。氧惠APP汇聚各大主流电商和生活服务平台优惠，展示全网全品类商品，满足网购爱好者对品质好货与极致性价比的追求，并同时享受大平台购物权益保障。满足用户日常吃喝玩乐衣食住行的聚合APP，独特的商业模式，响应国家号召，为实现全民共富而努力奋斗。氧惠邀请码3
                    
                    可处理！环境排放3.0项目怎么提现？裕华投资会刘裕华免费荐股骗局曝光！
                        墨守成法

                        骗子冒充裕华投资会刘裕华通过伪造或仿冒投资平台，向股民发送虚假环境排放3.0项目链接，引导股民者下载进行投资，以送一万体验金操作小额投资能提现作为诱饵，不断引导消费者加大资金投入。不法分子随后迅速转移资金，当投资者要提现时候就以“流水未完成”“登录异常”“服务器维护”“比赛未结束”等借口不让提现，直到平台关闭跑了或者完成流水任务为由一波亏完。在以翻本为借口继续让投资者加入资金。若你不幸遭遇到裕华投
                    
                    京东家电年销售额是去年的1300%，主要来自于他....
                        Shanshan小课堂

                        经过大半个月角逐纠缠，时间终于来到6月18日，618全球年中购物节迎来最高潮。作为国内最大的家电零售平台，京东家电从18日0点开始，便开启了飞速狂奔的模式，仅8分钟销售额就突破20亿元!展现出强劲的增长势头与家电主场的王者霸气的同时，也让各家电品牌实现了爆发式增长，美的、海尔、格力、奥克斯均在3分钟内突破1亿元大关。在今年的618中，除了消费者已经熟悉的网购形式外，线上线下联动的融合模式、社交电商
                    
                    基于redis的Zset实现作者的轻量级排名
                        周童學
Javaredis数据库缓存
                        基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
                    
                    云集怎么赚钱？云集APP分享购物赚钱攻略
                        古楼

                        云集app怎么赚钱?云集app作为是一个全面的电商导购平台,提供诸如淘宝、京东、拼多多等各大平台的优惠券,其他同类型的导购平台相比,更加的全面,线上线下全面出击。如果你想通过云集赚钱,那你可以把这款APP推荐给淘宝(10亿用户)、拼多多(3亿用户)、京东(1亿用户)使用,那你能赚到他们购物返佣,也可以自己购物领优惠券能省不少钱,以后还有更多的商家与粉象合作,这么免费的App人人都需要,很好推广。至
                    
                    提升在直返APP中的等级：解锁更多特权与收益的秘诀
                        古楼

                        在直返APP的世界里，每个用户都渴望提升自己的等级，以解锁更多特权与收益。那么，如何提升在直返APP中的等级呢？接下来，我们将为您揭示这一秘密。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。高省是公认的返利最高的软件。古楼导师高省邀请
                    
                    社交电商平台有哪些？社交电商怎么做？
                        氧惠评测

                        社交电商平台有很多，以下是一些常见的社交电商平台：氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。珊珊导师氧惠邀请码888999，注册送万元推广大礼包，教你如何1年做到百万团队。氧惠app：氧惠ap
                    
                    淘宝内部优惠劵领取教程，淘宝内部优惠劵软件使用方法！
                        测评君高省

                        淘宝优惠券一般分为2种：第1种：是你在淘宝上买东西经常能看到的那种店铺优惠券，商家主动将一些有门槛的优惠券摆在旁边，这种券一般需要你满足消费金额或者去邀请好友才能减个几块钱。第2种：就是淘宝内部优惠券，商家为了打造爆款时会低价促销从而发放一些低价优惠券，只要下单就能立减，而且优惠的金额都非常高。但是为了控制成本并设置一定的销售目标，一旦达成预订销售额，就会停止发送优惠券。优惠劵导购平台哪个好？今天
                    
                    uniapp微信小程序 - 详解微信小程序平台用户授权登录全流程，uniapp v3版本中小程序端开发下用户点击登录后获取手机号/昵称/性别/头像等信息完成登录（提供完整示例代码，一键复制开箱即用）
                        十一猫咪爱养鱼
前端组件与功能(开箱即用)uniapp常见问题解决uniappvue3uniapp3小程序授权登录微信小程序登录获取用户信息教程获取用户昵称手机号头像信息登录vue3版本小程序平台授权登录uniap小程序端用户登录流程uni完整的小程序平台登录源码
                        效果图在uniapp微信小程序端开发中，超详细实现用户授权登录完整功能源码，用户授权后获取手机号/昵称/头像/性别等，提供完整思路流程及逻辑讲解。uniappVue3和Vue2都能用，你也可以直接复制粘贴，然后改下参数放到你的项目中去就行。整体思路做功能之前，先来看一下整体流程是
                    
                    【Coze搞钱实战】3. 避坑指南：对话流设计中的6个致命错误（真实案例）
                        AI_DL_CODE
Coze平台对话流设计客服Bot避坑用户流失封号风险智能客服配置故障修复指南
                        摘要：对话流设计是智能客服Bot能否落地的核心环节，直接影响用户体验与业务安全。本文基于50+企业Bot部署故障分析，聚焦导致用户流失、投诉甚至封号的6大致命错误：无限循环追问、人工移交超时、敏感词过滤缺失、知识库冲突、未处理否定意图、跨平台适配失败。通过真实案例拆解每个错误的表现形式、技术根因及工业级解决方案，提供可直接复用的Coze配置代码、工作流模板和检测工具。文中包含对话流健康度检测工具使
                    
                    盘点长期可做的副业兼职有哪些？分享7个长期可做的靠谱副业兼职！
                        古楼

                        副业兼职做什么好呢？适合上班族的6个副业？不少上班族薪资不高，加薪无望，就希望搞副业多挣点钱，不仅能打消下班的空闲时间，还能丰富自己的生活，还能赚点钱补贴家用。那么有什么适合上班族的副业，既不占用上班的时间，又不会消耗太多的精力影响第二天上班。这里我总结了6个适合上班族的副业，提供给大家，希望有所帮助。第一款优惠劵导购平台，零投资，安全可靠高省APP，是2022年推出的平台，0投资，0风险、高省A
                    
                    链商拉不到人能赚钱么，谈谈我的看法
                        糖葫芦不甜

                        链商作为一种新兴的商业形态，往往依赖于用户网络的扩展和交易量的增加来实现价值增长，但这并不意味着没有直接拉新就无法盈利。以下是我对这一问题的几点看法：招合作伙伴↓微信在文章底部。首先，链商能否赚钱，关键在于其是否能提供独特且有价值的产品或服务。如果链商平台能够构建出高效、透明、安全的价值交换体系，解决行业痛点，提升用户体验，那么即使没有大规模的拉新活动，也能通过现有用户的口碑传播和持续使用来产生稳
                    
                    Android 媒体播放开发完全指南
                        安卓开发者
AndroidJetpackandroid媒体python
                        引言在当今移动应用生态中，媒体播放功能已成为许多应用的核心组成部分。无论是音乐流媒体应用、视频平台、播客客户端还是游戏应用，都需要强大的媒体播放能力。Android平台提供了丰富的API来支持各种媒体播放场景。本文将全面介绍Android媒体播放的开发技术，从基础到高级功能实现。一、Android媒体播放基础1.1支持的媒体格式Android原生支持多种媒体格式：音频：MP3、AAC、FLAC、W
                    
                    魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元
                        Liudef06小白
特殊专栏AIGC人工智能AI作画人工智能AIGC
                        魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
                    
                    免费编程课程大汇总：从入门到精通的一站式资源
                        大力出奇迹985
人工智能大数据
                        在数字化时代，编程已成为一项至关重要的技能，无论是为了职业发展还是个人兴趣，学习编程都极具价值。本文精心汇总了丰富的免费编程课程资源，涵盖从基础入门到精通的各个阶段。通过全面介绍如Coursera、edX等在线学习平台，Codecademy、freeCodeCamp等交互式学习网站，以及B站、网易云课堂等视频课程平台的免费课程，为编程学习者提供了一站式的资源指南，帮助读者轻松开启编程学习之旅，逐步
                    
                    K8S 常用命令全解析：高效管理容器化集群
                        恩爸编程
dockerkubernetes容器k8s常用命令k8s有哪些常用命令k8s命令有哪些K8S常用命令有哪些
                        K8S常用命令全解析：高效管理容器化集群一、引言Kubernetes（K8S）作为强大的容器编排平台，其丰富的命令行工具（kubectl）为用户提供了便捷的方式来管理集群中的各种资源。熟练掌握K8S常用命令对于开发人员和运维人员至关重要，能够有效提高容器化应用的部署、监控与维护效率。本文将详细介绍一些K8S常用命令及其使用案例。二、基础资源操作命令（一）kubectlcreate功能：用于创建K8
                    
                    流量的传递
                        L次第花开

                        罗书萍焦点网络四期周口项城坚持分享第509天2018.07.29周日三年前的一次谈话说我改变的相对快一些，那时我没有流量。迷茫，无助中在不断的反思，我哪里错了，错不在我，有诸多不安定因素在里面。同时我又在想，我改变的突破口在哪呢？在哪呢？在哪呢？遇上焦点，竟然选对平台抓住机会了，跟对了老师，有了更多的交流，焦点小屋传递着温暖，释放了不安，获得了流量，让我满血复活，有了希望。昨天，您问我学习心理学学
                    
                    每日一省（49）
                        专气致柔baby

                        背诵内容:用生气掩盖了无能，用愤怒掩盖了恐惧，用焦虑掩盖了纠结。你向世界释放了什么，你就会收获什么，生命的品质取决于行为的反作用力（如:我爱你，我爱你，我爱你，弹回来也会是我爱你，我爱你，我爱你）这几天一直在体会这段话，学习传统文化的时候，老师们也一直在强调行为的反作用力。从今天开始我要启用改译的力量，感恩纪琼院长给到的心理学生活化的实操流程，感恩各种学习思想的慢慢渗透，让我有了不断学习提高的动力
                    
                    唯品会买的东西都是正品吗？成为唯品会会员可以享受什么好处？
                        一起高省

                        这些年来，电商平台频起，不过，真正能够让大众用户记住，并真心喜欢购买的却不多。除了天猫和京东之外，唯品会也是许多用户最为喜欢的电商平台之一。不过，也逃不过许多用户的质疑，不知道此平台的东西是不是正品呢?唯品会所销售的商品均从品牌方、代理商、品牌分支机构等正规的渠道拿货，还会和这些供应商签订正式的采购协议，以保障正品质量。推荐使用“高省”，邀请码:521521，高省佣金更高，模式更好，终端用户不流失
                    
                    逛逛高级粉丝怎么涨，淘宝逛逛的粉丝数怎么来的
                        爱吃菠萝的鱼

                        淘宝逛逛是什么？现在的淘宝逛逛是一个短视频平台，很多人对这个短视频平台还不太了解，虽然这个短视频平台的粉丝已经突破了2000万，但对于很多人来说，还是不太清楚淘宝逛逛是什么。逛逛高级粉丝怎么涨：17762069205(长按微信号可复制粘贴)其实，淘宝逛逛和抖音、快手等内容社区不同，它是一个可以互动的社区。用户在上面可以分享自己的购物体验，还可以看其他用户的推荐。那么，淘宝逛逛的粉丝是怎么来的呢？淘
                    
                    不想去上班，在家就能做十大工作
                        配音就业圈

                        如果不想上班，居家以下十个工作可供参考。1.在线调查：加入各种在线调查平台，回答问卷并获得奖励。一般是几元，到几十元不等。兼职副业推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种远程工作与在线兼职，职位包括：写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、翻译、等等。。。每日更新兼职。2.网上写作：如果你擅长写作，可以选择成为自由撰稿人，为网站
                    
                    Gerapy爬虫管理框架深度解析：企业级分布式爬虫管控平台
                        Python×CATIA工业智造
爬虫分布式pythonpycharm
                        引言：爬虫工程化的必然选择随着企业数据采集需求指数级增长，传统单点爬虫管理模式面临三重困境：管理效率瓶颈：手动部署耗时占开发总时长的40%以上系统可靠性低：研究显示超过65%的爬虫故障源于部署或调度错误资源利用率差：平均爬虫服务器CPU利用率不足30%爬虫管理方案对比：┌───────────────┬─────────────┬───────────┬───────────┬──────────
                    
                    外卖在哪个app点单更优惠?领取外卖优惠券小程序推荐!
                        好项目高省

                        在美团外卖平台上，优惠券是一种非常实用的购物工具，可以帮助消费者在购买商品时享受一定的折扣或优惠。然而，许多人对美团外卖优惠券的领取方法并不清楚，不知道如何才能免费领取。本文将分享一些美团外卖优惠券的领取技巧，让你轻松获取优惠券，享受购物优惠！一、美团APP内领取打开美团APP，进入首页或发现页。在页面中，找到“外卖”选项，点击进入。在“外卖”页面中，可以看到各类商家的优惠活动，包括满减优惠、折扣
                    
                    PDF转Markdown - Python 实现方案与代码
                        Eiceblue
PythonPythonPDFpdfpython开发语言vscode
                        PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
                    
                                戴尔笔记本win8系统改装win7系统
                                    sophia天雪
win7戴尔改装系统win8
                                    戴尔win8 系统改装win7 系统详述  
 
第一步：使用U盘制作虚拟光驱： 
        1）下载安装UltraISO：注册码可以在网上搜索。 
        2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文 

                                
                                BeanUtils.copyProperties使用笔记
                                    bylijinnan
java
                                    BeanUtils.copyProperties VS PropertyUtils.copyProperties 
 
两者最大的区别是： 
BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。 
既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
                                
                                MyEclipse中文乱码问题
                                    0624chenhong
MyEclipse
                                    一、设置新建常见文件的默认编码格式，也就是文件保存的格式。 
在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。 
在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 
Window-->Preferences-->General -
                                
                                发送邮件
                                    不懂事的小屁孩
send email
                                      
import org.apache.commons.mail.EmailAttachment;  
import org.apache.commons.mail.EmailException;  
import org.apache.commons.mail.HtmlEmail;  
import org.apache.commons.mail.MultiPartEmail;  

                                
                                动画合集
                                    换个号韩国红果果
htmlcss
                                    动画 指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 
1 transition  制作鼠标滑过图片时的放大效果 
 

css
.wrap{
		width: 340px;height: 340px;
		position: absolute;
		top: 30%;
		left: 20%;
		overflow: hidden;
		bor
                                
                                网络最常见的攻击方式竟然是SQL注入
                                    蓝儿唯美
sql注入
                                    NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。 
信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击 行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
                                
                                java笔记2
                                    a-john
java
                                    类的封装： 
1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 
2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 
3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 
4，封装的特性： 
      4.1设置
                                
                                [Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx”
                                    aijuans
学习Android遇到的错误
                                            最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。 
 
昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。 
 
我就看了一下，和她要了psd的文件，还好我有一点
                                
                                自己写的一个繁体到简体的转换程序
                                    asialee
java转换繁体filter简体
                                              今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。 
         实现的思路是重载request的调取参数的几个方法，然后做下转换。 
          
                                
                                android意图和意图监听器技术
                                    百合不是茶
android显示意图隐式意图意图监听器
                                    Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递 
  
显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。 
  
隐式意图;不指明调用的名称,根据设
                                
                                spring3中新增的@value注解
                                    bijian1013
javaspring@Value
                                            在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 
1.首先在applicationContext.xml中加入：    
<beans xmlns="http://www.springframework.
                                
                                Jboss启用CXF日志
                                    sunjing
logjbossCXF
                                    1. 在standalone.xml配置文件中添加system-properties： 
    <system-properties>        <property name="org.apache.cxf.logging.enabled" value=&
                                
                                【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码
                                    bit1129
centos
                                      编译必需的软件 
 
 Firebugs3.0.0 
 Maven3.2.3 
 Ant 
 JDK1.7.0_67 
 protobuf-2.5.0 
 Hadoop 2.5.2源码包 
 
  
  
  
 
 Firebugs3.0.0 
 
  
http://sourceforge.jp/projects/sfnet_findbug
                                
                                struts2验证框架的使用和扩展
                                    白糖_
框架xmlbeanstruts正则表达式
                                    struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 
1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 
2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。 
本文介绍一下struts2通过xml文件进行校验的方法并说
                                
                                记录-感悟
                                    braveCS
感悟
                                    再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 
  
2015-1-11  1. 能在工作之余学习感兴趣的东西已经很幸福了； 
2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 
3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 
4. 一天内集中一个定长时间段看最新资讯和偏流式博
                                
                                编程之美-数组中最长递增子序列
                                    bylijinnan
编程之美
                                    
import java.util.Arrays;
import java.util.Random;

public class LongestAccendingSubSequence {

	/**
	 * 编程之美 数组中最长递增子序列 
	 * 书上的解法容易理解
	 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组，
	 * 然后求排序后的数组与原数
                                
                                读书笔记5
                                    chengxuyuancsdn
重复提交struts2的token验证
                                    1、重复提交 
2、struts2的token验证 
3、用response返回xml时的注意 
 
1、重复提交 
(1)应用场景 
(1-1)点击提交按钮两次。 
(1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 
(1-3)刷新页面 
(1-4)使用浏览器历史记录重复提交表单。 
(1-5)浏览器重复的 HTTP 请求。 
(2)解决方法 
(2-1)禁掉提交按钮 
(2-2)
                                
                                [时空与探索]全球联合进行第二次费城实验的可能性
                                    comsci

                                     
 
     二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验 
  至今给我们大家留下很多迷团..... 
 
     关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了 
 
     在这里,我的意思是,现在
                                
                                easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符
                                    daizj
oracleORA-12154
                                    用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： 
C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl 
SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 
Copyright (c) 198
                                
                                简单排序:归并排序
                                    dieslrae
归并排序
                                    
    public void mergeSort(int[] array){
        int temp = array.length/2;
        
        if(temp == 0){
            return;
        }
        
        int[] a = new int[temp];
        int
                                
                                C语言中字符串的\0和空格
                                    dcj3sjt126com
c
                                       \0 为字符串结束符，比如说： 
                      abcd (空格)cdefg； 
存入数组时，空格作为一个字符占有一个字节的空间，我们
                                
                                解决Composer国内速度慢的办法
                                    dcj3sjt126com
Composer
                                    用法： 
有两种方式启用本镜像服务： 
1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 
2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 
为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下      1   2   3   4   5    
                                
                                高效可伸缩的结果缓存
                                    shuizhaosi888
高效可伸缩的结果缓存
                                    /**
 * 要执行的算法，返回结果v
 */
public interface Computable<A, V> {
	public V comput(final A arg);

}
 
  
/**
 * 用于缓存数据
 */
public class Memoizer<A, V> implements Computable<A, 
                                
                                三点定位的算法
                                    haoningabc
c算法
                                    三点定位， 
已知a,b,c三个顶点的x,y坐标 
和三个点都z坐标的距离，la，lb,lc 
 
求z点的坐标 
原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求 
但是，由于三个点的距离可能不准，不一定会有结果， 
所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 
运行 
gcc -lm test.c 
test.c代码如下 
 

#include "stdi
                                
                                epoll使用详解
                                    jimmee
clinux服务端编程epoll
                                    epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
                                
                                Hibernate对Enum的映射的基本使用方法
                                    linzx0212
enumHibernate
                                      
枚举 
  
/**
 * 性别枚举
 */
public enum Gender {

    MALE(0), FEMALE(1), OTHER(2);

    private Gender(int i) {
        this.i = i;
    }

    private int i;

    public int getI
                                
                                第10章 高级事件（下）
                                    onestopweb
事件
                                    index.html 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/
                                
                                孙子兵法
                                    roadrunners
孙子兵法
                                    始计第一 
 
孙子曰： 
兵者，国之大事，死生之地，存亡之道，不可不察也。 
故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五 
曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑 
、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法 
者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校 
之以计，而索其情，曰
                                
                                MySQL双向复制
                                    tomcat_oracle
mysql
                                    本文包括: 
 
  主机配置  
  从机配置  
  建立主-从复制  
  建立双向复制  
 
  背景 
按照以下简单的步骤: 
参考一下： 
 
  在机器A配置主机(192.168.1.30)  
  在机器B配置从机(192.168.1.29)  
  我们可以使用下面的步骤来实现这一点  
 
  
步骤1：机器A设置主机 
 
  在主机中打开配置文件 , 
                                
                                zoj 3822 Domination(dp)
                                    阿尔萨斯
Mina
                                     题目链接：zoj 3822 Domination 
 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。 
 解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理
                                
                
            
        
    

    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    

    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.