Q小Q琪

NLP-Beginner任务五学习笔记：基于神经网络的语言模型

**用LSTM、GRU来训练字符级的语言模型，计算困惑度**

数据集：https://github.com/FudanNLP/nlp-beginner/blob/master/poetryFromTang.txt

任务一博客链接：https://blog.csdn.net/qq_51983316/article/details/129314052

任务二博客链接：https://blog.csdn.net/qq_51983316/article/details/129387225

任务三博客链接：https://blog.csdn.net/qq_51983316/article/details/129470730

任务四博客链接：https://blog.csdn.net/qq_51983316/article/details/129542010

一、数据集

二、知识点学习

（一）语言模型

1、基本概念

2、评价指标—困惑度

3、评价指标—BLEU算法

4、评价指标—ROUGE算法

（二）文本生成

1、基于语言模型的文本生成

2、基于深度学习的文本生成

（三）GRU

三、实验

（一）代码实现

1、main.py

2、feature_extraction.py

（二）结果展示与分析

一、数据集

原始数据集：https://github.com/FudanNLP/nlp-beginner/blob/master/poetryFromTang.txt

原始数据展示：

共163首唐诗，但一些诗句中有乱码/英文字母的错误，需要进行简单的清洗，如下图：

二、知识点学习

（一）语言模型

1、基本概念

语言模型（Language Model，LM）是定义在单词序列上的概率模型。通过将一个句子或者一段文字视作单词序列，可以运用概率论，统计学，信息论，机器学习等方法对语言进行建模，从而实现对单词序列的概率进行计算。一般来说，概率更大的单词序列意味着其在语言交流中出现的可能性更大，也即其可能更加符合语言习惯和会话逻辑。

语言模型仅仅对句子出现的概率进行建模，并不尝试去理解句子的内容含义。语言模型可以根据句子的一部分预测下一个词，简言之，语言模型就是判断一句话是否在语法上通顺。

举例：P（今天很累）> P（累很今天）

假设句子S包含k个单词，记为 $S=W_1,W_2,\cdots ,W_k$ ，该句子的概率为：

由公式可以看出，对于任意的词序列，语言模型能够计算出这个序列是一句话的概率。

从文本生成的角度而言，语言模型可以定义为：给定一个短语（一个词组或一句话），语言模型可以生成（预测）接下来的一个词。

语言模型的发展可以分为两个大的阶段，分别是以N-gram语言模型为代表的统计语言模型阶段，以及神经网络语言模型阶段。神经网络语言模型又可以分为早期的以【设计神经网络结构】为主的阶段和目前的通过巨量语料进行训练，再通过微调进行部署的【预训练语言模型阶段】。

在统计语言模型中，往往采用极大似然估计来计算每个词出现的条件概率，但对于任意长的语句，形如，其条件很长且数据稀疏，根据极大似然估计直接计算不现实。

为了解决此问题，引入马尔可夫假设(Markov assumption)，即假设当前词出现的概率只依赖于前个词，N-gram模型是基于此原理最经典的模型，其计算方式如下：

其中，当 n>1 时，为了使句首词的条件概率有意义，需要给原序列加上一个或多个起始符 。其作用就是为了表征句首词出现的条件概率。此外，还需要在句尾添加结束符，这是因为当不加结束符时，n-gram 语言模型只能分别对所有固定长度的序列进行概率分布建模，而不是任意长度的序列。

以N-gram为代表的统计语言模型的优缺点：

1、优点：

采用极大似然估计，参数易训练；
完全包含了前 n-1 个词的全部信息；
可解释性强，直观易理解。

2、缺点：

缺乏长期依赖，只能建模到前 n-1 个词；
随着 n 的增大，参数空间呈指数增长；
数据稀疏，难免会出现OOV（out of vocabulary words）的问题；
单纯的基于统计频次，泛化能力差。

最早的前馈神经网络语言模型——NNLM（Neural Network Language Model）在Bengio于2003年发表的《A Neural Probabilistic Language Model》中被提出，其模型原理如下：

输入层：将大小为 $|V|\times m$ 的参数矩阵与one-hot向量表示的词汇表中的单词相乘，得到该词的稠密向量表示，并将输入序列对应的所有向量拼接后得到神经网络的输入向量 $x=(C(w_{t-n+1}),\cdots ,C(w_{t-2}),C(w_{t-1}))$ 。

隐藏层：设置个隐藏单元，权重矩阵 $H\in R^{h\times (n-1)m}$ ，偏置向量 $d \in R^h$ ，tanh激活函数。

输出层：将隐藏层到输出层的运算结果（权重矩阵 $U \in R^{\left | V \right |\times h}$ ，偏置向量 $b \in R^{\left | V \right |}$ ）和从输入层直接到输出层的运算结果（权重矩阵 $W\in R^{\left|V\right|\times (n-1)m}$ ）相加，得到：

再将y通过softmax函数，便得到了以概率表示的 $p(w_i|w_{i-n+1},\cdots ,w_{i-1})$

其本质过程就是先给每个词在连续空间中赋予一个向量（词向量），再通过神经网络去学习这种分布式表征。利用神经网络去建模当前词出现的概率与其前 n-1 个词之间的约束关系。很显然这种方式相比 N-gram 具有更好的泛化能力，只要词表征足够好。从而很大程度地降低了数据稀疏带来的问题。但是这个结构的明显缺点是仅包含了有限的前文信息。

其对于统计语言模型的颠覆之处在于

1，将词以抽象符号的表示方法转变为了语义空间下的向量表示

2，以向量表示的单词序列作为神经网络的输入，求取 $p(w_i|w_{i-n+1},\cdots ,w_{i-1})$

循环神经网络语言模型在Tomas Mikolov于2010年发表的《Recurrent neural network based language model》中被提出，彻底解决了语言模型不能捕捉长距离信息的问题。循环神经网络的当前隐藏层反复捕捉当前输入的词向量和上一隐藏层（包含了前文中所有词向量的信息）

但循环神经网络存在参数经过多次传递后，易发生梯度消失或爆炸的问题，且其平等的对待所有的输入单词，但是在实际的语言中，不同的单词对于句子的重要性其实是不一样的。

后续提出的长短期记忆（Long short-term memory，LSTM）神经网络能够通过某种策略有选择地保留或者遗忘前文的信息，在没有改变循环神经网络基本结构的基础上，很好的解决了循环升级网络的问题，同时也保留了其可以捕捉全文信息的优点。

神经网络语言模型的优缺点：

1、优点

长距离依赖，具有更强的约束性；
避免了数据稀疏所带来的OOV问题；
好的词表征能够提高模型泛化能力。

2、缺点

模型训练时间长；
神经网络黑盒子，可解释性较差。

2、评价指标—困惑度

语言模型的常用评价指标是困惑度（perplexity），其基本思想为：给测试集的句子赋予较高概率值的语言模型较好；当一个语言模型训练完成后，测试集中的句子（正常的自然语言句子）出现概率越高越好。困惑度越小，句子概率越大，语言模型越好。

在信息论中，perplexity（困惑度）用来度量概率模型预测样本的好坏程度，也可以用来比较两个概率分布或概率模型。低困惑度的概率分布模型能更好地预测样本。

简言之，困惑度刻画的是语言模型预测一个语言样本的能力。

比如已经知道这句话会出现在语料库之中，那么通过语言模型计算得到的这句话的概率越高，说明语言模型对这个语料库拟合的越好。

perplexity实际是计算每一个词得到的概率倒数的几何平均，因此可以理解为平均分支系数，即模型预测下一个词时的平均可选择数量。perplexity计算公式如下：

其中，S代表sentence，N是句子长度，p(wi)是第i个词的概率。第一个词就是 p(w1|w0)，而w0是START，表示句子的起始占位符。其主要是根据每个词来估计一句话出现的概率，并用句子长度作normalize，PP(S)值越小，p(wi)则越大，一句我们期望的sentence出现的概率就越高。

举例：训练好的bigram语言模型的困惑度为3，也就是说，在平均情况下，该模型预测下一个单词时，有3个单词等可能的可以作为下一个单词的合理选择。

Perplexity的影响因素：

训练数据集越大，Perplexity会下降得更低；
数据中的标点会对模型的困惑度产生很大影响，且标点的预测总是不稳定的；
预测语句中“的、了”等停用词也会对困惑度的取值有很大影响，但从语义上分析有没有这些停用词并不能完全代表句子生成的好坏。

因此，语言模型评估时可以用perplexity大致估计训练效果，但其并不是完全意义上的标准。

3、评价指标—BLEU算法

BLEU（ BiLingual Evaluation Understudy）算法是一种衡量模型生成序列和参考序列之间的 N 元词组（ N-Gram）重合度的算法，最早用来评价机器翻译模型的质量，目前也广泛应用在各种序列生成任务中。BLEU算法的值域范围是 [0, 1]， 越大表明生成的质量越好。但是 BLEU 算法只计算精度，而不关心召回率（即参考序列里的N元组合是否在生成序列中出现）。

4、评价指标—ROUGE算法

ROUGE（ Recall-Oriented Understudy for Gisting Evaluation）算法最早应用于文本摘要领域。和 BLEU算法类似，但ROUGE算法计算的是召回率（ Recall）。令为从模型分布中生成的一个候选序列， (1), ⋯ , () 为从真实数据分布中采样出的一组参考序列，为从参考序列中提取N元组合的集合， ROUGEN算法的定义为：

其中 () 是N元组合在生成序列中出现的次数， (()) 是N元组合在参考序列 () 中出现的次数。

（二）文本生成

参考此篇综述：https://www.jiqizhixin.com/articles/2017-05-22

自然语言生成系统：接受非语言形式的信息作为输入，生成可读的文字表述。

按照输入数据的区别，可以将文本生成任务大致分为文本到文本的生成、数据到文本的生成和图像到文本的生成三大类。文本到文本的生成又可根据不同的任务分为：文本摘要、古诗生成、文本复述等。文本摘要又可以分为抽取式摘要和生成式摘要。

1、基于语言模型的文本生成

基于马尔可夫的语言模型在数据驱动的自然语言生成中有着重要的应用。它利用数据和文字间的对齐语料，主要采用两个步骤：内容规划和内容实现为数据生成对应的文本。Oh等人在搭建面向旅行领域的对话系统时，在内容规划部分使用bigram作特征根据近期的对话历史，选取待生成文本中需要出现的属性，内容实现部分使用n-gram语言模型生成对话。Ratnaparkhi等人经过实验对比发现在语言模型上加入依存语法关系有助于改善生成效果。

2、基于深度学习的文本生成

在文本到文本的生成方面，Zhang等人[8]使用RNN进行中文古诗生成，用户输入关键词后首先拓展为短语，并用来生成诗的第一行。接下来的每一行结合当时所有已生成的诗句进行生成。Wang[9]则将古诗生成分为规划模型和生成模型两部份。规划模型部分得到用户的输入，在使用TextRank进行关键词抽取和使用RNN语言模型和基于知识库的方法进行拓展后，获得一个主题词序列，作为写作大纲，每一个主题词在下一个部分生成一行诗。生成模型部分基于encoder-decoder模型，增加一个encoder为主题词获得一个向量表示。另一个encoder编码已经生成的句子。使用attention-based的模型，decoder综合主题词和已经生成的句子，生成下一句的内容。通过这两个模型，在更好的控制每一行诗的主题的同时保持诗词的流畅性。

（三）GRU

GRU（Gated Recurrent Unit）也称门控循环单元，是传统 RNN 的变体，同 LSTM 一样能够有效捕捉长序列之间的语义关联，缓解梯度消失或爆炸现象。同时它的结构和计算要比 LSTM 更简单。在 LSTM 中引入了三个门函数：输入门、遗忘门和输出门来控制输入值、记忆值和输出值。而在 GRU 模型中只有两个门：更新门和重置门。具体结构如下图所示：

图中的和分别表示重置门和更新门。

重置门：控制前一状态有多少信息被写入到当前的候选集 $\widetilde{h_t}$ 上，重置门越小，前一状态的信息被写入的越少。
更新门：控制前一时刻的状态信息被带入到当前状态中的程度，更新门越大，前一时刻的状态信息带入越多。

pytorch中nn.GRU类初始化主要参数解释：

input_size：输入张量x中特征维度的大小
hidden_size：隐层张量h中特征维度的大小
num_layers：隐含层数量
nonlinearity：激活函数的选择，默认是tanh
bidirectional：是否选择使用双向，如果为True则使用；默认不使用

RNN & LSTM & GRU 对比：

RNN特点：每个隐状态取决于当前的隐状态和当前的输入。
LSTM 特点：通过门结构使模型能够自由选择信息的传递。进一步增加RNN的记忆能力，并减轻梯度爆炸和消失的问题。
GRU 特点：对LSTM的循环函数进行简化，三个门变为两个门，解决LSTM的循环函数比较复杂的问题，在保证效果和LSTM相似的情况下，提高学习和推理效率。

GRU 优缺点：

优点：在捕捉长序列语义关联时，能有效抑制梯度消失或爆炸，效果优于传统RNN且计算复杂度比LSTM要小。
缺点：GRU仍然不能完全解决梯度消失问题，同时其作用RNN的变体，有着RNN结构本身的一大弊端，即不可并行计算，这在数据量和模型体量逐步增大的未来，是关键瓶颈。

此任务中model（LSTM/GRU）代码实现：

import torch.nn as nn
import torch

"""语言模型：LSTM/GRU"""
class Language(nn.Module):
    def __init__(self, len_feature, len_words, len_hidden, num_to_word, word_to_num, strategy='LSTM', pad_id=0, start_id=1, end_id=2, drop_out=0.5):
        super(Language, self).__init__()
        self.pad_id = pad_id
        self.start_id=start_id
        self.end_id = end_id
        # 一个将数字编码转换为单词的字典
        self.num_to_word = num_to_word
        # 一个将单词转换为数字编码的字典
        self.word_to_num = word_to_num
        self.len_feature = len_feature
        self.len_words = len_words
        self.len_hidden = len_hidden
        self.dropout = nn.Dropout(drop_out)
        _x = nn.init.xavier_normal_(torch.Tensor(len_words, len_feature))
        self.embedding = nn.Embedding(num_embeddings=len_words, embedding_dim=len_feature, _weight=_x)
        if strategy == 'LSTM':
            self.gate = nn.LSTM(input_size=len_feature, hidden_size=len_hidden, batch_first=True)
        elif strategy == 'GRU':
            self.gate = nn.GRU(input_size=len_feature, hidden_size=len_hidden, batch_first=True)
        else:
            raise Exception("Unknown Strategy!")
        # 全连接层对象，该层将从LSTM/GRU中获得的隐藏状态转换为输出单词的概率。
        self.fc = nn.Linear(len_hidden, len_words)
    def forward(self, x):
        x = self.embedding(x)
        x = self.dropout(x)
        self.gate.flatten_parameters()
        # gate表示门控循环单元（GRU）或长短时记忆（LSTM）单元
        x, _ = self.gate(x)
        # fc线性变换，返回预测结果的概率分布logits
        logits = self.fc(x)
        return logits


    """ 生成固定古诗 """
    # max_len 每行诗句的最大长度；num_sentence 生成古诗的行数
    def generate_random_poem(self, max_len, num_sentence, random=False):
        if random:
          initialize = torch.randn
        else:
          initialize = torch.zeros
        # 初始化隐藏状态 hn 和细胞状态 cn
        hn = initialize((1, 1, self.len_hidden)).cuda()
        cn = initialize((1, 1, self.len_hidden)).cuda()
        # 使用诗歌开始标记的 ID 初始化当前的输入 x，同时创建一个空列表 poem，用于保存生成的古诗
        x = torch.LongTensor([self.start_id]).cuda()
        poem = list()
        # 循环生成古诗，直到达到指定的行数
        while(len(poem)!=num_sentence):
            word = x
            sentence = list()
            for j in range(max_len):
                # 每次生成一个词。首先将当前的输入 word 转换为张量
                word = torch.LongTensor([word]).cuda()
                word = self.embedding(word).view(1, 1, -1)
                output, (hn, cn) = self.gate(word, (hn, cn))
                output = self.fc(output)
                # 获取概率最大的词的 ID
                word = output.topk(1)[1][0].item()
                """
                如果生成的词是句子结束标记的ID，则将当前输入 x 设置为诗歌开始标记的ID，并跳出内层循环。
                如果生成的词不是句子结束标记，则将其对应的词语添加到当前句子 sentence 中。
                如果生成的词是句号 self.word_to_num['。'] 的 ID，则说明当前诗句已经结束，跳出内层循环。
                """
                if word == self.end_id:
                    x = torch.LongTensor([self.start_id]).cuda()
                    break
                sentence.append(self.num_to_word[word])
                if self.word_to_num['。'] == word:
                  break
            # 如果内层循环正常结束，则说明当前诗句已经达到了最大长度 max_len，此时将当前输入 x 设置为句号的 ID 。
            else:
              x = self.word_to_num['。']
            # 如果当前诗句非空，则将其添加到生成的古诗列表 poem 中。
            if sentence:
              poem.append(sentence)
        #print(self.word_to_num.items())
        return poem


    """生成藏头诗句"""
    def generate_hidden_head(self, heads, max_len=50, random=False):  # head是藏头诗的每一行的开头的字；max_len表示每一行最多包含的字数
        # 循环遍历输入的每一个开头的字
        for head in heads:
            if head not in self.word_to_num:
                raise Exception("Word: "+head+" is not in the dictionary, please try another word")
        poem = list()
        if random:
          initialize = torch.randn
        else:
          initialize = torch.zeros
        # 生成每一行的藏头诗
        for i in range(len(heads)):
            # 获取开头字 heads[i] 对应的数字 word，并将其作为起始字符
            word = self.word_to_num[heads[i]]
            sentence = [heads[i]]
            hn = initialize((1, 1, self.len_hidden)).cuda()
            cn = initialize((1, 1, self.len_hidden)).cuda()
            for j in range(max_len-1):
                word = torch.LongTensor([word]).cuda()
                word = self.embedding(word).view(1, 1, -1)
                output, (hn, cn) = self.gate(word, (hn, cn))
                # 下一个字的概率分布
                output = self.fc(output)
                # 根据上述分布采样得到下一个字的数字 word
                word = output.topk(1)[1][0].item()
                # 将当前字符添加到句子末尾，如果当前字符是句号，则停止生成这一行。
                sentence.append(self.num_to_word[word])
                if self.word_to_num['。'] == word:
                  break
            # 生成完一行之后，将其添加到 poem 列表中
            poem.append(sentence)
        return poem

三、实验

参数设置：

训练集：poetryFromTang.txt
模型：LSTM / GRU
词嵌入：Random Embedding

random_seed：2023
学习率：0.004
batch_size：1
embedding_size：50 # 每个词向量有几维
hidden_size：50
iter_times：250

运行环境：

python：3.7

pytorch：1.7.0（gpu）

cuda版本：10.1

（一）代码实现

1、main.py

# 导入包
from feature_extraction import get_batch, Random_Embedding
from torch import optim
import random
import numpy
import torch
from model import Language
import torch.nn.functional as F
import matplotlib.pyplot


# 设置随机种子，确保计算的可重复性
random.seed(2023)
numpy.random.seed(2023)
torch.cuda.manual_seed(2023)
torch.manual_seed(2023)


# 读取数据
with open('data/poetryFromTang.txt', 'rb') as f:
    # 每行都以字节字符串的形式表示
    temp = f.readlines()


# 特征提取
a = Random_Embedding(temp)
a.data_process()
train = get_batch(a.matrix, 1)
learning_rate = 0.004
iter_times = 150


# 计算损失和准确度
strategies = ['LSTM', 'GRU']
train_loss_records = list()  # 记录每个模型的训练损失
train_acc_records = list()  # 记录每个模型的准确率
total_acc_records = list()  # 记录累计的准确率
models = list()
# 循环两次，i分别为0和1，主要为了用LSTM和GRU两种不同的模型进行训练
for i in range(2):
    # 每个模型的训练过程中使用的随机数是相同的
    random.seed(2023)
    numpy.random.seed(2023)
    torch.cuda.manual_seed(2023)
    torch.manual_seed(2023)
    # 词嵌入维度、词汇表大小、隐藏层维度、标签字典、词典和模型策略
    model = Language(50, len(a.word_dict), 50, a.tag_dict, a.word_dict, strategy=strategies[i])
    # 定义了一个Adam优化器，用于更新模型参数，学习率为learning_rate
    optimizer = optim.Adam(model.parameters(), lr=learning_rate)
    # 定义了损失函数，使用交叉熵损失
    loss_fun = F.cross_entropy
    train_loss_record = list()  # 记录每次迭代的损失
    train_acc_record = list()  # 记录每次迭代的准确率
    total_acc = 0  # 累计准确率
    model = model.cuda()
    # 循环iter_times次，迭代模型
    for iteration in range(iter_times):
        # 定义了训练损失、累计准确率和一个计数器
        total_loss = 0
        model.train()
        acc = 0
        total_acc = 0
        # 循环遍历训练数据集中的每个批次
        for i, batch in enumerate(train):
            x = batch.cuda()
            # 将输入数据和标签分离：取 x 的所有行和除了最后一列以外的所有列；x 的所有行和从第二列开始的所有列
            # 模型就可以根据前面的词来预测后面的词
            x, y = x[:, :-1], x[:, 1:]
            # 将预测结果张量的第1维和第2维进行转置
            pred = model(x).transpose(1, 2)
            # 将优化器的梯度归零，计算损失并更新总损失，然后反向传播更新梯度并更新模型参数
            optimizer.zero_grad()
            # 计算预测值 pred 和真实值 y 之间的交叉熵损失
            loss = loss_fun(pred, y)
            # 将当前 batch 的损失加到总损失中。其中 (x.shape[1]-1) 是 batch 的序列长度
            total_loss += loss.item()/(x.shape[1]-1)
            # 计算损失相对于模型参数的梯度
            loss.backward()
            # 更新模型参数
            optimizer.step()
            # 将预测值 pred 沿维度 1 取最大值，得到每个时间步的标签
            pred_labels = pred.argmax(dim=1)
            # 计算准确率
            acc += pred_labels.eq(y).sum().item()
            # 将当前 batch 的样本数量加到累计准确率 total_acc 中
            total_acc += y.numel()
        # 将本次迭代的平均损失加入到训练损失列表中
        train_loss_record.append(total_loss/len(train))
        train_acc = acc / total_acc  # 计算每次迭代的准确率
        train_acc_record.append(train_acc)
        total_acc_records.append(total_acc)  # 记录累计准确率
        print("---------- Iteration", iteration + 1, "----------")
        print("Train loss:", total_loss/len(train))
        print("Train accuracy:", train_acc)
    train_loss_records.append(train_loss_record)
    train_acc_records.append(train_acc_record)  # 记录每个模型的训练准确率
    models.append(model)


# 通过调用模型的方法生成不同类型的诗歌
"""拼接诗句"""
def cat_poem(l):
    poem = list()
    for item in l:
        poem.append(''.join(item))
    return poem


""" 生成固定诗句 """
model = models[0]
# 生成一个每句9个字，共有6句的固定格式诗句
poem = cat_poem(model.generate_random_poem(9, 6, random=False))
for sent in poem:
    print(sent)


""" 生成随机诗句 """
torch.manual_seed(2023)
# 生成一个每句15个字，共有4句的固定格式诗句
poem = cat_poem(model.generate_random_poem(15, 4, random=True))
for sent in poem:
    print(sent)

""" 生成固定藏头诗 """
# 生成一个由 4 句，每句长度不超过 20 个字符的固定格式藏头诗
poem = cat_poem(model.generate_hidden_head("春夏秋冬", max_len=20, random=False))
for sent in poem:
    print(sent)

""" 生成随机藏头诗 """
torch.manual_seed(0)
poem = cat_poem(model.generate_hidden_head("春夏秋冬", max_len=20, random=True))
for sent in poem:
    print(sent)


# 绘制训练损失图
x = list(range(1, iter_times + 1))
matplotlib.pyplot.plot(x, train_loss_records[0], 'r--', label='LSTM')
matplotlib.pyplot.plot(x, train_loss_records[1], 'b--', label='GRU')
matplotlib.pyplot.legend()
matplotlib.pyplot.title("Average Train Loss")
matplotlib.pyplot.xlabel("Iterations")
matplotlib.pyplot.ylabel("Loss")
matplotlib.pyplot.savefig('loss.jpg')
matplotlib.pyplot.show()


# 绘制准确度图
matplotlib.pyplot.plot(x, train_acc_records[0], 'r--', label='LSTM')
matplotlib.pyplot.plot(x, train_acc_records[1], 'b--', label='GRU')
matplotlib.pyplot.legend()
matplotlib.pyplot.title("Average Train Accuracy")
matplotlib.pyplot.xlabel("Iterations")
matplotlib.pyplot.ylabel("Accuracy")
matplotlib.pyplot.savefig('accuracy.jpg')
matplotlib.pyplot.show()

2、feature_extraction.py

from torch.utils.data import Dataset, DataLoader
import torch
from torch.nn.utils.rnn import pad_sequence


""" 词嵌入模型 """
class Random_Embedding():
    def __init__(self, data):
        self.data = data
        # 将每个汉字映射到一个唯一的整数 ID
        self.word_dict = {'': 0, '': 1, '': 2}
        # 将每个 ID 映射回对应的汉字
        self.tag_dict = {0: '', 1: '', 2: ''}
        self.matrix = list()

    # 诗歌分割
    def form_poem(self):
        # 将每个元素转换为utf-8的编码
        data_utf8 = list(map(lambda x, y: str(x, encoding=y), self.data, ['utf-8'] * len(self.data)))
        poems = list()
        # 将每首诗歌定义为一个字符串，包含一个诗歌的所有行
        new_poem = ""
        for item in data_utf8:
            # 如果当前元素是一个换行符，则表示我们已经到了当前诗歌的结尾
            if item == '\n':
                if new_poem:
                    poems.append(new_poem)
                new_poem = ""
            else:
                # 如果当前元素不是换行符，则表示我们需要将其添加到当前诗歌中
                if item[-2] == ' ':
                  position = -2
                else:
                  position = -1
                new_poem = ''.join([new_poem, item[:position]])
        self.data = poems
        print(self.data)

    def get_words(self):
        for poem in self.data:
            for word in poem:
                if word not in self.word_dict:
                    self.tag_dict[len(self.word_dict)]=word
                    self.word_dict[word] = len(self.word_dict)

    def get_id(self):
        for poem in self.data:
            # 将每一首诗转换为一个由词的ID号组成的列表
            self.matrix.append([self.word_dict[word] for word in poem])

    def data_process(self):
        self.form_poem()
        # 按照长度进行升序排序
        self.data.sort(key=lambda x: len(x))
        self.get_words()
        self.get_id()


""" 加载和预处理输入数据 """
class ClsDataset(Dataset):
    def __init__(self, poem):
        self.poem = poem
    def __getitem__(self, item):
        return self.poem[item]
    def __len__(self):
        return len(self.poem)


""" 自定义batch数据的输出形式 """
# 函数 collate_fn是 PyTorch 中 DataLoader 类的一个参数，用于在迭代数据时组合数据样本
# 将一个 batch 中的数据样本按照句子长度进行填充，以便构造成一个张量
def collate_fn(batch_data):
    poems = batch_data
    # 在每首诗歌的开头添加一个特殊的标记begin
    poems = [torch.LongTensor([1, *poem]) for poem in poems]
    padded_poems = pad_sequence(poems, batch_first=True, padding_value=0)
    # 在每首诗歌的末尾添加一个特殊的标记end
    padded_poems = [torch.cat([poem, torch.LongTensor([2])]) for poem in padded_poems]
    padded_poems = list(map(list, padded_poems))
    return torch.LongTensor(padded_poems)

# 使用自定义数据集，通过 dataloader 可以实现对整个数据集的批量迭代
def get_batch(x, batch_size):
    dataset = ClsDataset(x)
    dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=False, drop_last=True, collate_fn=collate_fn)
    return dataloader

（二）结果展示与分析

通过对比损失和准确度的可视化结果，可以看出GRU的效果相较LSTM更好些

GRU和LSTM的loss和accuracy分别如左图和右图所示：

生成随机诗句：

生成藏头诗：

总结：

由于是初学者，学习过程中参考了很多大佬的资料和代码，均附上参考链接：

1、https://blog.csdn.net/qq_42365109/article/details/121921018

2、邱锡鹏——《神经网络与深度学习》第6、15章

3、BERT相关——（1）语言模型 | 冬于的博客 (ifwind.github.io)

4、语言模型发展综述 - sasasatori - 博客园 (cnblogs.com)

5、https://blog.csdn.net/qq_38556984/article/details/107125193

6、一起入门语言模型(Language Models) - 知乎 (zhihu.com)

7、语言模型 - 知乎 (zhihu.com)

8、https://blog.csdn.net/pearl8899/article/details/112854900

9、深入理解语言模型 Language Model - 知乎 (zhihu.com)

10、NLP——困惑度-Perplexity | Jiahong的个人博客 (joezjh.github.io)
11、文本生成概述 | 机器之心 (jiqizhixin.com)

12、循环神经网络---GRU模型 - luyizhou - 博客园 (cnblogs.com)

13、https://blog.csdn.net/m0_47880481/article/details/106181451

14、https://zhuanlan.zhihu.com/p/32481747

15、https://blog.csdn.net/weixin_42691585/article/details/107114958

以上就是NLP-Beginner的任务五，欢迎各位前辈批评指正！

你可能感兴趣的:(NLP任务学习笔记,神经网络,自然语言处理,语言模型,深度学习)

JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
可处理！环境排放3.0项目怎么提现？裕华投资会刘裕华免费荐股骗局曝光！墨守成法
骗子冒充裕华投资会刘裕华通过伪造或仿冒投资平台，向股民发送虚假环境排放3.0项目链接，引导股民者下载进行投资，以送一万体验金操作小额投资能提现作为诱饵，不断引导消费者加大资金投入。不法分子随后迅速转移资金，当投资者要提现时候就以“流水未完成”“登录异常”“服务器维护”“比赛未结束”等借口不让提现，直到平台关闭跑了或者完成流水任务为由一波亏完。在以翻本为借口继续让投资者加入资金。若你不幸遭遇到裕华投
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
面试必考题：Android Binder 机制详解大模型大数据攻城狮 android binder 面试 react native kotlin dalvik retrofit
目录第一章：Binder的基本概念什么是Binder？多角度解读Binder第二章：Binder的工作机制Binder的整体流程服务注册：从零到有的第一步服务查询：找到目标的“地图”服务调用：请求与响应的旅程Binder驱动的幕后功劳为什么Binder这么快？第三章：Binder在系统架构中的角色Activity：界面背后的通信枢纽Binder的角色实例分析Service：后台任务的跨进程支柱Bi
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
神经形态计算如何突破冯·诺依曼架构限制？ AI算力网络与通信 AI人工智能与大数据技术 AI算力网络与通信原理 AI人工智能大数据架构架构 ai
神经形态计算如何突破冯·诺依曼架构限制？关键词：神经形态计算、冯·诺依曼架构、内存墙、存算一体、脉冲神经网络、类脑芯片、低功耗计算摘要：本文将从“冯·诺依曼架构的前世今生”讲起，用“图书馆管理员搬书”的生活案例类比其核心矛盾，再通过“人脑神经元工作模式”的比喻引入神经形态计算的核心原理。我们将一步步拆解冯·诺依曼架构的三大限制（内存墙、高功耗、非结构化数据处理弱），并对应解析神经形态计算的三大突破
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
GitLab 18.2 发布几十项与 DevSecOps 有关的功能，可升级体验【二】极小狐 gitlab 极狐gitlab devsecops devops ci/cd
沿袭我们的月度发布传统，极狐GitLab发布了18.2版本，该版本带来了议题和任务的自定义工作流状态、新的合并请求主页、新的群组概览合规仪表盘、下载安全报告的PDF导出文件、中心化的安全策略管理（Beta）等几十个重点功能的改进。下面是对部分重点功能的详细解读。关于极狐GitLab的安装升级，可以查看官方指导文档。18.2.0容器镜像registry.gitlab.cn/omnibus/gitla
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
2021-08-05 快乐有我_c00f
大荔县心理咨询协会郭亚婵坚持分享第236天：舒服又惬意的一天，早上上班不忙，自己便除了和同事闲聊之外，拿出单位发的本子一笔一划抄着国家主席习近平在2021年七月一号的重要讲话，虽然我不是党员然单位要求每位同志都要抄写七一习主席讲话内容，有人只是把讲话内容当做任务一样胡乱抄写一遍，而我却觉得这正好能够让自己认认真真的学习一遍习主席的讲话，更重要的是等于我重新跟着主席回顾一下中国共产党的历史同时也再一
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
现代化强国建设离不开人才支撑 d8d97f0a8566
2022年10月16日中国共产党第二十次全国代表大会在北京召开。大会对过去五年的工作和新时代十年的伟大变革进行总结并对未来国家发展指明方向。习总书记在大会指出：从现在起，中国共产党的中心任务就是团结带领全国各族人民全面建成社会主义现代化强国、实现第二个百年奋斗目标，以中国式现代化全面推进中华民族伟大复兴。现代化强国建设离不开人才支撑，要充分发挥教育、科技、人才在全面建设社会主义现代化国家的基础性、
c#分层设计介绍努力吧_少年 C#java c#asp.net
领域驱动分层介绍UI（表示层）最容易理解，这一层负责显示信息给用户，并解释用户的命令。有时，用户不是人，而是另一个系统。应用层用于协调领域模型对象的动作。不建议这一层包含业务规则或领域知识，即使是维护状态也不行——这是领域模型做的事情。应用层对于协调任务和把动作委托给领域模型非常有用。虽然不用于维护业务实体的状态，单应用层可以维护跟踪用户或者系统所执行的当前任务的状态。应用层不干涉阻碍领域模型，这
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
2021-11-8饮食搭配寻欢_作乐
今天是什么日子起床：5就寝：10天气：晴朗，但是特别冷心情：郁闷，不想上班。星期一综合症纪念日：任务清单昨日完成的任务，最重要的三件事：外语听力输入无，看的东西太多太散，没有收获。看了很多美食做法，准备好好节食减肥。输出一篇，每周食材清单改进：目标极简，深度。选好不变。习惯养成：早晚学习一个小时。周目标·完成进度60，5学习·信息·阅读无健康·饮食·锻炼早晚护肤完成。人际·家人·朋友无工作·思考暂
CMS垃圾回收器和G1垃圾回收器区别_g1cms垃圾回收器区别 2401_89191885 jvm
该类所有的实例都已经被回收，也就是Java堆中不存在该类的任何实例；加载该类的ClassLoader已经被回收；该类对应的java.lang.Class对象没有在任何地方被引用，无法在任何地方通过反射访问该类的方法。3.常见的垃圾回收算法1、Mark-Sweep（标记-清除算法）：（1）思想：标记清除算法分为两个阶段，标记阶段和清除阶段。标记阶段任务是标记出所有需要回收的对象，清除阶段就是清除被标
2023-1-2晨间日记明心279
今天是什么日子起床：7.00就寝：天气：小雨心情：开心纪念日：任务清单昨日完成的任务，最重要的三件事：改进：习惯养成：周目标·完成进度学习·信息·阅读不学习，不工作的时候总会有些焦虑，一旦有了目标，就会比较快乐健康·饮食·锻炼站桩45早上五红汤中午米饭炒菜（临平见网友）晚上胡辣汤人际·家人·朋友工作·思考最美好的十件事1.我是最善良，最可爱，最大度，最宽容，最仁慈，最宽厚，最有魅力的优雅知性女子。
每天的读书任务梓说心情
2017年完成的2件大事，5月和11月分别完成了心理咨询师3级和2级的考试，并顺利过关拿到了证书，初步完成了一个梦想，也是有证书的人了。辛楠在学校里今天下午没课，去图书馆看书了，虽然是一些类似于读者、生活指南的杂志，相比以前也是一种进步。今天的人格心理学读书任务完成了。图片发自App
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt