锅巴QAQ

TensorFlow2.0之还原lenet-5模型

最近课程需要，将lenet-5模型进行还原，但是网上博客大都根据原论文进行了自己的改进，不能满足还原的这个要求，所以按照论文结合TensorFlow2.0的API，将其还原。

from tensorflow.python.client import device_lib 
device_lib.list_local_devices()

The default version of TensorFlow in Colab will soon switch to TensorFlow 2.x.
We recommend you upgrade now or ensure your notebook will continue to use TensorFlow 1.x via the %tensorflow_version 1.x magic: more info.

[name: "/device:CPU:0"
 device_type: "CPU"
 memory_limit: 268435456
 locality {
 }
 incarnation: 16313844761984461564, name: "/device:XLA_CPU:0"
 device_type: "XLA_CPU"
 memory_limit: 17179869184
 locality {
 }
 incarnation: 17583002155353847962
 physical_device_desc: "device: XLA_CPU device", name: "/device:XLA_GPU:0"
 device_type: "XLA_GPU"
 memory_limit: 17179869184
 locality {
 }
 incarnation: 188667365564072257
 physical_device_desc: "device: XLA_GPU device", name: "/device:GPU:0"
 device_type: "GPU"
 memory_limit: 15956161332
 locality {
   bus_id: 1
   links {
   }
 }
 incarnation: 540513892452511862
 physical_device_desc: "device: 0, name: Tesla P100-PCIE-16GB, pci bus id: 0000:00:04.0, compute capability: 6.0"]



import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
%matplotlib inline
print(tf.__version__)

1.15.0

(X_train, y_train), (X_test, y_test) = tf.keras.datasets.mnist.load_data()
# np.newaxis增加一维数据
X_val, y_val = X_train[55000:, ..., np.newaxis], y_train[55000:]
X_train, y_train = X_train[:55000, ..., np.newaxis], y_train[:55000]
X_test =  X_test[..., np.newaxis]

print("图片形状：{}".format(X_train.shape), end = '\n\n')
print("训练集合：{}".format(len(X_train)))
print("验证集合：{}".format(len(X_val)))
print("测试集合：{}".format(len(X_test)))

图片形状：(55000, 28, 28, 1)

训练集合：55000
验证集合：5000
测试集合：10000

# 将图片大小reshape为32*32，第1维=数量前面扩充0列，最后面扩充0列；第2维==行，前面扩充2列，最后面扩充2列；依次第3维=列、第4维...constant_values=未指定，扩充全为0
X_train = np.pad(X_train, ((0,0),(2,2),(2,2),(0,0)), 'constant')
X_val = np.pad(X_val, ((0,0),(2,2),(2,2),(0,0)), 'constant')
X_test = np.pad(X_test, ((0,0),(2,2),(2,2),(0,0)), 'constant')

print("图片形状更改为：", end='\n\n')
print("-训练数据集合{}".format(X_train.shape))
print("-验证数据集合{}".format(X_val.shape))
print("-测试数据集合{}".format(X_test.shape))

图片形状更改为：

-训练数据集合(55000, 32, 32, 1)
-验证数据集合(5000, 32, 32, 1)
-测试数据集合(10000, 32, 32, 1)

# 归1化
X_train, X_val, X_test = X_train/float(255), X_val/float(255), X_test/float(255)

"""默认自然图像是一类平稳的数据分布(即数据每一维的统计都服从相同分布)，此时，在每个样本上减去数据的统计平均值可以移除共同的部分，凸显个体差异。"""

X_train -= np.mean(X_train)
X_val -= np.mean(X_val)
X_test -= np.mean(X_test)

def plot_example(X, y, y_pred=None):
  """
  展示9个训练样本及其各自类别
  
  Parameters:
  -X: 训练样本
  -y: 真实标签
  -y_pred: 预测标签
  """
  # 3*3的显示阵列
  fig,axes = plt.subplots(3, 3)
  fig.subplots_adjust(hspace=0.3, wspace=0.3)
    
  X,y=X[:9, ..., 0], y[:9] 
  for i, ax in enumerate(axes.flat):
    # Plot image.
    ax.imshow(X[i])

    # Show true and predicted classes.
    if y_pred is None:
      xlabel = "True: {0}".format(y[i])
    else:
      # 显示预测结果
      xlabel = "True: {0}, Pred: {1}".format(y[i], y_pred[i])

    # Show the classes as the label on the x-axis.
    ax.set_xlabel(xlabel)
    
    # Remove ticks from the plot.
    ax.set_xticks([])
    ax.set_yticks([])
  
  # Ensure the plot is shown correctly with multiple plots in a single Notebook cell.
  plt.show()

def plot_example_errors(X, y, y_pred):
  """
  Plots 9 example errors and their associate true/predicted labels.
  
  Parameters:
  -X: Training examples.
  -y: true labels.
  -y_pred: predicted labels.
  
  """
  incorrect = (y != y_pred)
  X = X[incorrect]
  y = y[incorrect]
  y_pred = y_pred[incorrect]
  
  # Plot the first 9 images.
  plot_example(X, y, y_pred)

plot_example(X_train, y_train)

from tensorflow.keras import Sequential
from tensorflow.keras.layers import Conv2D, AveragePooling2D, Flatten, Dense
from tensorflow.keras.losses import CategoricalCrossentropy

def LeNet_5():
  model = Sequential()

  # C1: (None,32,32,1) -> (None,28,28,6).
  model.add(Conv2D(6, kernel_size=(5, 5), strides=(1, 1), activation='tanh', input_shape=(32,32,1), padding='valid'))
  """
  padding = “SAME”, 输出大小==向上取整[输入大小/步长]
  padding = “VALID”，输出大小==向上取整[(输入大小-滤波器+1)/步长]
  """
  # P1: (None,28,28,6) -> (None,14,14,6).
  model.add(AveragePooling2D(pool_size=(2, 2), strides=(2, 2), padding='valid'))

  # C2: (None,14,14,6) -> (None,10,10,16).
  model.add(Conv2D(16, kernel_size=(5, 5), strides=(1, 1), activation='tanh', padding='valid'))

  # P2: (None,10,10,16) -> (None,5,5,16).
  model.add(AveragePooling2D(pool_size=(2, 2), strides=(2, 2), padding='valid'))

  # Flatten: (None,5,5,16) -> (None, 400). 5*5*16=400
  model.add(Flatten())

  # FC1: (None, 400) -> (None,120).
  model.add(Dense(120, activation='tanh'))

  # FC2: (None,120) -> (None,84).
  model.add(Dense(84, activation='tanh'))

  # FC3: (None,84) -> (None,10).
  model.add(Dense(10, activation='softmax'))

  """
  optimizer优化器算法：更新模型参数。sgd / adma
  loss损失函数：评估模型的正确率，最小化该函数，往预测正确的方向训练。categorical_crossentropy交叉熵损失函数
  metrics指标：监视训练和测试步数，accuracy=图片被正确分类的比例
  """
  # Compile the model
  model.compile(loss='sparse_categorical_crossentropy', optimizer='sgd', metrics=['accuracy']) 
  
  return model

model = LeNet_5()
model.summary()
from tensorflow.keras.utils import plot_model
# https://blog.csdn.net/weixin_36407399/article/details/87890230
plot_model(model, to_file='model.png', show_shapes=True)

WARNING:tensorflow:From /tensorflow-1.15.0/python3.6/tensorflow_core/python/ops/resource_variable_ops.py:1630: calling BaseResourceVariable.__init__ (from tensorflow.python.ops.resource_variable_ops) with constraint is deprecated and will be removed in a future version.
Instructions for updating:
If using Keras pass *_constraint arguments to layers.
Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d (Conv2D)              (None, 28, 28, 6)         156       
_________________________________________________________________
average_pooling2d (AveragePo (None, 14, 14, 6)         0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 10, 10, 16)        2416      
_________________________________________________________________
average_pooling2d_1 (Average (None, 5, 5, 16)          0         
_________________________________________________________________
flatten (Flatten)            (None, 400)               0         
_________________________________________________________________
dense (Dense)                (None, 120)               48120     
_________________________________________________________________
dense_1 (Dense)              (None, 84)                10164     
_________________________________________________________________
dense_2 (Dense)              (None, 10)                850       
=================================================================
Total params: 61,706
Trainable params: 61,706
Non-trainable params: 0
_________________________________________________________________

import time
t1=time.time()
# //batch_size=1024
history = model.fit(X_train, y_train, validation_data=(X_val, y_val),batch_size=1024,epochs=20)
t2=time.time()
print("模型训练时间：",t2-t1)
model.evaluate(X_test,y_test)
# Save the model.
model.save("lenet5_model.h5")
model.evaluate(X_test,y_test)

Train on 55000 samples, validate on 5000 samples
Epoch 1/20
55000/55000 [==============================] - 2s 39us/sample - loss: 2.2344 - acc: 0.2299 - val_loss: 2.1135 - val_acc: 0.3930
Epoch 2/20
55000/55000 [==============================] - 1s 10us/sample - loss: 1.9584 - acc: 0.4827 - val_loss: 1.7373 - val_acc: 0.6044
Epoch 3/20
55000/55000 [==============================] - 1s 10us/sample - loss: 1.5616 - acc: 0.6467 - val_loss: 1.3159 - val_acc: 0.7430
Epoch 4/20
55000/55000 [==============================] - 1s 10us/sample - loss: 1.2134 - acc: 0.7407 - val_loss: 1.0095 - val_acc: 0.8108
Epoch 5/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.9763 - acc: 0.7865 - val_loss: 0.8111 - val_acc: 0.8438
Epoch 6/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.8227 - acc: 0.8143 - val_loss: 0.6820 - val_acc: 0.8646
Epoch 7/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.7207 - acc: 0.8309 - val_loss: 0.5953 - val_acc: 0.8762
Epoch 8/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.6501 - acc: 0.8427 - val_loss: 0.5340 - val_acc: 0.8876
Epoch 9/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.5986 - acc: 0.8507 - val_loss: 0.4889 - val_acc: 0.8930
Epoch 10/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.5594 - acc: 0.8580 - val_loss: 0.4543 - val_acc: 0.8964
Epoch 11/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.5284 - acc: 0.8634 - val_loss: 0.4268 - val_acc: 0.8988
Epoch 12/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.5031 - acc: 0.8676 - val_loss: 0.4045 - val_acc: 0.9032
Epoch 13/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.4819 - acc: 0.8714 - val_loss: 0.3857 - val_acc: 0.9068
Epoch 14/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.4638 - acc: 0.8751 - val_loss: 0.3698 - val_acc: 0.9090
Epoch 15/20
55000/55000 [==============================] - 1s 9us/sample - loss: 0.4482 - acc: 0.8783 - val_loss: 0.3559 - val_acc: 0.9116
Epoch 16/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.4344 - acc: 0.8810 - val_loss: 0.3438 - val_acc: 0.9132
Epoch 17/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.4221 - acc: 0.8837 - val_loss: 0.3332 - val_acc: 0.9142
Epoch 18/20
55000/55000 [==============================] - 1s 10us/sample - loss: 0.4111 - acc: 0.8856 - val_loss: 0.3237 - val_acc: 0.9170
Epoch 19/20
55000/55000 [==============================] - 1s 9us/sample - loss: 0.4011 - acc: 0.8879 - val_loss: 0.3151 - val_acc: 0.9186
Epoch 20/20
55000/55000 [==============================] - 1s 11us/sample - loss: 0.3920 - acc: 0.8898 - val_loss: 0.3072 - val_acc: 0.9200
模型训练时间： 13.447073459625244
10000/10000 [==============================] - 1s 64us/sample - loss: 0.3687 - acc: 0.8963
10000/10000 [==============================] - 1s 66us/sample - loss: 0.3687 - acc: 0.8963





[0.36870885945558546, 0.8963]

# 加载已经训练好的模型
model = tf.keras.models.load_model('lenet5_model.h5')

# 对测试集进行预测
predictions = model.predict(X_test)

# 对预测结果选取概率最大索引
y_pred = np.argmax(predictions, axis=1)

# 测试集精确度
print('测试集错误率:  {}'.format(np.mean(y_pred == y_test)))

# 用模型预测绘制一些例子
print('\n正确分类:')
plot_example(X_test, y_test, y_pred)

print('\n错误分类:')
plot_example_errors(X_test, y_test, y_pred)

# 训练
print('\n超过20代的训练:')
plt.title('training error')
plt.ylabel('Cost')
plt.xlabel('epoch')

plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.legend(['train loss', 'val loss'], loc='upper right')
plt.show()

测试集错误率:  0.8963

正确分类:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vu1YGHMb-1585057954266)(output_12_1.png)]

错误分类:

超过20代的训练:

NLP--自然语言处理学习-day1 啊波阿波波自然语言处理学习 easyui
一.初步认识NLP自然语言处理（NaturalLanguageProcessing,NLP）是计算机科学和人工智能（AI）的一个交叉领域，旨在使计算机能够理解、分析、生成和处理人类语言的能力。它结合了计算语言学、人工智能、机器学习和语言学等多个领域的知识。NLP的主要任务文本分类：将文本内容分配到一个或多个类别中，例如垃圾邮件分类、情感分析等。命名实体识别（NER）：从文本中识别出特定类型的实体，
计算机视觉产品推荐,个性化推荐:人工智能中的计算机视觉、NLP自然语言处理和个性化推荐系统哪个前景更好一些？...
这个问题直接回答的话可能还是有着很强的个人观点，所以不如先向你介绍一些这几个领域目前的研究现状和应用情况(不再具体介绍其中原理)你自己可以斟酌一下哪方面更适合自己个性化推荐。一．所谓计算机视觉，是指使用计算机及相关设备对生物视觉的一种模拟个性化推荐。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息，就像人类和许多其他类生物每天所做的那样[1]。现在人工智能的计算机视觉主要研究
Pandas一站式学习，创建，索引使用，运算，pd可视化柱状图等，csv,hdf5,json格式数据读取存储，NaN值处理，数据离散化，数据合并，交叉表与透视表山顶极客 Pandas专栏 pandas 数据挖掘 python
Pandas一站式学习，索引使用，运算，pd可视化，csv,hdf5,json格式数据读取存储，NaN值处理，数据离散化，数据合并分组，交叉表与透视表python一站式学习->:python一站式学习，python基础，数据类型，numpy，pandas,机器学习，NLP自然语言处理，deepseek大预言模型，Tensorflow，CV视觉Pandas一站式学习pandas一站式学习->:Pan
【深度学习入门_NLP自然语言处理】序章沉默的舞台剧 AI 深度学习自然语言处理人工智能
本部分开始深度学习第二大部分NLP章节学习，找了好多资料，终于明确NLP的学习目标了，介于工作之余学习综合考量，还是决定以视频学习为主+后期自主实践为主吧。分享一个总图，其实在定位的时候很迷茫，单各章节领域其实都是很大的范畴，每个部分都是需要专精的，所以在做计划的时候很头大…千里之行始于足下吧，话不多数，直接上NLP的学习应用目标：学习教程的话参照B站实战结合的这个教程【2025NLP自然语言处理
LLM架构解析：门控循环单元（GRU）（第三部分）—— 从基础原理到实践应用的深度探索硅基创想家 #大模型架构解析 LLM Architecture gru 深度学习人工智能 LLM架构 LLM 词嵌入模型
本专栏深入探究从循环神经网络（RNN）到Transformer等自然语言处理（NLP）模型的架构，以及基于这些模型构建的应用程序。本系列文章内容：NLP自然语言处理基础词嵌入（WordEmbeddings）循环神经网络（RNN）、长短期记忆网络（LSTM）和门控循环单元（GRU）3.1循环神经网络（RNN）3.2长短期记忆网络（LSTM）3.3门控循环单元（GRU）（本文）编码器-解码器架构（En
DeepSeek大语言模型下几个常用术语曲幽 AI 计算机语言模型人工智能自然语言处理 deepseek ollama ai
昨天刷B站看到复旦赵斌老师说的一句话“科幻电影里在人脑中植入芯片或许在当下无法实现，但当下可以借助AI人工智能实现人类第二脑”（大概是这个意思）更多内容，可关注公众号“一名程序媛”，我们一起从0-1学编程基本概念AI人工智能NLP自然语言处理LLM大语言模型HuggingFace一个提供了丰富的预训练模型和工具库的平台网站Ollama开源的本地大语言模型运行框架，用来在本地部署调用大语言模型，如D
NLP自然语言处理——文本处理的基本方法小村学长毕业设计自然语言处理人工智能
NLP（自然语言处理）是人工智能领域的一个重要分支，它专注于使计算机能够理解和生成人类语言。文本处理是NLP中的基础且核心的部分，涉及多个步骤和技术，以确保原始文本数据能够被有效地转换、分析和利用。以下是对文本处理基本方法的详细探讨，包括文本预处理、文本表示、以及常见的NLP任务等。一、文本预处理文本预处理是NLP中的第一步，也是至关重要的一步。它主要包括以下几个子步骤：文本清洗：去除特殊字符：移
NLP自然语言处理：文本表示总结 - 上篇word embedding（基于降维、基于聚类、CBOW 、Skip-gram、 NNLM 、TF-ID、GloVe ）陈宸-研究僧 NLP自然语言处理
文本表示分类（基于表示方法）离散表示one-hot表示词袋模型与TF-ID分布式表示基于矩阵的表示方法降维的方法聚类的方法基于神经网络的表示方法NNLMCBOWSkip-gramGloVeELMoGPTBERT目录一、文本离散表示1.1文本离散表示：one-hot1.2文本离散表示：词袋模型与TF-IDF1.2.1词袋模型（bagofwords）1.2.2对词袋模型的改进：TF-IDF二、文本分布
29、深度学习-自学之路-深入理解-NLP自然语言处理-做一个完形填空，让机器学习更多的内容程序展示小宇爱深度学习-自学之路深度学习自然语言处理机器学习
importsys,random,mathfromcollectionsimportCounterimportnumpyasnpnp.random.seed(1)random.seed(1)f=open('reviews.txt')raw_reviews=f.readlines()f.close()tokens=list(map(lambdax:(x.split("")),raw_reviews)
【AI视野·今日NLP 自然语言处理论文速览第八十期】Fri, 1 Mar 2024 hitrjj LLM NLP Papers 人工智能自然语言处理 NLP LLM 大语言模型
AI视野·今日CS.NLP自然语言处理论文速览Fri,1Mar2024Totally67papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersLooseLIPSSinkShips:AskingQuestionsinBattleshipwithLanguage-InformedProgramSamplingAuthorsGabrielGrand,V
34、深度学习-自学之路-深入理解-NLP自然语言处理-RNN一个简单的程序，可以从程序中理解RNN的基本思想。小宇爱深度学习-自学之路深度学习自然语言处理 rnn
importsys,random,mathfromcollectionsimportCounterimportnumpyasnpf=open('tasks_1-20_v1/en/qa1_single-supporting-fact_train.txt','r')raw=f.readlines()f.close()tokens=list()forlineinraw[0:1000]:tokens.ap
26、深度学习-自学之路-NLP自然语言处理-理解加程序，怎么把现实的词翻译给机器识别。小宇爱深度学习-自学之路深度学习自然语言处理人工智能
一、怎么能让机器能够理解我们的语言呢，我们可以利用神经网络干很多的事情，那么我们是不是也可以用神经元做自然语言处理呢，现在很多的实际应用已经说明了这个问题，可以这么做。那我们考虑一下该怎么做，首先我们应该把我们现实中的每一个单词都用一个词向量来进行表示：importnumpyasnponehots={}onehots['cat']=np.array([1,0,0,0])onehots['the']
27、深度学习-自学之路-NLP自然语言处理-做一个简单的项目识别一组电影评论，来判断电影评论是积极的，还是消极的。小宇爱深度学习-自学之路深度学习自然语言处理人工智能
一、如果我们要做这个项目，第一步我们要做的就是需要有对应的训练数据集。这里提供两个数据集，一个是原始评论数据集《reviews.txt》，以及对应的评论是消极还是积极的数据集《labels.txt》，下面的程序就是找到这两个数据集，并把对应的数据集的内容分别赋值给reviews和labelsdefpretty_print_review_and_label(i):print(labels[i]+"\
Python NLP 自然语言处理简简单单OnlineZuozuo m1 Python 领域 python 自然语言处理开发语言
文章目录PythonNLP自然语言处理PythonNLP自然语言处理"""基于https://github.com/isnowfy/snownlp$pipinstallsnownlp"""fromsnownlpimportSnowNLP#分词defsnownlp_cut(text):returnSnowNLP(text).words#词性标准defsnownlp_tags(text):#返回积极情
6. NLP自然语言处理（Natural Language Processing）啊波次得饿佛哥 AI人工智能自然语言处理人工智能
自然语言是指人类日常使用的语言，如中文、英语、法语等。自然语言处理是人工智能（AI）领域中的一个重要分支，它结合了计算机科学、语言学和统计学的方法，通过算法对文本和语音进行分析，使计算机能够理解、解释和生成自然语言。随着深度学习技术的发展，NLP在文本分类、机器翻译、情感分析、对话系统等任务中取得了显著进展，推动了人工智能技术在多个领域的广泛应用。自然语言处理的核心任务涉及如何使计算机理解和处理语
pytorch NLP自然语言处理入门一：文本表示 whyte王 pytorch NLP基础 pytorch 自然语言处理人工智能
开始编辑：2024/2/16；最后编辑2024/2/16教程出自：https://learn.microsoft.com/en-sg/training/modules/intro-natural-language-processing-pytorch/第二部分：https://blog.csdn.net/qq_33345365/article/details/136142152本博客旨在探讨处理自
【AI视野·今日NLP 自然语言处理论文速览第八十二期】Tue, 5 Mar 2024 hitrjj LLM NLP Papers 人工智能自然语言处理 NLP 预训练模型文本摘要情绪识别推理训练
AI视野·今日CS.NLP自然语言处理论文速览Tue,5Mar2024(showingfirst100of175entries)Totally100papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersKey-Point-DrivenDataSynthesiswithitsEnhancementonMathematicalReasoningAut
【AI视野·今日NLP 自然语言处理论文速览第七十八期】Wed, 17 Jan 2024 hitrjj NLP LLM Papers NLP LLM 大语言模型文本处理生成模型
AI视野·今日CS.NLP自然语言处理论文速览Wed,17Jan2024(showingfirst100of163entries)Totally100papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersDeductiveClosureTrainingofLanguageModelsforCoherence,Accuracy,andUpdatab
【AI视野·今日NLP 自然语言处理论文速览第七十九期】Thu, 18 Jan 2024 hitrjj LLM NLP Papers 自然语言处理 LLM 大语言模型对话系统 NLP
AI视野·今日CS.NLP自然语言处理论文速览Thu,18Jan2024Totally35papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersDecipheringTextualAuthenticity:AGeneralizedStrategythroughtheLensofLargeLanguageSemanticsforDetectingH
2018-03-05 baitu
使用sar和kSar来发现Linux性能瓶颈剖析内存中的程序之秘JavaEE未来路在何方？用户帐户，授权和密码管理的12个最佳实践NLP自然语言处理框架ClearTKApacheUIMAClearTKLoggingWiththeElasticStack
【NLP 自然语言处理(一)---词向量】 y_dd 深度学习自然语言处理人工智能
文章目录什么是NLP自然语言处理发展历程自然语言处理模型模型能识别单词的方法词向量分词一个向量vector表示一个词词向量的表示-one-hot多维词嵌入wordembeding词向量的训练方法CBOWSkip-gram词嵌入的理论依据一个vector（向量）表示短语或者文章vectorspaceModelbag-of-wordvectorspaceModel+bag-of-word实现信息搜索改
NLP自然语言处理实战(三):词频背后的语义--5.距离和相似度&反馈及改进 Nobitaxi NLP自然语言处理实战学习自然语言处理机器学习人工智能
目录1.距离和相似度2.反馈及改进线性判别分析1.距离和相似度我们可以使用相似度评分（或距离），根据两篇文档的表达向量间的相似度（或距离）来判断文档间有多相似。LSA能够保持较大的距离，但它并不能总保持较小的距离（文档之间关系的精细结构）。LSA底层的SVD算法的重点是使新主题向量空间中所有文档之间的方差最大化。特征向量（词向量、主题向量、文档上下文向量等）之间的距离驱动着NLP流水线或任何机器学
NLP自然语言处理-第一章NLP基础 Viterbi
第一章NLP基础在本章你将学到NLP（自然语言处理）相关的基础知识。本章要点包括：NLP基础概念NLP的发展与应用NLP常用术语以及扩展介绍1.1什么是NLP1.1.1NLP的概念NLP（NaturalLanguageProcessing，自然语言处理）是计算机科学领域以及人工智能领域的一个重要的研究方向，它研究用计算机来处理、理解以及运用人类语言（如中文、英文等），达到人与计算机之间进行有效通讯
NLP自然语言处理 AI论道自然语言处理人工智能
随着人工智能的飞速发展，自然语言处理（NaturalLanguageProcessing，简称NLP）已经成为了AI领域的一颗璀璨明珠。NLP旨在赋予机器理解和处理人类语言的能力，这不仅仅是一项技术革新，更是一种推动人与机器交流方式根本性变革的力量。本文将对NLP进行简析，带领读者一探究竟。1、什么是自然语言处理？自然语言处理是计算机科学、人工智能和语言学交叉的一个分支学科，它涉及到让计算机能够理
NLP自然语言处理的基本语言任务介绍人生万事须自为，跬步江山即寥廓。机器学习人工智能自然语言处理人工智能机器学习
自然语言处理（NaturalLanguageProcessing，NLP）是计算机科学、人工智能和语言学领域的一个分支，它致力于使计算机能够理解、解释和生成人类语言。NLP的基本任务包括以下几个方面：1.分词（Tokenization）：将文本分割成单词、短语或其他有意义的元素（称为tokens）。分词是许多NLP任务的第一步。2.词性标注（Part-of-SpeechTagging）：为文本中的
【AI视野·今日NLP 自然语言处理论文速览第七十七期】Mon, 15 Jan 2024 hitrjj LLM NLP Papers 人工智能自然语言处理 LLM 大语言模型大模型自动翻译文本摘要
AI视野·今日CS.NLP自然语言处理论文速览Mon,15Jan2024Totally57papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersMachineTranslationModelsareZero-ShotDetectorsofTranslationDirectionAuthorsMichelleWastl,JannisVamvas,R
【AI视野·今日NLP 自然语言处理论文速览第七十六期】Fri, 12 Jan 2024 hitrjj LLM NLP Papers 自然语言处理大语言模型 LLM NLP
AI视野·今日CS.NLP自然语言处理论文速览Fri,12Jan2024Totally60papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersAxisTour:WordTourDeterminestheOrderofAxesinICA-transformedEmbeddingsAuthorsHiroakiYamagiwa,YusukeTakas
深入浅出自然语义处理原理并构建自然语义处理(NLP)模型GPT2 「已注销」笔记深度学习人工智能 pytorch 自然语言处理神经网络
NLP自然语言处理，GPT2模型1、词向量在图像的处理中，我们无需对图像进行特殊的处理，因为图像本身就是由矩阵来表示的。而处理自然语言的时候，语言是由每一个字、词组成的。而字、词是通过编码存储在计算机当中的。所以我们可以通过将字、词编码成为向量的形式，如此就可以输入进深度学习网络模型中。但是我们应该如何去编码呢？像做图像分类那样，使用one—hot的形式编码？但是这样会存在一个问题，在自然语言中，
NLP自然语言处理介绍 love6a6 nlp
自然语言处理（NaturalLanguageProcessing，NLP）是一种通过计算机技术与人类语言交互的研究领域。它致力于使计算机能够理解、解析、处理和生成人类语言，以实现人机之间的自然语言交流。NLP涉及多个技术和方法，包括语音识别、文本分析、语义理解、机器翻译、情感分析等。通过这些技术，NLP可以处理和分析大量的文本数据，识别文本中的关键信息和结构，并从中提取出有用的知识和洞察。NLP在
分享一个“产业级，开箱即用”的NLP自然语言处理工具李楷杰自然语言处理人工智能
NLP的全称是NatuarlLanguageProcessing，中文意思是自然语言处理，是人工智能领域的一个重要方向自然语言处理（NLP）的一个最伟大的方面是跨越多个领域的计算研究，从人工智能到计算语言学的多个计算研究领域都在研究计算机与人类语言之间的相互作用。它主要关注计算机如何准确并快速地处理大量的自然语言语料库。什么是自然语言语料库？它是用现实世界语言表达的语言学习，是从文本和语言与另一种
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

TensorFlow2.0之还原lenet-5模型

你可能感兴趣的:(NLP自然语言处理)