词向量模型及Word2Vector(二)

今天来讲解一个非常经典的词向量模型word2vec并介绍一个非常强大的库gensim。先贴一段代码。

from gensim.models import Word2Vec

en_wiki_word2vec_model = Word2Vec.load('wiki.zh.text.model')

test_words = ['苹果', '数学', '学术', '白痴', '篮球']
for i in range(5):
    res = wn_wiki_word2vec_model.most_similar(test_words[i])
    print(test_words[i])
    print(res)

n-gram


image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

logistic回归用于二分类,挑选出重要的词。


sigmiod

image.png

image.png

image.png

极大似然函数
image.png

image.png

image.png

Negative Sampling负采样
image.png

image.png

image.png

你可能感兴趣的:(词向量模型及Word2Vector(二))