item2vec的相似度

最新推荐文章于 2025-02-24 20:07:09 发布

小李飞刀李寻欢

最新推荐文章于 2025-02-24 20:07:09 发布

阅读量873

点赞数 2

CC 4.0 BY-SA版权

分类专栏： NLP与推荐算法文章标签： word2vec NLP item2vec 推荐算法

本文链接：https://blog.csdn.net/SPESEG/article/details/105046030

NLP与推荐算法专栏收录该内容

153 篇文章 ¥399.90 ¥499.90

订阅专栏

超级会员免费看

在上面的word2vec中，可以训练得到每个item的vec，当然也可根据每个item的vector计算他们之间的相似度，我推荐直接采用similar by vector，这样可以由query得到topk个最接近的词，如下：

similar_by_vector(vector, topn=10, restrict_vocab=None) method of gensim.models.word2vec.Word2Vec instance
    Deprecated, use self.wv.similar_by_vector() instead.

下面三者得到的结果是一样的，无论是比较vector，还是word，归根结底比较的还是向量。

sentences = [["cat", "say", "meow"], ["dog", "say", "woof"]]
...
model.similar_by_vector(model.wv['cat'])
#[('cat', 0.9999999403953552), ('say', 0.06181219592690468), ('dog', 0.05950310826301575), ('meow', 0.011392313987016678), ('woof', -0.1317243129014969)]
model.similarity('cat','say')
#0.061812192
model

了解本专栏