gensim加载word2vec训练结果(bin⽂件)并进⾏相似度实验# -*- coding: utf-8 -*-奥运金牌
截然不同的意思import gensim
# 导⼊模型
model = dels.KeyedVectors.load_word2vec_format('vectors.bin', binary=True)
# 得到两组词的相似度
list1 = [u'核能']
list2 = [u'电能']
list3 = [u'电⼒']
list_sim1 =  model.n_similarity(list1, list2)
度的组词print list_sim1
list_sim2 = model.n_similarity(list2, list3)
print list_sim2, '\n'
# 得到⼀组词中最⽆关的词
list4 = [u'汽车', u'⽕车', u'飞机', u'北京']
print model.doesnt_match(list4)
print'\n'
医院伦理委员会
# 得到与⼀个词最相关的若⼲词及相似程度
吞没的近义词
result = st_similar(u'脱⽔⼯艺')
for each in result:
划粥割齑print each[0] , each[1]