英文:
Scala / Java word2vec reader
问题
我有几个具有以下标准布局的word2vec文本文件:
单词数 向量大小
单词1 向量1 向量2 ...
单词2 向量1 向量2 ...
...
是否有Scala或Java库可用于读取这些文件并计算简单的功能,如:
- 是否是词汇中的单词
- 获取单词向量
- 最近的邻居
- 余弦距离
- ...
我只能找到一些用于二进制格式的库,有没有办法使用这些库(除了编写自己的库)?
英文:
I've got several word2vec text files with the following standard layout:
numWords vecSize
word1 vec1 vec2 ...
word2 vec1 vec2 ...
...
Is there any Scala or Java library to read these and calculate simple stuff like:
- isWordInVocab
- getWordVectors
- nearestNeighbours
- cosDistance
- ...
I could find some only for binary formats, is there a way to use these (apart from writing my own one)?
答案1
得分: 0
我刚刚编写了自己的类,以避免整个dl4j/nd4j的导入/设置/运行过程。
英文:
I've just ended up writing my own class to avoid the whole dl4j/nd4j import/setup/run procedure.
通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库,让每个人都能够通过互相帮助和分享经验来进步。
评论