Word2Bits-量化词向量Word2Bits扩展了Word2Vec算法,以输出高质量的量化词向量,该向量的存储量比常规词向量少8到16倍。
在阅读详细信息。
什么是量化词向量?量化词向量是词向量,其中每个参数是2^bitlevel值之一。
例如,“国王”的1位量化矢量看起来像0.333333340.333333340.33333334-0.33333334-0.33333334-0.333333340.333333340.33333334-0.333333340.333333340.33333334...由于参数限制为2^bitlevel值之一,因此每个参数仅使用bitlevel位来表示;
这大大减少了词向量占用的存储量。
下载预训练的单词向量所有单词向量均为Glove/Fasttext格式(格式详细信息)。
使用gzip压缩文件。
每个参数位
2023/10/13 10:57:49
1.2MB
C++
1