1-bit-embedding

这里是一篇1bit 量化embedding模型的介绍,相似度计算要快不少,以32倍的压缩率,25倍的检索速度,得到95%的检索准确率,very impressive!

同时也提到了 Sentence Transformers这个专门做embedding的库,支持1万多个embedding模型,有点厉害了!