embedding嵌入

自然语言处理领域中，"embedding"（嵌入）通常指将高维的数据映射到低维空间的过程。在自然语言处理中，最常见的是词嵌入（word embeddings）

词袋模型，词嵌入等等等等。都需要构建词汇表，个人能力是很有限，根本不可能构建一个效果好的。所以我不使用这些

小型效果也不好，得到96维度的向量。

直接使用dmis-lab/biobert-v1.1

# Load model directly
from transformers import AutoTokenizer, AutoModel

tokenizer = AutoTokenizer.from_pretrained("dmis-lab/biobert-v1.1")
model = AutoModel.from_pretrained("dmis-lab/biobert-v1.1")

结果是三维的

在通过torch.max min mean等进行降维

posted on 2023-11-28 18:02 黑逍逍阅读(54) 评论(0) 收藏举报

刷新页面返回顶部

公告