keras pad_sequences

pad_sequences 大白话的意思就是:

  • 空位补零

import keras
from keras.preprocessing.text import Tokenizer
tokenizer = Tokenizer()

#  text
text = ["今天 北京 下 雨 了", "我 今天 加班"]

#  fit_on_texts 方法
tokenizer.fit_on_texts(text)

print(tokenizer.word_index)
#{'今天': 1, '了': 2, '北京': 3, '下': 4, '雨': 5, '我': 6, '加班': 7}
tlist=tokenizer.texts_to_sequences(["下 雨 我 加班"])

print(tlist)

#[[3, 4, 6, 7]]
alist=keras.preprocessing.sequence.pad_sequences(tlist, maxlen=10)
print(alist)
#[[0 0 0 0 0 0 3 4 6 7]]
posted @   luoganttcc  阅读(3)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
点击右上角即可分享
微信分享提示