CNN检测模型统计检出率

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
X, y = get_feature_charseq()
#max_document_length=64
volcab_file = "volcab.pkl"
assert os.path.exists(volcab_file)
pkl_file = open(volcab_file, 'rb')
data = pickle.load(pkl_file)
valid_chars, max_document_length, max_features = data["valid_chars"], data["max_len"], data["volcab_size"]
 
print "max_features:", max_features
print "max_len:", max_document_length
 
model = get_cnn_model(max_document_length, max_features, is_training=False)
model.load(filename)
 
print "X:", X[:3]
print "Y:", y[:3]
print "len X:", len(X)
X = pad_sequences(X, maxlen=max_document_length, value=0.)
 
result = model.predict(X[1:4])
print result
 
cnt = 0
page = 10000
total_page = int((len(X)+page-1)/page)
print "total_page:", total_page
labels = y
labels_pred = []
for ii in range(0, total_page):
        predictions = model.predict(X[ii*page:ii*page+page])
 
        labels_pred += list(np.argmax(predictions, axis=1))
 
        for i,p in enumerate(predictions):
            i = i+ii*page
 
            if p[1] >= 0.95:
                cnt += 1
print cnt, " total black(0.95)"
print(confusion_matrix(labels, labels_pred))
print(classification_report(labels, labels_pred))

 

posted @   bonelee  阅读(612)  评论(0编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
历史上的今天:
2017-05-23 golang文件读写三种方式——bufio,ioutil和os.create
2017-05-23 kafka备份机制——zk选举leader,leader在broker里负责备份
2017-05-23 splunk的bucket组织目录——时间序列,按照时间来组织目录
2017-05-23 kafka的topic和分区策略——log entry和消息id索引文件
点击右上角即可分享
微信分享提示