摘要: [0] test merror:0.254804 [1] test merror:0.247885 [2] test merror:0.24427 [3] test merror:0.240677 [4] test merror:0.238474 [5] test merror:0.234763 [ 阅读全文
posted @ 2019-04-26 14:11 chenxiangzhen 阅读(5125) 评论(0) 推荐(1) 编辑
摘要: gen_sample_by_captcha.py 生成验证码图片 sample.py 配置文件 verify_and_split_data.py train_model_v2.py 训练模型,训练过程中同时输出训练集和验证集的准确率 训练结果 test_batch.py 批量验证 程序结果 封装识别 阅读全文
posted @ 2019-04-16 15:51 chenxiangzhen 阅读(1037) 评论(0) 推荐(0) 编辑
摘要: 基于检索的智能问答。目前使用了简单词汇对比、词性权重、词向量3种相似度计算模式。输入符合格式的QA文本文件即可立刻使用。 程序版本和依赖库 使用 python3 运行 jieba 分词使用的库 gensim 词向量使用的库,如果使用词向量vec模式,则需要载入 依赖的文件 如果使用词向量vec模式, 阅读全文
posted @ 2019-04-15 17:33 chenxiangzhen 阅读(1101) 评论(1) 推荐(0) 编辑
摘要: 监督学习 0.线性回归(加L1、L2正则化) Coefficients: [0.0,0.32292516677405936, 0.3438548034562218,1.9156017023458414,0.05288058680386263,0.765962720459771,0.0, 0.1510 阅读全文
posted @ 2019-04-15 15:31 chenxiangzhen 阅读(473) 评论(0) 推荐(0) 编辑
摘要: 无监督学习 0.K means predicted Center: {'prediction': 0} {'prediction': 0} {'prediction': 0} {'prediction': 1} {'prediction': 1} {'prediction': 1} Cluster 阅读全文
posted @ 2019-04-15 15:14 chenxiangzhen 阅读(676) 评论(0) 推荐(0) 编辑
摘要: When I write PySpark code, I use Jupyter notebook to test my code before submitting a job on the cluster. In this post, I will show you how to install 阅读全文
posted @ 2019-04-14 18:03 chenxiangzhen 阅读(2526) 评论(0) 推荐(0) 编辑
摘要: 特征工程 对连续值处理 0.binarizer/二值化 Binarizer output with Threshold = 5.100000 + + + + | id|feature|binarized_feature| + + + + | 0| 1.1| 0.0| | 1| 8.5| 1.0| | 阅读全文
posted @ 2019-04-14 16:59 chenxiangzhen 阅读(421) 评论(1) 推荐(0) 编辑
摘要: 本项目使用文本卷积神经网络,并使用 " " 数据集完成电影推荐的任务。 推荐系统在日常的网络应用中无处不在,比如网上购物、网上买书、新闻app、社交网络、音乐网站、电影网站等等等等,有人的地方就有推荐。根据个人的喜好,相同喜好人群的习惯等信息进行个性化的内容推荐。比如打开新闻类的app,因为有了个性 阅读全文
posted @ 2019-04-09 13:33 chenxiangzhen 阅读(13575) 评论(0) 推荐(2) 编辑
摘要: 相似度就是比较两个事物的相似性。一般通过计算事物的特征之间的距离,如果距离小,那么相似度大;如果距离大,那么相似度小。 问题定义:有两个对象X,Y,都包含N维特征,X=(x1,x2,x3,...,xn),Y=(y1,y2,y3,...,yn),计算X和Y的相似性。 闵可夫斯基距离(Minkowski 阅读全文
posted @ 2019-04-03 14:16 chenxiangzhen 阅读(39877) 评论(0) 推荐(1) 编辑
摘要: ``` from sklearn.datasets import make_classification from sklearn.model_selection import cross_val_score from sklearn.ensemble import RandomForestClassifier as RFC from sklearn.svm import SVC from ba... 阅读全文
posted @ 2019-04-01 15:53 chenxiangzhen 阅读(3517) 评论(0) 推荐(0) 编辑