04 2019 档案
摘要:1、re.compile(pattern, flags=0) 将正则表达式的样式编译为一个 正则表达式对象 (正则对象),可以用于匹配,通过这个对象的方法 match(), search() 以及其他如下描述。 这个表达式的行为可以通过指定 标记 的值来改变。值可以是以下任意变量,可以通过位的OR操
阅读全文
摘要:max_encoder_seq_length = max([len(txt) for txt in input_texts]) encoder_input_data = np.zeros( (len(input_texts), max_encoder_seq_length, num_encoder_
阅读全文
摘要:函数式模型 函数式模型算是本文档比较原创的词汇了,所以这里要说一下 在Keras 0.x中,模型其实有两种,一种叫Sequential,称为序贯模型,也就是单输入单输出,一条路通到底,层与层之间只有相邻关系,跨层连接统统没有。这种模型编译速度快,操作上也比较简单。第二种模型称为Graph,即图模型,
阅读全文
摘要:如果是手动调用 xlwt 这种第三方库除了错可能没法找错误,但是从错误中我们看到错误是由 openpyxl 抛出的,我们试着从 openpyxl 中找解决方案 出错处的代码 value = value[:32767] if next(ILLEGAL_CHARACTERS_RE.finditer(va
阅读全文
摘要:df=df.reset_index(drop=True)
阅读全文
摘要:Teamviewer被检测到商业用途的同学请参考这个博客。http://www.runker.net/teamviewer-jiance.html
阅读全文
摘要:0.909323 with: {'max_depth': 6, 'min_child_weight': 0.8, 'n_estimators': 800} df_huoguo = df[df.company.str.contains(r"(.*?)火锅(.*?)店$")|df.company.str
阅读全文
摘要:raise TypeError("参数q_type 错误 ")
阅读全文
摘要:1、准确率,反映的是所有测试样本,假设一共100个测试样本,预测对了90个,则准确率是90%。 2、准确率适用于所有分类,包括二分类和多分类。 3、但是精确率与召回率,只适用于二分类。其中精确率描述了一个类别被判的准不准,而召回率描述了,测试集中,这个类的召回情况。 举例: 100个样本,由75个正
阅读全文
摘要:实际使用分类器的时候,经常遇到分类样本不均衡的问题。而只有分类样本较为均衡,才可以达到比较好的分类效果。 1、如果各个类别的样本数量都非常多,则对于样本少的类,使用全部样本。 而对于样本多的类,进行采样。采样可以随机采样,或者如果有某一类别里,有一部分数据非常接近,比如奈雪的茶、koi在茶饮里占了几
阅读全文
摘要:Way:from tqdm import tqdmimport pandas as pdtqdm.pandas(desc='pandas bar')df['title_content'] = df.progress_apply(lambda x: _title_content(x['title'],
阅读全文
摘要:使用at 查看当前任务 at -l 或者atq 查看任务执行什么 at -c 配置任务 at 02:00 #离现在最近的02:00的时候 run supervisorctl stop AITalk run supervisorctl restart AITalk 关闭任务 at -d 9 (9是作业
阅读全文
摘要:pprint = pretty printer 经常用来打印 字典、json 打印出的格式会是较为标准的格式 目的:方便调试,查看中间结果,因为觉得设断点调试相对麻烦。 【运行环境:macOS 10.13.3,PyCharm 2017.2.4】 老手: 选中代码行,Alt+Shift+E。 或选中,
阅读全文
摘要:https://www.jianshu.com/p/2d49cb87626b df.groupby('A').size()
阅读全文