摘要:
今天开始学习对pdf进行解析构建获取实体构建知识图谱 阅读全文
摘要:
今天开始学习知识图谱构建中的实体识别关系抽取等知识,在网上找了一些代码进行练手 阅读全文
摘要:
今天分析汽车之家汽车销量界面,爬取了10年每个月的汽车销量排行 阅读全文
摘要:
今天修改了开题报告,确定系统需要完成的功能,以及进度的安排 修改PPT完善其中的流程图数据流图 阅读全文
摘要:
1.数据采集 爬取公司年报、网站信息、新闻等和车销量,利润有关的数据 2.修改开题报告和PPT,完善流程图 3.搭建项目框架 阅读全文
摘要:
这周加深了决策树算法的学习,了解了其中的优缺点 决策树的优点: 一、 决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。 二、 对于决策树,数据的准备往往是简单或者是不必要的.其他的技术往往要求先把数据一般化,比如去掉多余的或者空白的属性。 三、 能够同时处理数据型和常规型属性 阅读全文
摘要:
我们的软件杯项目选题是手写输入法,在经过一天的考虑我们团队决定使用c#加上微软的ink接口以及table_PC面板来进行编写,我们当前完成了单字多字识别,以及候选字的功能 阅读全文
摘要:
这周学习了鸢尾花算法 构建模型后,在需要使用模型进行预测前,需要验证模型是否有效,就需要有验证模型的数据集。数据分割:把数据分为训练集和测试集scikit-learn的train_test_split函数可以打乱数据集并进行拆分。这个函数将75%的行数据及对应标签(样本)作为训练集,剩下的25%作为 阅读全文
摘要:
这周开始解除了机器学习中分类算法 标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类) 数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等 (数值型目标变量主要用于回归分析) 整个开发流程:收集数据——准备数据——分析数据——训练算法 阅读全文
摘要:
对于技术非常棒的人们(当你遇到难题必须解决时,向这些高手求助总能圆满解决)而言,一个挑战就是他们通常很难相处。他们与人沟通的方式或方法完全集中在细枝末节的正确性上。这种描述是不是听着有些耳熟?通常,你很少能坚持到谈话结束,因为这些人对最小的错误变化都详细地进行分析。当你听完问题的解释,你可能已经很累 阅读全文