摘要:
目标: 我们内部系统里记录的酒店名字是由很多人输入的,每个人输入的可能不完全一样,比如,‘成都凯宾斯基大酒店’, ‘凯宾斯基酒店’, ‘凯宾斯基’, 我们的初步想法是能不能把大量的记录归类,把很多相似的名字归成一类,然后自动给出一个建议的名字 向量化和建模: 大概的想法是,先找出一个相似性算法,然后 阅读全文
摘要:
https://www.e-learn.cn/content/qita/814122 Ref: Pytorch中的自动求导函数backward()所需参数含义 阅读全文
摘要:
YOLO包括 V1, V2, V3 YOLO v1:2016 优点:快,45fps,泛化性能好 缺点:检测小物体不太行, 如成群的鸟. 与 Fast R-CNN相比,定位不太准 YOLO的网络结构 YOLO v1 network (没看懂论文上的下图,看下面这个表一目了然了) 24层的卷积层,开始用 阅读全文
摘要:
https://towardsdatascience.com/real-time-and-video-processing-object-detection-using-tensorflow-opencv-and-docker-2be1694726e5 https://www.pyimagesear 阅读全文
摘要:
Homepage https://stanfordnlp.github.io/CoreNLP/index.html Source Code: https://github.com/stanfordnlp/CoreNLP https://github.com/Lynten/stanford-coren 阅读全文
摘要:
ArrayList和LinkedList的区别 【Java】——数组、List和ArrayList、LinkedList 的区别 Heap python数据结构之堆(heap) 数据结构:堆(Heap) Hash Table: Python数据结构——散列表 Stack https://blog.c 阅读全文
摘要:
Feature Enigneering 经用 sns.distplot 测试 一个Series 做 StandardScaler().fit_transform(Seriese) 之前和之后的图形形状没有改变,所以skew 和 kurt 没有改变. 只是按照比例缩小了. 这种操作在机器学习里也叫 f 阅读全文
摘要:
week 3 Classification KNN :基本思想是 input value 类似,就可能是同一类的 Decision Tree Naive Bayes Week 4 Evaluating model Over-fitting 怎么在Decision Tree 训练时避免 overfit 阅读全文
摘要:
Week 1 Machine Learning with Big Data KNime - GUI based Spark MLlib - inside Spark CRISP-DM Week 2, Data Exploration 一般有两种方法,summary statistics 和 visu 阅读全文
摘要:
Week 5, Big Data Analytics using Spark Programing in Spark Spark Core: Programming in Spark using RDD in pipelines RDD 创建过后,会有两种操作,Transformation 和 Ac 阅读全文