摘要:
记录一些已经看过的题目。https://blog.csdn.net/v_JULY_v/article/details/78121924 1 请简要介绍下SVM,机器学习 ML模型 易 SVM,全称是support vector machine,中文名叫支持向量机。SVM是一个面向数据的分类算法,它的 阅读全文
摘要:
隐含狄利克雷分布 简称LDA(Latent Dirichlet allocation),首先由Blei, David M.、吴恩达和Jordan, Michael I于2003年提出,目前在文本挖掘领域包括文本主题识别、文本分类以及文本相似度计算方面都有应用。 LDA就是在pLSA的基础上加层贝叶斯 阅读全文
摘要:
上一篇介绍完基础版后,罗列一些公式和model。 正经的理解LDA,分为以下5个步骤: 一个函数:gamma函数 四个分布:二项分布、多项分布、beta分布、Dirichlet分布 一个概念和一个理念:共轭先验和贝叶斯框架 两个模型:pLSA、LDA 一个采样:Gibbs采样 共轭分布与共轭先验: 阅读全文
摘要:
最近针对项目中涉及到的APP描述信息分类问题,有针对性地学习了LDA主题模型,发现涉及内容较多,有必要记录一下。接下来从简单到复杂: 什么是主题模型? 所谓主题模型,就是给定一篇文档,我去判断这篇文章是属于什么类别的文档,例如文章中出现吴恩达,可能就是一篇机器学习相关文档。现在我们给出一篇文档,我们 阅读全文
摘要:
35.Search Insert Position 获取到输入值应该出现在的位置,比较简单,今天状态不太好,在换季,时冷时热有点热感冒。 阅读全文
摘要:
28. Implement strStr() 在一个字符串中匹配一个子字符串,如果子字符串在该字符串中,则返回第一次出现的指针。很尴尬,python的string类型里面就有这个方法,find()。但是我觉得面试肯定不能这样,我就用了一个复杂度为O(n*m)的笨方法,就是遍历。但是还有一种更好的方法 阅读全文
摘要:
今天被拉去干活,用了一下pandas模块,有些不太懂的地方,明天记录一下。 26. Remove Duplicates from Sorted Array 在已经排好序的数组里面去除重复的数值,要求每一个数值只有一个,并且修改该数组并返回新数组长度。 27. Remove Element 这道题比较 阅读全文
摘要:
21. Merge Two Sorted Lists 这道题类似于中等难度的第一道题,所以写起来就比较容易。先生成一个头结点,初始化一下。因为这两个List已经排好序了,所以先当两个List都不空时,逐个判断,添加到新List即可,记得维护指针,往后顺延。跳出循环肯定是有一个List到头了,所以在之 阅读全文
摘要:
20. Valid Parentheses 这道题主要是给一串字符串,都有'(', ')', '{', '}', '[' 和 ']'主要是判断这一串字符串是否符合符号匹配规则,思想类似于堆栈,但是python没有堆栈这种数据结构,所以我采用一个List来模拟堆栈,在添加第一个字符遇到了问题,就是如果 阅读全文
摘要:
今天是周五,元宵节。猿宵节,是程序猿通宵赶代码的中国传统节日。在此佳节来临之际,恭祝全国程序猿节日快乐,永不加班! 14. Longest Common Prefix 求最长公共前缀,这道题是求一个List里面所有字符串的最长公共前缀,其实就是按位比对字符即可,如果相同,记录上,当不符合条件时,返回 阅读全文