ChevisZhang

2020年8月11日

摘要： Logistic Regression: 1.由线性回归，加上sigmoid得来 2. 线性回归得到的是一个值，Logistic Regression得到的是一个概率 3. sigmoid函数减少了极端值的影响 4. 如果样本不是线性回归可处理的，那么logistic regression效果就比较阅读全文

posted @ 2020-08-11 12:15 ChevisZhang 阅读(227) 评论(0) 推荐(0) 编辑

2020年8月10日

快速排序

摘要： https://www.runoob.com/w3cnote/quick-sort.html 1. 双指针，left, right ， while left < right: 一直重复 2. 2. 每次递归，取l s[ left ] 为temp a) 从right往回遍历，找到第一个比temp小的数阅读全文

posted @ 2020-08-10 22:48 ChevisZhang 阅读(98) 评论(0) 推荐(0) 编辑

数据预处理总结

摘要： 1. 离散化 a) 无序变量离散化—— OneHotEncoder b）有序变量离散化等宽划分：按照相同宽度将数据分成几等份。缺点是受到异常值的影响比较大。 pandas.cut方法可以进行等宽划分。等频划分：将数据分成几等份，每等份数据里面的个数是一样的。pandas.qcut方法可以进行等频阅读全文

posted @ 2020-08-10 18:44 ChevisZhang 阅读(345) 评论(0) 推荐(0) 编辑

正则化 / 特征选择

摘要： https://www.jianshu.com/p/569efedf6985 L1/L2/特征选择看它就够了 https://www.cnblogs.com/nolonely/p/6435083.html https://www.zhihu.com/question/26485586 还有就是 L 阅读全文

posted @ 2020-08-10 11:08 ChevisZhang 阅读(293) 评论(0) 推荐(0) 编辑

424. 替换后的最长重复字符 sliding window中的注意点

摘要： sliding window中几个注意点 1. right+=1的地方，有两个位置 a) 一个是放在left内层循环上 b) 一个是放在外层循环最后，这样相当于用的for循环 2. 更新条件，像最长子串这种result，一般是在内层循环结束之后 a) 这是因为判断条件一般都是 res > condi 阅读全文

posted @ 2020-08-10 09:20 ChevisZhang 阅读(82) 评论(0) 推荐(0) 编辑

2020年8月9日

自然语言处理算法精讲P3

摘要： 3.1跳过 3.2跳过 3.3语言与智能：信息熵 1)Claude Shannon: 更多研究从高校转移到企业 2) information Entropy： 3）熵 a) 熵是一个信息增量函数 H（x） >=0 b) 发生概率越低的事件，信息量越大; H（x）与P（x）成反比 c) H(x1，x 阅读全文

posted @ 2020-08-09 15:04 ChevisZhang 阅读(163) 评论(0) 推荐(0) 编辑

2020年8月5日

76. 最小覆盖子串

摘要：思路： 1. 本题是sliding window模板解法，与3.无重复的最长子串一样 2. a) 执行外层循环，右指针++，直到满足条件 b) 满足条件后更新min_len c) 满足条件后启动内层循环，左指针++，直到不满足条件 3. 使用了 defaultdict 阅读全文

posted @ 2020-08-05 14:50 ChevisZhang 阅读(67) 评论(0) 推荐(0) 编辑

3.无重复字符的最长子串 —— sliding window

摘要：注意： 1. max_len = max( max_len, right-left) 这里是right-left 而不是right-left+1，因为进入第一层循环后right+=1了 2. 做最大值判断的地方，放在二重循环判断完后。 3. 本题解法是sliding window的模板，可背下来 4 阅读全文

posted @ 2020-08-05 14:47 ChevisZhang 阅读(89) 评论(0) 推荐(0) 编辑

自然语言处理算法精讲 P1

摘要： 1.3 NLP六个重要术语 Syntax: 词性分类 Morphology: 时态（现在时，过去时，第三人称） Semantics：词意 1.4 语言学的发展史1 罗素悖论：自己索引自己时，发生的悖论例：存在两种书，A种书索引自己，B种书不索引自己现要写一本大全C汇总A,B，索引自己和不索引阅读全文

posted @ 2020-08-05 11:09 ChevisZhang 阅读(133) 评论(0) 推荐(0) 编辑

2020年8月4日

18.四数之和

摘要： 1. 两数之和，三数之和，四数之和，核心思想都是通过排序与双指针，将内层的两层循环变成一层，从而降低时间复杂度 2. 注意： a) 防止重复解，对循环指针： if k>0 and nums[k-1] == nums[k]: continue 对双指针： while i<j and nums[i-1] 阅读全文

posted @ 2020-08-04 09:52 ChevisZhang 阅读(113) 评论(0) 推荐(0) 编辑

公告