09 2021 档案

摘要: 阅读全文
posted @ 2021-09-30 14:36 今夜无风 阅读(25) 评论(0) 推荐(0) 编辑
摘要:背景介绍 阿里巴巴的生态系统下面有很多的计算平台,上面有各种各样的业务层,最中间是买家和卖家之间包括销售、支付等等之间的关系,外面建了一圈从娱乐到广告到金融到购物到物流等等各方面这样一个生态,中间有非常多的数据能够关联起来,所以对于阿里巴巴而言,这个图可以非常简练的概括我们在做什么,中间是最重要的数 阅读全文
posted @ 2021-09-30 14:20 今夜无风 阅读(632) 评论(0) 推荐(0) 编辑
摘要:如果我们要找dataFrame数据中某列中特有的行数据,可以结合re: 1)pandas.series.str.contains(): 包含查找 2) pandas.series.str.match(): 完全匹配查找 示例: df[df["一级code"].astype(str).str.matc 阅读全文
posted @ 2021-09-28 10:22 今夜无风 阅读(731) 评论(0) 推荐(0) 编辑
摘要:package example; import com.alibaba.fastjson.JSON; import com.alibaba.fastjson.JSONObject; import com.techwolf.oceanus.text.understand.util.FileUtil; 阅读全文
posted @ 2021-09-23 21:41 今夜无风 阅读(81) 评论(0) 推荐(0) 编辑
摘要:吃药的能力! 前阵子跟朋友聊天,说到他的创业。 他说如今每一项都会把时间精打细算,不管是工作,还是看书、跑步。 有时候太累了或者犯懒了,早上起不来,就会强制自己起来。 一路上看到很多机会,又要让自己抵制诱惑从而专注。 凡此种种,都是“反人性”的坚持。 整个过程就如同吃药。 人有各种病,各种身体不舒服 阅读全文
posted @ 2021-09-13 09:42 今夜无风 阅读(59) 评论(0) 推荐(0) 编辑
摘要:问题: # 给定一个非空字符串 s 和一个包含非空单词的列表 wordDict,判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词。 # # 说明: # # # 拆分时可以重复使用字典中的单词。 # 你可以假设字典中没有重复的单词。 # def wordBreak(s, wordDict): 阅读全文
posted @ 2021-09-09 18:22 今夜无风 阅读(32) 评论(0) 推荐(0) 编辑
摘要:nlp工程师如何提升工程能力? 如何培养属于自己一套完整的NLP方法论? 对业务场景、用户动机、数据特性要理解透彻,才能做出最适合的模型结构。 阅读全文
posted @ 2021-09-09 09:57 今夜无风 阅读(43) 评论(0) 推荐(0) 编辑
摘要:问题: # 给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。 # # 说明: # # 你的算法应该具有线性时间复杂度。 你可以不使用额外空间来实现吗? # # 示例 1: # # 输入: [2,2,1]# 输出: 1 方法:不需要额外空间实现,就 阅读全文
posted @ 2021-09-09 08:15 今夜无风 阅读(274) 评论(0) 推荐(0) 编辑
摘要:问题: # 给定一个未排序的整数数组 nums ,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。 # # 请你设计并实现时间复杂度为 O(n) 的算法解决此问题。 解决:遍历每一个数,若是从起点开始数是复合要求,就遍历下一个,之后维护最大值 # leetcode submit reg 阅读全文
posted @ 2021-09-08 21:49 今夜无风 阅读(28) 评论(0) 推荐(0) 编辑
摘要:方法: dfs,递归 def maxPathSum(root): max_sum = -float("inf") # 存放全局最大值 def dfs(root): nonlocal max_sum # 可修改上层函数变量 if not root: return 0 l = dfs(root.left 阅读全文
posted @ 2021-09-08 14:35 今夜无风 阅读(226) 评论(0) 推荐(0) 编辑
摘要:问题: # 给你二叉树的根结点 root ,请你将它展开为一个单链表: # # # 展开后的单链表应该同样使用 TreeNode ,其中 right 子指针指向链表中下一个结点,而左子指针始终为 null 。 # 展开后的单链表应该与二叉树 先序遍历 顺序相同。 # # # # # 示例 1: # 阅读全文
posted @ 2021-09-07 17:58 今夜无风 阅读(188) 评论(0) 推荐(0) 编辑
摘要:思路: 1、由二叉树的前(先)序序列和中序序列建立该二叉树 分析:若二叉树的任意两个结点的值都不相同,则二叉树的前序序列和中序序列能唯一确定一棵二叉树。另外,由前序序列和中序序列的定义可知,前序序列中第一个结点必为根结点,而在中序序列中,根结点刚好是左、右子树的分界点,因此,可按如下方法建立二叉树: 阅读全文
posted @ 2021-09-06 22:14 今夜无风 阅读(684) 评论(0) 推荐(0) 编辑
摘要:问题: # 给定一个二叉树,找出其最大深度。 # # 二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。 # # 说明: 叶子节点是指没有子节点的节点。 方法:迭代 def maxDepth(root): """ 在栈的帮助下将递归转换为迭代 :param root: :return: """ 阅读全文
posted @ 2021-09-06 10:54 今夜无风 阅读(148) 评论(0) 推荐(0) 编辑
摘要:问题: # 给你一个二叉树,请你返回其按 层序遍历 得到的节点值。 (即逐层地,从左到右访问所有节点)。 方法:广度优先遍历 # leetcode submit region begin(Prohibit modification and deletion) # Definition for a b 阅读全文
posted @ 2021-09-03 20:02 今夜无风 阅读(241) 评论(0) 推荐(0) 编辑
摘要:问题: # 给定一个二叉树,检查它是否是镜像对称的。 # # # # 例如,二叉树 [1,2,2,3,4,4,3] 是对称的。 方法:递归 # leetcode submit region begin(Prohibit modification and deletion) # Definition 阅读全文
posted @ 2021-09-03 16:14 今夜无风 阅读(33) 评论(0) 推荐(0) 编辑
摘要:拿数据标注业务来说,学者们通过一些技术手段或者数学方法来降低人们标注的成本,学者们把这个方向称之为主动学习(Active Learning)。在整个机器学习建模的过程中有人工参与的部分和环节,并且通过机器学习方法筛选出合适的候选集给人工标注的过程。主动学习(Active Learning)的大致思路 阅读全文
posted @ 2021-09-03 14:33 今夜无风 阅读(249) 评论(0) 推荐(0) 编辑
摘要:问题: # 给定一个二叉树,判断其是否是一个有效的二叉搜索树。 # # 假设一个二叉搜索树具有如下特征: # # # 节点的左子树只包含小于当前节点的数。 # 节点的右子树只包含大于当前节点的数。 # 所有左子树和右子树自身必须也是二叉搜索树。 方法:二叉搜索树的中序遍历是排序好的 # 是否是升序, 阅读全文
posted @ 2021-09-03 14:16 今夜无风 阅读(122) 评论(0) 推荐(0) 编辑
摘要:题目: # 给你一个整数 n ,求恰由 n 个节点组成且节点值从 1 到 n 互不相同的 二叉搜索树 有多少种?# 返回满足题意的二叉搜索树的种数。 方法:动态规划 # leetcode submit region begin(Prohibit modification and deletion) 阅读全文
posted @ 2021-09-02 21:08 今夜无风 阅读(38) 评论(0) 推荐(0) 编辑