2018 年 6月 4 日随笔档案 - 张叫兽的技术研究院

Apache Spark 内存管理详解

摘要：在spark里面，内存管理有两块组成，一部分是JVM的堆内内存（on-heap memory），这部分内存是通过spark dirver参数executor-memory以及spark.executor.memory来进行指定；另外一部分是堆外内存（off-heap memory），堆外内存默认是阅读全文

posted @ 2018-06-04 10:04 张叫兽的技术研究院阅读(214) 评论(0) 推荐(0) 编辑

Python与机器学习

摘要： pandas里面的对于数据操作比如where，drop以及dropna等都会有一个属性：inplace，这个单词意思是原地，如果inplace=true代表数据本身要返回（原地数据也会被改变）；如果inplace=false（默认）代表只是返回数据一个副本（copy，原数据并不会被改变）。 Data 阅读全文

posted @ 2018-06-04 09:59 张叫兽的技术研究院阅读(781) 评论(0) 推荐(0) 编辑

Jupyter和IPython

摘要： Jupyter内核就是IPython（Interactive Python）；你看到的按tab键能够自动提示/补齐都是IPython实现的。 IPython其实不只限于IPython，其实你看到的IDE里面的tab键自动感应都是IPython的实现，比如Pycharm里面的Anaconda库就是包含阅读全文

posted @ 2018-06-04 09:24 张叫兽的技术研究院阅读(212) 评论(0) 推荐(0) 编辑

Builder模式

摘要： Builder模式有什么好处？构造函数构造一个函数的好处就是直接，但是缺点就是如果参数比较多，需要重载构造函数或者一个构造函数里面定义多个构造参数，对于调用方来讲十分不友好；另外一种方式就是java bean模式，定义一个简洁的构造函数，然后通过set属性的方式来构造；这种方式避免了构造函数模式阅读全文

posted @ 2018-06-04 09:10 张叫兽的技术研究院阅读(208) 评论(0) 推荐(0) 编辑

下士闻道

Apache Spark 内存管理详解

Python与机器学习

Jupyter和IPython

Builder模式

导航

公告