摘要: 最近在学Python金融大数据分析,在安装Python进行大数据分析的环境时遇到很多问题,例如:在安装pandas包时候就要到各种错误,总是缺少很多安装包,最后发现利用Python的Anaconda进行科学计算环境的搭建非常方便。 阅读全文
posted @ 2019-01-15 14:14 袋鼠云dtstack 阅读(429) 评论(0) 推荐(0) 编辑
摘要: 有这样一种场景,用户在自建服务器上存有一定数量级的CSV格式业务数据,某一天用户了解到阿里云的OSS服务存储性价比高(嘿嘿,颜值高),于是想将CSV数据迁移到云上OSS中,并且未来还想对这些数据做一些离线分析,挖掘其中存在价值。 阅读全文
posted @ 2019-01-15 14:09 袋鼠云dtstack 阅读(2121) 评论(1) 推荐(0) 编辑
摘要: ItemCF算法不是根据物品内容的属性计算物品之间的相似度,而是通过分析用户的行为记录来计算用户的相似度。该算法认为物品A和物品B相似的依据是因为喜欢物品A的用户也喜欢物品B。 阅读全文
posted @ 2019-01-15 14:06 袋鼠云dtstack 阅读(10910) 评论(1) 推荐(0) 编辑
摘要: django 接口入参中包含分号时,会出错 阅读全文
posted @ 2019-01-15 14:04 袋鼠云dtstack 阅读(137) 评论(0) 推荐(0) 编辑
摘要: ODPS TUNNEL是一种支持多种数据交换的通用服务,在上传数据时可能源数据会含有一些脏数据,这里以我在生产环境中遇到NUL字符导致上传失败经历做出总结分享。 阅读全文
posted @ 2019-01-15 14:02 袋鼠云dtstack 阅读(410) 评论(0) 推荐(0) 编辑
摘要: 这里主要介绍从MongoDB同步数据到ODPS。ruby环境的搭建以及fluent_plugin_mongo_odps插件的安装。 阅读全文
posted @ 2019-01-15 12:01 袋鼠云dtstack 阅读(1762) 评论(0) 推荐(0) 编辑
摘要: json格式化显示代码 阅读全文
posted @ 2019-01-15 11:57 袋鼠云dtstack 阅读(2092) 评论(0) 推荐(0) 编辑
摘要: How to move a datafile from a file system to ASM Moving a datafile from the file system can be achived in two ways. 阅读全文
posted @ 2019-01-15 11:53 袋鼠云dtstack 阅读(269) 评论(0) 推荐(0) 编辑