摘要:
最近在学Python金融大数据分析,在安装Python进行大数据分析的环境时遇到很多问题,例如:在安装pandas包时候就要到各种错误,总是缺少很多安装包,最后发现利用Python的Anaconda进行科学计算环境的搭建非常方便。 阅读全文
摘要:
有这样一种场景,用户在自建服务器上存有一定数量级的CSV格式业务数据,某一天用户了解到阿里云的OSS服务存储性价比高(嘿嘿,颜值高),于是想将CSV数据迁移到云上OSS中,并且未来还想对这些数据做一些离线分析,挖掘其中存在价值。 阅读全文
摘要:
ItemCF算法不是根据物品内容的属性计算物品之间的相似度,而是通过分析用户的行为记录来计算用户的相似度。该算法认为物品A和物品B相似的依据是因为喜欢物品A的用户也喜欢物品B。 阅读全文
摘要:
django 接口入参中包含分号时,会出错 阅读全文
摘要:
ODPS TUNNEL是一种支持多种数据交换的通用服务,在上传数据时可能源数据会含有一些脏数据,这里以我在生产环境中遇到NUL字符导致上传失败经历做出总结分享。 阅读全文
摘要:
这里主要介绍从MongoDB同步数据到ODPS。ruby环境的搭建以及fluent_plugin_mongo_odps插件的安装。 阅读全文
摘要:
json格式化显示代码 阅读全文
摘要:
How to move a datafile from a file system to ASM Moving a datafile from the file system can be achived in two ways. 阅读全文