07 2019 档案
摘要:R在GIS中用ggmap地理空间数据分析
阅读全文
摘要:原文 :http://tecdat.cn/?p=984 电商行业智能推荐引擎的探索 机器学习助力母婴电商 概要 拓端帮助国内母婴电商公司创建智能推荐引擎,由此打造精准、高效的购物体验,探索如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的解决方案。 业务挑战 随
阅读全文
摘要:R语言实现MCMC中的Metropolis–Hastings算法与吉布斯采样
阅读全文
摘要:R语言:EM算法和高斯混合模型的实现
阅读全文
摘要:原文:http://tecdat.cn/?p=3994 对于非结构化的网站中文评论信息,r的中文词频包可能是用来挖掘其潜在信息的好工具,要分析文本内容,最常见的分析方法是提取文本中的词语,并统计频率。频率能反映词语在文本中的重要性,一般越重要的词语,在文本中出现的次数就会越多。词语提取后,还可以做成
阅读全文
摘要:原文链接:http://tecdat.cn/?p=4012 美国调查公司盖洛普公司(Gallup poll found)民调显示,至少51%美国人不赞同总统特朗普的政策。据外媒报道,特朗普上任8天以来引发51%美国人的不满,42%美国人赞同新总统的政策。该项调查共有1500名成年美国人,误差为3%。
阅读全文
摘要:原文链接:http://tecdat.cn/?p=4027 业务背景 电子邮件的应用变的十分广泛,它给人们的生活带来了极大的方便,然而,作为其发展的副产品——垃圾邮件,却给广大用户、网络管理员和ISP(Internet服务提供者)带来了大量的麻烦。垃圾邮件问题日益严重,受到研究人员的广泛关注。 垃圾
阅读全文
摘要:原文链接:http://tecdat.cn/?p=4034 大数据时代,数字媒体凭借自身的技术优势,以独特的新闻信息采访形式、表达方式和传播方式等多方面优势给传统媒体造成了较大冲击。传统媒体应用互联网思维改造自身,以用户为中心,产品与服务为导向,进行内容、渠道、平台、经营、管理一体化建设,找到与数字
阅读全文
摘要:原文链接:http://tecdat.cn/?p=3231 在当今社会,“信用”越来越多的人们关注个人或企业,有望获得最高的信用评分,以享受更多的信贷额度,更优惠的利率。 那么我们如何评分信用,并使我们的客户可视化? 自组织地图(SOM)是一种无监督的数据可视化技术,可用于在较低(通常为2)维可视化
阅读全文
摘要:众所周知,在证券投资领域将涉及很多数据,因此,通过简单的处理难以有效地分析各种公司股票之间的关系,而关联规则挖掘可以很好的解决这个问题,它允许投资在大量数据中,发现企业股票的相关性,以进一步研究和分析。是股民的得力助手! 我们从2015年1月至2016年1月收集了香港部分上市公司的股票交易数据,作为
阅读全文
摘要:如何衡量电商存量用户的价值?是上一次购买时间?消费金额?还是购买次数?通过什么模型进行用户细分对营销活动提升用户的响应率最有效? 如果一个电商店铺在2017年4月要开展营销活动,需要对老用户进行优惠券、短信、邮件营销。但是营销费用只够给支持2000个用户。 那么我们可以通过RFM模型选择,选择最有可
阅读全文
摘要:原文链接: http://tecdat.cn/?p=3825 互联网+下不同时空如何建立合适的指标分析出租车“供求匹配”的程度?由于出租车供求匹配,以及一系列的补贴方案涉及到可行性的问题,我们采用出租车轨迹数据做出相应的解答。 出租车上下客高峰期 查看不同城市的出租车上下客高峰期的时间段。从深圳市的
阅读全文
摘要:原文链接:http://tecdat.cn/?p=2857 本文是通过对area,perimeter,campactness几个变量的贝叶斯建模,来查看他们对groovelength这个变量的影响. 并且对比rjagsR2jags和内置贝叶斯预测函数的结果。 读取数据 read data seed=
阅读全文
摘要:原文链接:http://tecdat.cn/?p=494 移动平均线是技术分析中最常用的,作为一种简单有效的数学模型而被广泛使用。均线使用的方式的差异在于均线的计算方式与价格使用方式。不同的均线计算方式会产生不同的结果,不同的价格使用也会有不同的效果。此外,使用一条、两条、三条甚至更多条均线的交易策
阅读全文
摘要:原文链接:http://tecdat.cn/?p=5393 研究煤矿隐患数据的挖掘以实现海量隐患数据的有效利用,在分析矿山数据挖掘枝术和煤矿隐患数据特点的基础上,提出煤矿隐患数据挖掘是矿山数字化的重要组成部分,给出煤矿隐患数据挖掘的概念,设计了煤矿隐患数据挖掘模型,并进一步分析了适用于煤矿隐患数据的
阅读全文