Mathematica数据处理(3)
今天,我们来讲一下在数据处理中,比较常用的两个函数,还有一个功能很强大的函数
Rescale
好了,第一个函数是Rescale,他可以使数据归一化
工作原理: x - min/max - min
简单一点说就是可以把数字变到0--1之间
我们来看一个例子:
Rescale[{1, 2, 3, 4}, {0, 10}]
得到
{1/10, 1/5, 3/10, 2/5}
Tally
第二个函数是来统计一个数字的重复次数的
例如
Tally[{1, 1, 2, 2, 3, 3, 3, 4, 5, 5, 5}]
返回
{{1, 2}, {2, 2}, {3, 3}, {4, 1}, {5, 3}}
这是一个非常有用的函数
我们再来看一个例子
x = NormalDistribution[1, 4]; data = Table[IntegerPart[Random[x]], 1000]; datause = Sort@Tally[data] BarChart[Labeled[#2, #1, Above] & @@@ datause, BarSpacing -> None]
第一句话是 产生一个服从正态分布的数
第二句话是 产生1000个随机数,服从上述正态分布
第三句话是 统计出现的频数并排序
第四句话是 将得到的数据画成条形图
得到如下的图
下面就来看一下我觉得非常强大的函数 Import
相信大家都已经用过了,这个函数不仅可以导入文件,也是可以解析网页的
Import["http://blog.csdn.net/WMN7Q/article/category/6357421","Elements"]
这句话可以返回网页中有的元素
<span style="font-size:18px;">{"Data", "FullData", "Hyperlinks", "ImageLinks", "Images","Plaintext", "Source", "Title", "XMLObject"}
这是返回的值
那我们来看一下这个网页中的图片有哪些呢
Import["http://blog.csdn.net/WMN7Q/article/category/6357421","Images"]
于是得到返回值
要是用这个写爬虫,会不会方便很多呢
今天就讲这三个函数。
这篇文徵本来是昨天写的,昨天在做了些其他的,就今天补上,应该一会还会再发一篇的。
2016/8/10
以上,所有。