各种存储的访问延时数量级备忘参考

那一个时钟周期对应时延多少呢?如果计算机的时钟频率为1 GHz(1,000,000,000 次/秒),那么每个时钟周期的持续时间就是1纳秒(1/1,000,000,000 秒)。CPU中的每个操作至少需要一个时钟周期。处理器的主频越高,其时钟周期就越短,执行操作的速度就越快。所以2.5GHz的CPU,一个周期就是0.4ns。0.3ns对应3.3GHz的CPU。

参考https://medium.com/software-design/why-software-developers-should-care-about-cpu-caches-8da04355bb8a,http://courses.cs.vt.edu/cs2506/Fall2014/Notes/L16.CachePoliciesAndPerformance.pdf

L3命中率监控

[zjh@hs-10-20-30-193 ~]$ sudo perf stat -e LLC-loads,LLC-load-misses,LLC-stores,LLC-store-misses
[sudo] password for zjh: 
^C
 Performance counter stats for 'system wide':

       135,644,720      LLC-loads                                                     (50.00%)
        55,062,702      LLC-load-misses           #   40.59% of all LL-cache hits     (50.01%)
        45,767,090      LLC-stores                                                    (50.00%)
        20,798,249      LLC-store-misses                                              (50.00%)

      13.489676124 seconds time elapsed


[zjh@hs-10-20-30-193 ~]$ sudo perf stat -e LLC-loads,LLC-load-misses,LLC-stores,LLC-store-misses
^C
 Performance counter stats for 'system wide':

     3,094,575,125      LLC-loads                                                     (50.00%)
       791,255,740      LLC-load-misses           #   25.57% of all LL-cache hits     (50.00%)
     1,730,593,334      LLC-stores                                                    (50.00%)
     1,272,444,743      LLC-store-misses                                              (50.00%)

     162.475238461 seconds time elapsed

https://blog.csdn.net/zhizhengguan/article/details/121171670

https://ark.intel.com/products/147528/Intel-Optane-SSD-905P-Series-480GB-2-5in-PCIe-x4-3D-XPoint-

 参考http://blog.infinio.com/relative-speeds-from-ram-to-flash-to-disk

参考:https://en.wikipedia.org/wiki/Solid-state_drive

实际测试最简单的是从一个盘拷贝到另外一个盘,完全没有驱动器缓存的负载(纯粹的dd都没有这么准)。

 

 

 

 

 

 

 

 

 可以发现虽然顺序读貌似理论可以到1GB/s,实际大多函数在300MB+/s。

硬盘:

参考:https://en.wikipedia.org/wiki/Hard_disk_drive_performance_characteristics

内存:

参考:https://en.wikipedia.org/wiki/DDR_SDRAM

1Gb/10Gb/InfiniBand各自的网络延时https://www.cavium.com/Documents/TechnologyBriefs/Adapters/Tech_Brief_Introduction_to_Ethernet_Latency.pdf

 

千兆和万兆以太网卡的价格相差挺大的,好几倍,难怪很多公司还都是千兆网卡为主,参考http://detail.zol.com.cn/net_card/intel/p1281/

7200/10000/15000硬盘的iops

 参考:https://blog.csdn.net/hzhvv/article/details/51745008

raid write back和默认方式的性能对比

参考:http://blog.51cto.com/122269875/2088626

原理:http://www.mamicode.com/info-detail-2032670.html

https://zhuanlan.zhihu.com/p/660991686 cpu的三大周期

https://www.zhihu.com/tardis/bd/ans/2140661896 cpu时钟周期与时延对照

https://zhuanlan.zhihu.com/p/628017496?utm_id=0 用perf跟踪cpu效率

PS:今天遇到个POC环境提供的虚拟机比较差,于是去研究了下cpu的主频,看到intel cpu上有个睿频,经查:

如果处理器内核未达到功率、电流和温度规格阈值,英特尔® 睿频加速技术 2.01 将自动允许其超出基本工作频率运行,加速处理器和图形性能,轻松应对峰值负载。处理器是否启用英特尔® 睿频加速技术 2.0 ,以及保持加速状态的时间,取决于工作负载和操作环境。睿频的实质是多核切换成单核模式然后自动超频。既提高了日常使用的速度,又节能。

最后还有一个问题,为啥1000Mbps的网络,文件传输最大只能到50M。如下:

 

 参考:https://zhidao.baidu.com/question/558440544.html

https://www.intel.cn/content/www/cn/zh/architecture-and-technology/turbo-boost/turbo-boost-technology.html
intel cpu单路速度测试排行:http://www.idn100.com/zuzhuangdiannaopeizhi-pc2849/
intel cpu性能测试:https://www.intel.cn/content/www/cn/zh/benchmarks/intel-data-center-performance.html,https://www.intel.cn/content/www/cn/zh/benchmarks/server/xeon-e5-v4/xeon-e5-v4-server-side-java.html
http://www.ni.com/product-documentation/5897/zhs/
posted @ 2018-08-24 19:03  zhjh256  阅读(662)  评论(0编辑  收藏  举报