各种存储的访问延时数量级备忘参考
那一个时钟周期对应时延多少呢?如果计算机的时钟频率为1 GHz(1,000,000,000 次/秒),那么每个时钟周期的持续时间就是1纳秒(1/1,000,000,000 秒)。CPU中的每个操作至少需要一个时钟周期。处理器的主频越高,其时钟周期就越短,执行操作的速度就越快。所以2.5GHz的CPU,一个周期就是0.4ns。0.3ns对应3.3GHz的CPU。
参考https://medium.com/software-design/why-software-developers-should-care-about-cpu-caches-8da04355bb8a,http://courses.cs.vt.edu/cs2506/Fall2014/Notes/L16.CachePoliciesAndPerformance.pdf
L3命中率监控
[zjh@hs-10-20-30-193 ~]$ sudo perf stat -e LLC-loads,LLC-load-misses,LLC-stores,LLC-store-misses [sudo] password for zjh: ^C Performance counter stats for 'system wide': 135,644,720 LLC-loads (50.00%) 55,062,702 LLC-load-misses # 40.59% of all LL-cache hits (50.01%) 45,767,090 LLC-stores (50.00%) 20,798,249 LLC-store-misses (50.00%) 13.489676124 seconds time elapsed [zjh@hs-10-20-30-193 ~]$ sudo perf stat -e LLC-loads,LLC-load-misses,LLC-stores,LLC-store-misses ^C Performance counter stats for 'system wide': 3,094,575,125 LLC-loads (50.00%) 791,255,740 LLC-load-misses # 25.57% of all LL-cache hits (50.00%) 1,730,593,334 LLC-stores (50.00%) 1,272,444,743 LLC-store-misses (50.00%) 162.475238461 seconds time elapsed
https://blog.csdn.net/zhizhengguan/article/details/121171670
https://ark.intel.com/products/147528/Intel-Optane-SSD-905P-Series-480GB-2-5in-PCIe-x4-3D-XPoint-
参考http://blog.infinio.com/relative-speeds-from-ram-to-flash-to-disk
参考:https://en.wikipedia.org/wiki/Solid-state_drive
实际测试最简单的是从一个盘拷贝到另外一个盘,完全没有驱动器缓存的负载(纯粹的dd都没有这么准)。
可以发现虽然顺序读貌似理论可以到1GB/s,实际大多函数在300MB+/s。
硬盘:
参考:https://en.wikipedia.org/wiki/Hard_disk_drive_performance_characteristics
内存:
参考:https://en.wikipedia.org/wiki/DDR_SDRAM
1Gb/10Gb/InfiniBand各自的网络延时https://www.cavium.com/Documents/TechnologyBriefs/Adapters/Tech_Brief_Introduction_to_Ethernet_Latency.pdf
千兆和万兆以太网卡的价格相差挺大的,好几倍,难怪很多公司还都是千兆网卡为主,参考http://detail.zol.com.cn/net_card/intel/p1281/
7200/10000/15000硬盘的iops
参考:https://blog.csdn.net/hzhvv/article/details/51745008
raid write back和默认方式的性能对比
参考:http://blog.51cto.com/122269875/2088626
原理:http://www.mamicode.com/info-detail-2032670.html
https://zhuanlan.zhihu.com/p/660991686 cpu的三大周期
https://www.zhihu.com/tardis/bd/ans/2140661896 cpu时钟周期与时延对照
https://zhuanlan.zhihu.com/p/628017496?utm_id=0 用perf跟踪cpu效率
PS:今天遇到个POC环境提供的虚拟机比较差,于是去研究了下cpu的主频,看到intel cpu上有个睿频,经查:
如果处理器内核未达到功率、电流和温度规格阈值,英特尔® 睿频加速技术 2.01 将自动允许其超出基本工作频率运行,加速处理器和图形性能,轻松应对峰值负载。处理器是否启用英特尔® 睿频加速技术 2.0 ,以及保持加速状态的时间,取决于工作负载和操作环境。睿频的实质是多核切换成单核模式然后自动超频。既提高了日常使用的速度,又节能。
最后还有一个问题,为啥1000Mbps的网络,文件传输最大只能到50M。如下:
参考:https://zhidao.baidu.com/question/558440544.html