摘要:
title: How to use the Arm Performance Monitoring Unit and System Counter minutes_to_complete: 90 who_is_this_for: This is an advanced topic for softwa 阅读全文
摘要:
目录measure cache hit latencym1_rdtscp.cm1.cm1_repeat.c measure cache hit latency 主要设计说明: t1=rdtscp load data from cache #measure the cost cycles of thi 阅读全文
摘要:
目录固定cpu频率max_ipc_test.sh 固定cpu频率 随笔-处理器微架构-固定cpu频率 - LiYanbin - 博客园 max_ipc_test.sh #!/bin/bash [[ -z "$1" || -z "$2" ]] && { echo "usage: $0 [cpuid] 阅读全文
摘要:
目录[1/2] 固定cpu运行频率[2/2] 实验和实验结果 方法:执行时长/周期数 约等于 1/lscpu 查看到的频率 [1/2] 固定cpu运行频率 随笔-处理器微架构-固定cpu频率 - LiYanbin - 博客园 [2/2] 实验和实验结果 代码: #include <stdlib.h> 阅读全文
摘要:
目录rdtsc codemrs pmccntr_el0 report 'Illegal instruction'附: arm pmu_enable rdtsc code #include <stdio.h> #include <stdint.h> #if defined(__i386__) || d 阅读全文
摘要:
link:Understanding Bandwidth and Latency - Ars Technica Understanding Bandwidth and Latency Ars discusses issues of bandwidth and latency inside hardw 阅读全文
摘要:
intel x86 芯片有提供CPUID指令,输出结果为16进制的数据,按照特定的格式进行解析即可 直接可用的工具有:cpuid/lscpu/x86info、getconf -a| grep -i cache 参考: intel CPUID instruction ARM 工具:cat /proc/ 阅读全文
摘要:
目录Momory Ordering9.2.3.2 Neither Loads Nor Stores Are Reordered9.2.3.3 Stores Are Not Reordered With Earlier Loads9.2.3.4 Loads May Be Reordered with 阅读全文
摘要:
目录HPC1 计算CPU频率[1/2] 固定cpu运行频率[2/2] 实验和实验结果HPC2 优化循环拆分成两条加法流水线(循环减半)实验结果变化分析指令数变化(汇编代码)循环次数减半HPC3 使用SIMD指令 HPC1 计算CPU频率 文章 高性能计算(HPC)系列之二:深入基础软件开发第一篇 方 阅读全文
摘要:
link: How to print the function name instead of the address for ustack #3108 ajor: Symbolication is based off the symbol table of the target applicati 阅读全文
摘要:
There are several types of cache misses, broadly categorized into compulsory, capacity, and conflict misses. These three are often referred to as the 阅读全文
摘要:
https://github.com/travisdowns/uarch-bench 下载-编译: 见仓库readme 使用: https://github.com/travisdowns/uarch-bench/wiki sudo ./uarch-bench --list sudo ./uarch 阅读全文
摘要:
[内联汇编很可怕吗?看完这篇文章,终结它!]weixin cnblogs __asm__ __volatile__ ( "mov %1, %%rbx\n\t" // dest值传入rbx "mov %2, %%rcx\n\t" // src传入rcx "_LOOP:\n\t" // 循环开始 "mo 阅读全文
摘要:
perf on-cpu xpid=$(cat /var/run/xx.pid); perf record -F 99 -p $xpid --call-graph dwarf -- sleep 60 直接在控制台上查看:perf report 或者生成火焰图: xdata=...; perf scri 阅读全文
摘要:
https://mazhen.tech/p/深入探索-perf-cpu-profiling-实现原理/ 深入探索 perf CPU Profiling 实现原理 perf 是什么 perf 是由 Linux 官方提供的系统性能分析工具 。我们通常说的 perf 实际上包含两部分: perf 命令,用 阅读全文
摘要:
目录IBM Locking overheadIBM - Waiting for lockskernel doc - lock statQ: lock wait time and cpu wait time IBM Locking overhead https://www.ibm.com/docs/p 阅读全文
摘要:
https://docs.redhat.com/en/documentation/red_hat_enterprise_linux/5/html/systemtap_beginners_guide/futexcontentionsect#futexcontentionsect global thre 阅读全文
摘要:
目录perf sched lat计算原理perf sched wait time计算过程perf sched 分析wait time perf sched lat计算原理 sched lat 计算过程: tracepoint:sched:sched_wakeup, tracepoint:sched: 阅读全文
摘要:
目录linux load 计算过程ssar 架构ssar 使用示例ssar load2p -c使用问题: ReadLoadrdFileData failed. Make sure the param -c is correct, act field is not -.ssar编译安装linux lo 阅读全文
摘要:
查看当前valgrind使用的debug文件对应的glibc-debuginfo版本: strace -e open valgrind ls 安装对应的版本: yum search glibc-debuginfo --showduplicates yum install -y ... 阅读全文
摘要:
https://stackoverflow.com/questions/20618308/fd-set-causing-seg-fault https://linux.die.net/man/3/fd_set Notes An fd_set is a fixed size buffer. Execu 阅读全文
摘要:
目录执行过程lat_mem_rdstreampar_mem其他内容和测试原理待阅读源码研究 https://lmbench.sourceforge.net/man/par_mem.8.html https://francisz.cn/2022/05/12/lmbench/ 执行过程 执行过程分析: 阅读全文
摘要:
目录编译运行过程分析附: 测试记录REFERENCE https://github.com/intel/lmbench 编译 安装依赖: yum install -y libtirpc libtirpc-devel 修改scripts/build脚本,在LDLIBS=-lm下面添加两行: LDLIB 阅读全文
摘要:
https://courses.fmsoft.cn/aple 目录一、内存管理虚拟内存原理C/C++程序的堆/栈管理APIC/C++进程的内存布局常用工具其他分配内存的方法常⻅内存使用问题二、文件和文件系统STDIO vs 传统文件读写系统调用问题:STDIO接口的主要功能有哪些?问题:读写文件时应 阅读全文
摘要:
给普通人的26条提示工程策略:#ai##提示工程# 1、与LLM交流不需要礼貌,所以无需添加“请”、“如果你不介意”、“谢谢”、“我想”等短语,直接切入主题。 2、在提示中整合预期的受众,例如,受众是该领域的专家。 3、将复杂任务分解为一系列更简单的提示,进行互动对话。 4、使用肯定指令,例如“做. 阅读全文
摘要:
目录TCP 连接限制配置(压测客户端和服务器)问题1:压测3w个请求(长连接),caps 1000,有一半的请求超时优化 配置网卡中断分配到多个cpuwireshark 查看rtt查看系统每秒收到的TCP请求数附:服务器网络参数配置 linux内核优化(百万级别长连接,并发测试指南) 百看不如一练, 阅读全文
摘要:
对于数据读取和发送的,水平触发和边缘触发的区别: 参考:彻底搞懂epoll的LT模式和ET模式 关于数据的读比较好理解,无论是LT模式还是ET模式,监听到读事件从socket开始读数据就好了,只不过读的逻辑有些差异,LT模式下,读事件触发后,可以按需收取想要的字节数,不用把本次接收到的数据收取干净, 阅读全文
摘要:
系统配置: 多网口情况下,假设各个网口ip在同一网段;此时,由于默认路由规则,从不同网口的ip访问,服务器依旧会返回默认网口的mac地址,配置方式如下: sysctl -w net.ipv4.ip_forward=1 # 开启ip转发规则 net.ipv4.conf.X.rp_filter = 0 阅读全文
摘要:
停止docker服务 1、停止自定义的监控如果有,比如: systemctl stop check_docker_service.service 2、停止所有容器 docker stop $(docker ps -aq) 3、停止系统服务 systemctl stop docker.socket d 阅读全文
摘要:
aliyun os centos 9 docker-ce install sudo wget -O /etc/yum.repos.d/docker-ce.repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo sud 阅读全文
摘要:
客户端与服务器建立tcp连接后,在服务器上执行ss -im dst 目标IP地址来检查skmem rb值: tcp ESTAB 0 0 192.168.99.124:ssh 192.168.99.86:48270 skmem:(r0,rb369280,t0,tb87040,f0,w0,o0,bl0, 阅读全文
摘要:
一台主机上只能保持最多 65535 个 TCP 连接吗? - 文礼的回答 - 知乎 https://www.zhihu.com/question/361111920/answer/1199952447 Q: 两个确定的ip地址.一个端口只能对应一个端口.怎么能64k*64k连接.明显只有64k链接吧 阅读全文
摘要:
摘自:使用strace命令跟踪系统调用 strace -tt -T -v -f -e trace=file -o /data/log/strace.log -s 1024 -p 23489 -c 统计每一系统调用的所执行的时间,次数和出错的次数等. -d 输出strace关于标准错误的调试信息. - 阅读全文
摘要:
guide: https://ffmpeg.org/ffmpeg-protocols.html play_audio.sh #!/bin/bash action="${1}" sipnum="${2}" lo_m_host="${3}" lo_m_port="${4}" play_file="${5 阅读全文
摘要:
目录基础镜像构建(包含sipp ffmpeg)容器运行文件docker-compose.yml创建运行容器 基础镜像构建(包含sipp ffmpeg) 使用3.16版本,ffmpeg rpt 打流支持设置本地ip地址 localaddr # Base images 基础镜像 FROM alpine: 阅读全文
摘要:
转载-https://m.weibo.cn/status/5031218725257887 这个讲解 ChatGPT 提示词技巧的视频值得一看,播主将常见的提示词技巧分成了10个级别,最后一级的 CO-STAR 框架,来源自新加坡政府科技局(GovTech)组织的首届 GPT-4 提示工程大赛冠军总 阅读全文
摘要:
目录一、基本理论二、制作自签证书步骤 1: 创建私有 CA1.1 生成 CA 私钥1.2 生成自签名的 CA 证书1.3 安装根证书(Unbuntu)步骤 2: 为 www.yanjiuyuan.com 创建证书签名请求(CSR)2.1 生成私钥2.2 生成 CSR步骤 3: 使用私有 CA 为 w 阅读全文
摘要:
按照线性回归的方法:梯度计算如下,那么需要求w1的偏导数(整个系统关于w1的偏导数)才能算: 怎么算:使用chain-rule来算: 上面的文章计算过程没有加入激活函数,《彻底弄懂,神经网络的误差反向传播算法 》这篇文章的计算过程是加入了的激活函数 点击查看原文 反向传播算法详解(手算详解传播过程) 阅读全文
摘要:
一个高并发项目开发到落地的心酸路 https://juejin.cn/post/7346021356679675967 https://mp.weixin.qq.com/s/Ou8h9YKblKl7ncf95grEvg 首先,我们没有去设计表,没有去设计接口,而是先去测试 测试: Mysql: 单节 阅读全文
摘要:
  阅读全文