远程调试方式
使用特定JVM参数运行服务端代码
要让远程服务器运行的代码支持远程调试,则启动的时候必须加上特定的JVM参数,这些参数是:
1 |
-Xdebug -Xrunjdwp:transport=dt_socket,suspend=n,server=y,address=${debug_port} |
其中的${debug_port}是用户自定义的,为debug端口,本例以5555端口为例。
transport: 表示信息传递的连接方式, 其中,dt_socket是指用SOCKET模式,另有dt_shmem指用共享内存方式,其中,dt_shmem只适用于Windows平台。
server: server=y 表示是监听其他debug client端的请求
address 表示等待调试的连接网络端口
suspend 表示是否在启动目标虚拟机后挂起虚拟机,如果要调试启动过程,请使用y
参数说明:
- address为远程调试的端口号,目前我们服务器上8412是一个开放的端口(staging环境已验证)
- -Xrunjdwp 使用jdwp(Java Debug Wire Protocol)进行调试
- transport=dt_socket 使用socket方式进行连接,还可以使用其他通信方式如(dt_shmem 共享内存)
- suspend=n JVM监听address端口传来的信号时不挂起JVM中运行的进程
示例方式:
- IntelliJ远程调试
- 使用JDI进行线上程序断点信息记录
IntelliJ远程调试
打开Intellij IDEA,在顶部靠右的地方选择”Edit Configurations…”,进去之后点击+号,选择”Remote”,按照下图的只是填写红框内的内容,其中host为远程代码运行的机器的ip/hostname,port为上一步指定的debug_port,本例是5555。然后点击Apply,最后点击OK即可
启动debug模式
现在在上一步选择”Edit Configurations…”的下拉框的位置选择上一步创建的remote的名字,然后点击右边的debug按钮(长的像臭虫那个),看控制台日志,如果出现类似“Connected to the target VM, address: ‘xx.xx.xx.xx:5555’, transport: ‘socket’”的字样,就表示连接成功过了。
设置断点,开始调试
远程debug模式已经开启,现在可以在需要调试的代码中打断点了,比如:
如图中所示,如果断点内有√,则表示选取的断点正确。
现在在本地发送一个到远程服务器的请求,看本地控制台的bug界面,划到debugger这个标签,可以看到当前远程服务的内部状态(各种变量)已经全部显示出来了,并且在刚才设置了断点的地方,也显示了该行的变量值。
使用JDI进行线上程序断点信息记录
java的整个调试体系为JDPA,Oracle提供了高级的jdi接口以方便使用java来连接调试程序进行相应的调试。这样,只需要调用相应的java接口,就能进行打断点,记录断点,然后继续运行,清除断点这样基本的断点调试手法了。
import com.sun.jdi.*; import com.sun.jdi.connect.AttachingConnector; import com.sun.jdi.connect.Connector; import com.sun.jdi.event.*; import com.sun.jdi.request.BreakpointRequest; import com.sun.jdi.request.EventRequest; import com.sun.jdi.request.EventRequestManager; import com.sun.tools.jdi.SocketAttachingConnector; import java.util.List; import java.util.Map; /** * Created by nijianfeng on 16/10/24. */ public class DebugTest { public static void main(String[] args) throws Exception { //获取SocketAttachingConnector,连接其它JVM称之为附加(attach)操作 VirtualMachineManager vmm = Bootstrap.virtualMachineManager(); List<AttachingConnector> connectors = vmm.attachingConnectors(); SocketAttachingConnector sac = null; for(AttachingConnector ac : connectors) { if(ac instanceof SocketAttachingConnector) { sac = (SocketAttachingConnector) ac; } } assert sac != null; //设置好主机地址,端口信息 Map<String, Connector.Argument> arguments = sac.defaultArguments(); Connector.Argument hostArg = arguments.get("hostname"); Connector.Argument portArg = arguments.get("port"); hostArg.setValue("127.0.0.1"); portArg.setValue(String.valueOf(5555)); //进行连接 VirtualMachine vm = sac.attach(arguments); //相应的请求调用通过requestManager来完成 EventRequestManager eventRequestManager = vm.eventRequestManager(); //创建一个代码判断,因此需要获取相应的类,以及具体的断点位置,即相应的代码行。 ClassType clazz = (ClassType) vm.classesByName("cn.gov.zcy.fixed.controller.base.AttachController").get(0); Location location = clazz.locationsOfLine(91).get(0); //创建新断点并设置阻塞模式为线程阻塞,即只有当前线程被阻塞。最终启用之。 BreakpointRequest breakpointRequest = eventRequestManager.createBreakpointRequest(location); breakpointRequest.setSuspendPolicy(EventRequest.SUSPEND_EVENT_THREAD); breakpointRequest.enable(); //获取vm的事件队列 EventQueue eventQueue = vm.eventQueue(); while(true) { //不断地读取事件并处理断点记录事件 EventSet eventSet = eventQueue.remove(); EventIterator eventIterator = eventSet.eventIterator(); while(eventIterator.hasNext()) { Event event = eventIterator.next(); execute(event); } //将相应线程resume,表示继续运行 eventSet.resume(); } } public static void execute(Event event) throws Exception { System.out.println(event.getClass().getCanonicalName()); //获取的event为一个抽象的事件记录,可以通过类型判断转型为具体的事件,这里我们转型为BreakpointEvent,即断点记录, BreakpointEvent breakpointEvent = (BreakpointEvent) event; //并通过断点处的线程拿到线程帧,进而获取相应的变量信息,并打印记录。 ThreadReference threadReference = breakpointEvent.thread(); StackFrame stackFrame = threadReference.frame(0); List<LocalVariable> localVariables = stackFrame.visibleVariables(); localVariables.forEach(t -> { Value value = stackFrame.getValue(t); System.out.println("local->" + value.type() + "," + value.getClass() + "," + value); }); // com.sun.tools.jdi.EventSetImpl.BreakpointEventImpl // local->class java.lang.String (no class loader),class com.sun.tools.jdi.StringReferenceImpl,"1016MD/339900/039514a0-ea9d-449a-ba91-a6681acf30cd" } }
连接远程JVM
连接其它JVM称之为附加(attach)操作,当前实现中有2种,如果是本地JVM,则通过Process的方式即可,如果是远程,则需要通过socket的方式才能进行连接。首先是server端需要开启调试agent,并且指定相应的端口,如下启动命令所示:
-Xdebug -agentlib:jdwp=transport=dt_socket,address=1234,server=y,suspend=n
上面的参数表示监听指定端口(1234),并且当存在断点时并不主动阻塞。旧的JVM也有使用Xrunjdwp参数的,但不再被建议使用.
客户端即通过相应的connector进行连接,如下的socket连接方式:
VirtualMachineManager vmm = Bootstrap.virtualMachineManager(); List<AttachingConnector> connectors = vmm.attachingConnectors(); SocketAttachingConnector sac = null; for(AttachingConnector ac : connectors) { if(ac instanceof SocketAttachingConnector) { sac = (SocketAttachingConnector) ac; } } assert sac != null; Map<String, Connector.Argument> arguments = sac.defaultArguments(); Connector.Argument hostArg = arguments.get("hostname"); Connector.Argument portArg = arguments.get("port"); hostArg.setValue("127.0.0.1"); portArg.setValue(String.valueOf(1234)); vm = sac.attach(arguments);
即设置好主机地址,端口信息,然后即可以进行连接。
开启新断点
相应的请求调用通过requestManager来完成,由刚才成功连接上的vm(VirtualMachine)来获取。由于这里是创建一个代码判断,因此需要获取相应的类,以及具体的断点位置,即相应的代码行。
要获取代码行,则要求源文件(class)中必须存在lineCode信息,即通过在抛出异常时,在异常信息中所指定的行数。这些信息默认情况下编译时会自动输出,但使用编译开关-g:none时,则不会输出。如果没有line信息,则不能创建相应的断点信息。创建信息如下所示:
eventRequestManager = vm.eventRequestManager(); ClassType clazz = (ClassType) vm.classesByName("A1").get(0); Location location = clazz.locationsOfLine(15).get(0); BreakpointRequest breakpointRequest = eventRequestManager.createBreakpointRequest(location); breakpointRequest.setSuspendPolicy(EventRequest.SUSPEND_EVENT_THREAD); breakpointRequest.enable();
以上即拿到类A1的第15行的执行段(可能有多个,一行代码可能有多个调用),并设置阻塞模式为线程阻塞,即只有当前线程被阻塞。最终启用之,即成功创建新断点。这里必须将其设置为阻塞,否则将断点记录产生时,由于当前线程继续运行了,将不能拿到相应的信息(表示为产生IncompatibleThreadStateException)
记录断点信息
接下来就是从vm的事件队列中,不断地读取事件并处理断点记录事件即可。由于断点产生时,server端线程被阻塞,因此必须尽可能快地处理断相应的,以避免出现业务阻塞。标准的事件循环如下所示:
eventQueue = vm.eventQueue(); while(true) { eventSet = eventQueue.remove(); EventIterator eventIterator = eventSet.eventIterator(); while(eventIterator.hasNext()) { Event event = eventIterator.next(); execute(event); } eventSet.resume(); }
上面在事件记录处理完之后,必须将相应线程resume,表示继续运行。
这里获取的event为一个抽象的事件记录,可以通过类型判断转型为具体的事件,这里我们转型为BreakpointEvent,即断点记录,并通过断点处的线程拿到线程帧,进而获取相应的变量信息,并打印记录。如下所示:
BreakpointEvent breakpointEvent = (BreakpointEvent) event; ThreadReference threadReference = breakpointEvent.thread(); StackFrame stackFrame = threadReference.frame(0); List<LocalVariable> localVariables = stackFrame .visibleVariables(); localVariables.forEach(t -> { Value value = stackFrame.getValue(t); System.out.println("local->" + value.type() + "," + value.getClass() + "," + value); });
上面的value也是抽象形式,也可以通过类型转换以打印不同类型的对象。
断点继续运行
必须调用相应的event.resume
清除断点
如果记录的信息又足够(如记录了半天的数据了),则可能通过requestManager.deleteEventRequest调用相应的断点,或者调用deleteAllBreakpoints删除所有断点信息。或者通过vm.dispose直接中断相应的调试连接即可。