一、背景
很多人Nacos客户端启动时,会报错如下,提示9848端口连接超时。
我自己也搜了搜,很多文章都说是版本问题,把客户端升级2.0就好了,但是我发现很多人升级之后还是会报这个错,网上找了半天都是让升级版本,好吧,网上没答案,只能自己分析了。
二、分析源码
找到报错的地方 GrpcClient.serverCheck() 方法,然后打断点,重新启动,等执行完下面这一行,发现居然又不报错了,然后竟然启动成功了!
responseFuture.get(3000L, TimeUnit.MILLISECONDS);
反复试了几次,只要打断点就不报错,不打断点就报错。
仔细研究了下,requestBlockingStub.request 是非阻塞请求,请求后直接进入
responseFuture.get(3000L, TimeUnit.MILLISECONDS) 方法里,这方法是判断上面的请求响应是否回来,大家可以看下里面的逻辑,大体上就是3秒超时时间之内,会循环判断响应是否返回,如果超时没有返回就抛出异常了。
这就是为什么打了断点之后,就不报错了,打了断点无形中增加了超时时间,在判断超时方法之前,响应已经返回了,自然不会报错了。
三、是否启动成功
大多数人,启动时报错之后,项目仍然启动成功了,nocas服务列表也已经有了,但是看到报错心里还是有点疑惑,真的就没问题吗?我们再分析一下,找找源头,报错的方法serverCheck,是从哪里开始调用的
一步一步追,找到本类的 connectToServer 方法
继续找调用 connectToServer 方法的地方,定位到了RpcClient.class里的 start 方法
发现,里面调用 connectToServer 时,返回null(就是前面报错后返回null),会重试三次,一般第二次就会连接成功了,会打印出 Success to connect to server on start up
所以大家启动报错后要看下,报错日志下面是否有成功日志,有成功日志就表示正常,没有问题。