高并发下的九死一生，一个不小心就掉入万丈深渊

3年前 (2022) 程序员胖胖胖虎阿

330 0 0

引言

　　每次开篇LZ都会先说一下自己最近很忙，所以才没有时间写博客。这次这些话就不多说了，我们直入主题，尽管LZ依旧是非常的繁忙...

　　了解LZ的猿友应该都知道，LZ最近弄了一个hbase（不理解hbase的猿友可以把hbase当做与oracle，mysql，sqlserver等一样的数据库，并不影响阅读本文）的大数据平台，或许现在叫平台还有点名不副实，不过它很快就会发展到这个规模，LZ一直坚信着。在建立这个平台的过程中，LZ遇到过各种千奇百怪的问题，在这里LZ就分享一个非常简单，但却很奇葩的问题。

问题来源

　　问题的来源特别简单，LZ为了迎合模块化开发的思想，做了很多独立的模块，这些模块以jar包的形式协同工作，类似于spring当中的spring-core，spring-beans,spring-context等等。

　　在LZ的一个common包中，有这样的一个工具类，代码如下。（备注：LZ为了简单，去掉了很多跟本文无关的代码，但不影响阅读，因为这个类就是一些静态的工具类方法，主要用于处理日期）

public class DateUtil {

    private DateUtil(){}

    private static final DateFormat DATE_FORMAT = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    public static Date parse(String date)  throws ParseException {
        return DATE_FORMAT.parse(date);
    }    

}

　　这个类特别简单，相信有不少猿友都会觉得这个类没有多大问题。因为这段代码太简单了，当你的项目报错的时候，你很难想到这段代码就是错误的根源。很显然，LZ就在hbase的应用中使用了这个工具类，结果就导致了一个奇葩问题。

　　大致描述一下这个工具类使用的场景。LZ的hbase应用接收了来自于其它系统大量的日志信息，并会将这些日志信息存储在hbase当中，其实就是一个简单的日志保存功能。如果单纯从功能上来讲，就是一个简单的curd（增删改查）操作中的c（增）操作。唯一不同的是，由于存储的是来自很多系统的系统日志,webservice日志,mq日志,url访问日志，因此并发量会有点高，至少比LZ平时做的企业应用要高太多太多了。

　　这个工具类就是在解析日志信息中的日期字符串（比如日志的发生时间）时报的错，具体的错误信息如下。（备注：以下是真实的报错信息，显示的错误位置与上面的代码不符，不过各位猿友完全可以认为就是上面的方法报的错，因为事实上parseTimestamp这个方法就和上面方法的代码是一样的。）

java.lang.NumberFormatException: For input string: ""
        at java.lang.NumberFormatException.forInputString(NumberFormatException.java:48)
        at java.lang.Long.parseLong(Long.java:431)
        at java.lang.Long.parseLong(Long.java:468)
        at java.text.DigitList.getLong(DigitList.java:177)
        at java.text.DecimalFormat.parse(DecimalFormat.java:1297)
        at java.text.SimpleDateFormat.subParse(SimpleDateFormat.java:1589)
        at java.text.SimpleDateFormat.parse(SimpleDateFormat.java:1311)
        at java.text.DateFormat.parse(DateFormat.java:335)
        at com.xxxxxxx.core.common.util.DateUtil.parseTimestamp(DateUtil.java:95)
        at com.xxxxxxx.core.common.util.DateUtil.parse(DateUtil.java:84)
        at com.xxxxxxx.hbase.generator.LogRowKeyGenerator.generate(LogRowKeyGenerator.java:21)
        ... 22 more

问题分析

　　看到这个错误，大部分老道一点的程序猿一眼就能定位问题，肯定是传过来的日期格式不对，所以导致在解析的时候出错了。

　　LZ自认为还算老道吧（小小的自夸一下），自然也很快的意识到了问题的根源。于是最简单的方式，调试一下代码，看传过来的日志信息到底是什么样子。

　　LZ在catch块里加入了断点，当报出这个错误的时候，会进入调试（只能在catch块里捕捉，因为这个异常是时而出现的，而且毫无规律）。但是结果很意外，LZ仔细且认真的看了传送过来的日志信息，日期格式却明明是正确的。这时候LZ就傻眼了，格式明明是正确的，解析怎么可能报错呢？

　　LZ不相信这种奇怪的问题，于是LZ采用最简单的办法，希望印证心中所想，将代码改成如下的样子。

public class DateUtil {

    private DateUtil(){}

    private static final DateFormat DATE_FORMAT = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    public static Date parse(String date)  throws ParseException {
        System.out.println("date:" + date);
        return DATE_FORMAT.parse(date);
    }    

}

　　这是最简单粗暴的调试方式，也是LZ初入程序猿这个职业时经常用的办法。可惜，结果依然不如人意，当偶尔出现异常时，打印出来的日志格式依旧是正确的。事实上，各个系统使用的客户端也是LZ开发的，也不应该出现日期格式错误的问题。

　　这到底怎么回事呢？事实就是，日期格式是正确的，但就是解析失败！

水落石出

　　LZ在想不明白一个问题的时候，习惯出来抽根烟，透透风。不过不得不说，这个办法真的好使，LZ一瞬间灵感就袭脑了。

　　这么奇葩的问题，也只有高并发可以解释了！

　　于是二话不说，扔掉烟头，LZ就回到电脑前打开了SimpleDateFormat这个类的源码。果然，在这个类的注释里，有这么一段话。

 * Date formats are not synchronized.
 * It is recommended to create separate format instances for each thread.
 * If multiple threads access a format concurrently, it must be synchronized
 * externally.

　　这段话的意思很简单，翻译过来就是：日期格式化的类是非同步的，建议为每一个线程创建独立的格式化实例。如果多个线程并发访问同一个格式化实例，就必须在外部添加同步机制。

　　由于LZ错误的将SimpleDateFormat的单个实例放置于高并发的环境下，并且没有任何同步机制，于是就导致了这个奇葩的问题。接下来，LZ便快速的将代码改成了类似于如下的形式。

public class DateUtil {

    private DateUtil(){}

    public static Date parse(String date)  throws ParseException {
        return new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").parse(date);
    }    

}

　　果然，那个奇怪的异常再也不出现了，事情到此已经水落石出了。最后，LZ奉上一段示例代码，猿友们运行这个程序，就会出现解析失败的异常，但是很明显，我们的日期格式是正确的。

import java.text.DateFormat;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class DateUtil {

    private DateUtil(){}
    
    private static final DateFormat DATE_FORMAT = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    public static void main(String[] args) throws InterruptedException {
        ExecutorService executorService = Executors.newFixedThreadPool(500);
        for (int i = 0; i < 500; i++) {
            executorService.execute(new Runnable() {
                @Override
                public void run() {
                    for (int i = 0; i < 1000000; i++) {
                        try {
                            DATE_FORMAT.parse("2014-01-01 00:00:00");
                        } catch (ParseException e) {
                            e.printStackTrace();
                        }
                    }
                }
            });
        }
        Thread.sleep(3000000);
    }
    
}