Java读取excel的方式,一篇文章看懂(详细)

2年前 (2022) 程序员胖胖胖虎阿
370 0 0

目录

一、excel读取的两种方式

1.1 jxl 和 poi 的区别和选择

二、jxl 的使用

2.1 导入相关依赖

 2.2 操作

三、poi 的使用

3.1 导入相关依赖

3.2 操作

四、总结

一、excel读取的两种方式

Java中解析excel的方式,我目前知道的有两种,一种是 jxl 读取,另一种是 poi 读取

1.1 jxl 和 poi 的区别和选择

jxl 只能解析 xls 文件不能 解析 xlsx 文件; poi 则是可以同时兼容xls 和xlsx两种文件类型,这是要注意的第一个点;

② 这两个方法的读取方式不一样,jxl 读取的是 先读列 然后循环获取的该列每行的信息。poi 读取是 先读行,再循环获取每列的信息。如下图:

Java读取excel的方式,一篇文章看懂(详细)

那我们应该怎么去做选择呢?如果只需要xls的解析,可以使用 jxl (因为poi蛮容易出异常的jar冲突之类的,而且读取的方式不太舒服,如果读取完还要做判断操作写入数据库,就会写的比较复杂),如果需要兼容就选择poi方式读取。

二、jxl 的使用

2.1 导入相关依赖

<dependency>
    <groupId>net.sourceforge.jexcelapi</groupId>
    <artifactId>jxl</artifactId>
    <version>2.6.12</version>
</dependency>

 2.2 操作

以该表为例:

Java读取excel的方式,一篇文章看懂(详细)

package com.olio;

import jxl.Sheet;
import jxl.Workbook;
import jxl.read.biff.BiffException;

import java.io.File;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLConnection;
import java.net.URLDecoder;

public class TestDemo {
	public void readExcel(String path,String strURL) {
		try {
			/*// 如果需要通过URL获取资源的加上以下的代码,不需要的省略就行
			URL url = new URL(strURL);
			HttpURLConnection conn = (HttpURLConnection)url.openConnection();
			// 设置超时间为3秒
			conn.setConnectTimeout(3*1000);
			// 防止屏蔽程序抓取而返回403错误
			conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
			// 获取输入流
			InputStream inputStream = conn.getInputStream();
			Workbook workbook  = Workbook.getWorkbook(inputStream);
			......*/
			
			// 解析路径的file文件
			Workbook workbook = Workbook.getWorkbook(new File(path));
			// 获取第一张工作表
			Sheet sheet = workbook.getSheet(0);
			// 循环获取每一行数据 因为默认第一行为标题行,我们可以从 1 开始循环,如果需要读取标题行,从 0 开始
			// sheet.getRows() 获取总行数
			for (int i = 1; i < sheet.getRows(); i++) {
				// 获取第一列的第 i 行信息 sheet.getCell(列,行),下标从0开始
				String id = sheet.getCell(0, i).getContents();
				// 获取第二列的第 i 行信息
				String name = sheet.getCell(1,i).getContents();
				// 获取第三列的第 i 行信息
				String sex = sheet.getCell(2, i).getContents();
				// 获取第四列的第 i 行信息
				String grade = sheet.getCell(3, i).getContents();

				// 存入本地或者是存入对象等根据给人需求自己定就行,创建对象存储,然后加入集合中
				// ......
			}
		} catch (IOException e) {
			e.printStackTrace();
		} catch (BiffException e) {
			e.printStackTrace();
		}
	}

}

三、poi 的使用

        在这里写的是两种版本的兼容使用的方法

3.1 导入相关依赖

     <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>3.17</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>3.17</version>
        </dependency>

3.2 操作

以下图为例

Java读取excel的方式,一篇文章看懂(详细)

package com.olio;

import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import java.io.FileInputStream;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLConnection;
import java.net.URLDecoder;

public class TestDemo {
	public void readExcel(String path,String strURL) {
		try {
			/*// 如果需要通过URL获取资源的加上以下的代码,不需要的省略就行
			URL url = new URL(strURL);
			HttpURLConnection conn = (HttpURLConnection)url.openConnection();
			// 设置超时间为3秒
			conn.setConnectTimeout(3*1000);
			// 防止屏蔽程序抓取而返回403错误
			conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
			// 获取输入流
			InputStream inputStream = conn.getInputStream();
			......*/

			// 获取文件输入流
			InputStream inputStream = new FileInputStream(path);
			// 定义一个org.apache.poi.ss.usermodel.Workbook的变量
			Workbook workbook = null;
			// 截取路径名 . 后面的后缀名,判断是xls还是xlsx
			// 如果这个判断不对,就把equals换成 equalsIgnoreCase()
			if (path.substring(path.lastIndexOf("." + 1)).equals("xls")){
				workbook = new HSSFWorkbook(inputStream);
			}else if (path.substring(path.lastIndexOf(" . " + 1)).equals("xlsx")){
				workbook = new XSSFWorkbook(inputStream);
			}

			// 获取第一张表
			Sheet sheet = workbook.getSheetAt(0);
			// sheet.getPhysicalNumberOfRows()获取总的行数
			// 循环读取每一行
			for (int i = 0; i < sheet.getPhysicalNumberOfRows(); i++) {
				// 循环读取每一个格
				Row row = sheet.getRow(i);
				// row.getPhysicalNumberOfCells()获取总的列数
				for (int index = 0; index < row.getPhysicalNumberOfCells(); index++) {
					// 获取id,但是我们获取的cell类型
					Cell cellId = row.getCell(index);
					// 转换为字符串类型
					cellId.setCellType(CellType.STRING);
					// 获取得到字符串
					String id = cellId.getStringCellValue();

					// 获取id,但是我们获取的cell类型
					Cell cellName = row.getCell(index);
					// 转换为字符串类型
					cellName.setCellType(CellType.STRING);
					// 获取得到字符串
					String name = cellId.getStringCellValue();

					// 获取id,但是我们获取的cell类型
					Cell cellSex = row.getCell(index);
					// 转换为字符串类型
					cellSex.setCellType(CellType.STRING);
					// 获取得到字符串
					String sex = cellId.getStringCellValue();

					// 获取id,但是我们获取的cell类型
					Cell cellGrade = row.getCell(index);
					// 转换为字符串类型
					cellGrade.setCellType(CellType.STRING);
					// 获取得到字符串
					String grade = cellId.getStringCellValue();

					System.out.println(id + "\t" + name + "\t" + sex + "\t" + grade);
				}
				System.out.println();
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

}

四、总结

        写这篇文章的初衷是总结自己的用到的方法,然后也将网上的做了个详细的总结,一篇文章去展现出来,其实只要清楚了它的代码写法,还有读取的方式,我们就已经可以去具体操作了,至于需要存储到哪里要看自己具体的业务需求,需要做逻辑判断,就根据读取方式去操作就可以,希望这篇文章可以帮到大家

        不论是通过url获取资源,或者是path路径名的方式获取,最后都是需要用到输入流去进行给WorkBook方法做解析的,jxl 和 poi 的优缺点及全面的使用想深入研究的也可以看下面这个网站的文章

JXL开发Excel文档中文教程_西西软件资讯 (cr173.com)

今天就到这儿啦!

版权声明:程序员胖胖胖虎阿 发表于 2022年10月29日 上午10:08。
转载请注明:Java读取excel的方式,一篇文章看懂(详细) | 胖虎的工具箱-编程导航

相关文章

暂无评论

暂无评论...