extractor

package scrollable.excel.reader;

import java.io.IOException; import java.io.InputStream; import java.util.Locale; import java.util.concurrent.ArrayBlockingQueue; import java.util.concurrent.BlockingQueue;

import javax.xml.parsers.ParserConfigurationException;

import org.apache.poi.POIXMLProperties; import org.apache.poi.POIXMLTextExtractor; import org.apache.poi.openxml4j.exceptions.OpenXML4JException; import org.apache.poi.openxml4j.opc.OPCPackage; import org.apache.poi.ss.usermodel.DataFormatter; import org.apache.poi.util.SAXHelper; import org.apache.poi.xssf.eventusermodel.ReadOnlySharedStringsTable; import org.apache.poi.xssf.eventusermodel.XSSFReader; import org.apache.poi.xssf.eventusermodel.XSSFSheetXMLHandler; import org.apache.poi.xssf.eventusermodel.XSSFSheetXMLHandler.SheetContentsHandler; import org.apache.poi.xssf.model.StylesTable; import org.apache.xmlbeans.XmlException; import org.xml.sax.ContentHandler; import org.xml.sax.InputSource; import org.xml.sax.SAXException; import org.xml.sax.XMLReader;

public class ScrollDownXSSFEventBasedExcelExtractor{

private OPCPackage container; //private POIXMLProperties properties; private int sheetId;

private transient BlockingQueue<SimpleRow> rowsQueue = new ArrayBlockingQueue<SimpleRow>(1); private transient boolean hasNextRow = true; private transient SimpleRow currentRow;

public ScrollDownXSSFEventBasedExcelExtractor(String fileName, int sheetId) throws XmlException, OpenXML4JException, IOException { this.container = OPCPackage.open(fileName); //this.properties = new POIXMLProperties(container); this.sheetId = sheetId; }

public void processSheet(){ new XMLParser().start(); } public SimpleRow nextRow(){ SimpleRow row = null; if(hasNextRow){ while(true) { try { row = rowsQueue.take(); break; } catch (InterruptedException e) { // TODO Auto-generated catch block e.printStackTrace(); } } } return row; } public boolean hasNextRow(){ return hasNextRow; }

protected class ScrollableSheetContentsHandler implements SheetContentsHandler { @Override public void startRow(int rowNum) { currentRow = new SimpleRow(rowNum); }

@Override public void endRow() { if(currentRow != null) { while(true){ //try until current row is in rowsQueue try { rowsQueue.put(currentRow); break; } catch (InterruptedException e) { } } } }

@Override public void cell(String cellRef, String formattedValue) { SimpleCell cell = new SimpleCell(cellRef, formattedValue); currentRow.addCell(cell); }

@Override public void headerFooter(String text, boolean isHeader, String tagName) { // We don't include headers in the output yet, so ignore } } protected class ScrollableXSSFSheetXMLHandler extends XSSFSheetXMLHandler {

public ScrollableXSSFSheetXMLHandler(StylesTable styles, ReadOnlySharedStringsTable strings, SheetContentsHandler sheetContentsHandler) { super(styles, strings, sheetContentsHandler, false); }

@Override public void endElement(String uri, String localName, String name) throws SAXException { super.endElement(uri, localName, name); //end sheet if("sheetData".equals(name)) { hasNextRow = false; } }

} protected class XMLParser extends Thread{

@Override public void run() { try { ReadOnlySharedStringsTable strings = new ReadOnlySharedStringsTable(container); XSSFReader xssfReader = new XSSFReader(container); StylesTable styles = xssfReader.getStylesTable(); InputStream sheetInputStream = xssfReader.getSheet("rId"+sheetId); InputSource sheetSource = new InputSource(sheetInputStream); XMLReader sheetParser = SAXHelper.newXMLReader(); SheetContentsHandler sheetContentsExtractor = new ScrollableSheetContentsHandler(); ContentHandler handler = new ScrollableXSSFSheetXMLHandler(styles, strings, sheetContentsExtractor); sheetParser.setContentHandler(handler); sheetParser.parse(sheetSource); } catch (ParserConfigurationException | IOException | SAXException | OpenXML4JException e) { throw new RuntimeException("SAX parser appears to be broken - " + e.getMessage()); }finally{ if (container != null) { try { container.close(); } catch (IOException e) { e.printStackTrace(); } } } } }

}

package scrollable.excel.reader;

public class SimpleCell { private String refId; private String textValue; public SimpleCell(){} public SimpleCell(String refId, String textValue){ this.refId = refId; this.textValue = textValue; } public String getRefId() { return refId; } public void setRefId(String refId) { this.refId = refId; } public String getTextValue() { return textValue; } public void setTextValue(String textValue) { this.textValue = textValue; } }

package scrollable.excel.reader;

import java.util.Collection; import java.util.LinkedHashMap; import java.util.Map;

public class SimpleRow { private Map<String, SimpleCell> cells = new LinkedHashMap<String,SimpleCell>(); private int rowIndex; public SimpleRow(){} public SimpleRow(int rowNum){ this.rowIndex = rowNum; } public int getRowIndex() { return rowIndex; } public void setRowIndex(int rowIndex) { this.rowIndex = rowIndex; } public void addCell(SimpleCell cell){ this.cells.put(cell.getRefId(), cell); } public SimpleCell getCellByRefId(String cellRef) { return this.cells.get(cellRef); } public Collection<SimpleCell> getCellsInRow(){ return this.cells.values(); } public String toString(){ StringBuilder sb = new StringBuilder(); sb.append("row ").append(rowIndex); Collection<SimpleCell> cells = this.getCellsInRow(); for(SimpleCell cell : cells) { sb.append("\n").append("\t").append(cell.getRefId()).append("\t").append(cell.getTextValue()); } return sb.toString(); } }

package block.excel.writer;

import java.io.FileOutputStream; import java.io.IOException; import java.util.Collection; import java.util.List;

import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.util.CellReference; import org.apache.poi.xssf.streaming.SXSSFWorkbook;

import scrollable.excel.reader.SimpleCell; import scrollable.excel.reader.SimpleRow;

public class SXSSFExcelWritor { public static final int DEFAULT_CACHED_ROWS = 100; private int cachedRowSize = DEFAULT_CACHED_ROWS;

private SXSSFWorkbook workbook; private String fileName; private Sheet sheet; private FileOutputStream out;

public SXSSFExcelWritor() { }

public SXSSFExcelWritor(String fileName) { this.fileName = fileName; }

public SXSSFExcelWritor(String fileName, int cachedRowSize) { this(fileName); this.cachedRowSize = cachedRowSize; } public void init() throws IOException{ workbook= new SXSSFWorkbook(cachedRowSize); sheet = workbook.createSheet(); out = new FileOutputStream(fileName); } public void close(){ if(out != null) { try { workbook.dispose(); out.close(); } catch (IOException e) { e.printStackTrace(); } } }

public void write(List<SimpleRow> rows) throws IOException{ for(SimpleRow row : rows) { Row currentRow = sheet.createRow(row.getRowIndex()); Collection<SimpleCell> cells = row.getCellsInRow(); for(SimpleCell cell: cells) { CellReference cellRef = new CellReference(cell.getRefId()); int colIndex = cellRef.getCol(); Cell currentCell = currentRow.createCell(colIndex); currentCell.setCellValue(cell.getTextValue()); } } workbook.write(out); workbook.dispose(); }

public static void main(String[] args) throws Throwable { SXSSFWorkbook wb = new SXSSFWorkbook(100); // keep 100 rows in memory, // exceeding rows will be // flushed to disk Sheet sh = wb.createSheet(); for (int rownum = 0; rownum < 100000; rownum++) { Row row = sh.createRow(rownum); for (int cellnum = 0; cellnum < 10; cellnum++) { Cell cell = row.createCell(cellnum); String address = new CellReference(cell).formatAsString(); cell.setCellValue(address); }

}

// Rows with rownum < 900 are flushed and not accessible for (int rownum = 0; rownum < 900; rownum++) { // Assert.assertNull(sh.getRow(rownum)); }

// ther last 100 rows are still in memory for (int rownum = 900; rownum < 1000; rownum++) { // Assert.assertNotNull(sh.getRow(rownum)); }

FileOutputStream out = new FileOutputStream("C:\\Users\\YZM\\Desktop\\test2.xlsx"); wb.write(out); out.close();

// dispose of temporary files backing this workbook on disk wb.dispose(); }

}

package ui;

import java.awt.BorderLayout; import java.awt.Color; import java.awt.Dimension; import java.awt.FlowLayout; import java.awt.event.WindowAdapter; import java.awt.event.WindowEvent; import java.awt.event.WindowListener;

import javax.swing.Box; import javax.swing.BoxLayout; import javax.swing.JButton; import javax.swing.JFrame; import javax.swing.JLabel; import javax.swing.JPanel; import javax.swing.JScrollPane; import javax.swing.JTextArea; import javax.swing.JTextField; import javax.swing.WindowConstants; import javax.swing.border.EmptyBorder;

public class MainWindow extends JFrame{

private static final long serialVersionUID = 1L; private static final int DEFAULT_WIDTH = 800; private static final int DEFAULT_HEIGHT = 600;

public MainWindow(String name) { this.setTitle(name); this.setSize(DEFAULT_WIDTH, DEFAULT_HEIGHT); }

public JPanel createPIExtractorContentPanel() { JPanel piExtractorPanel = new JPanel(new BorderLayout()); JPanel headerPanel = new JPanel(); headerPanel.setLayout(new BoxLayout(headerPanel, BoxLayout.Y_AXIS)); headerPanel.setBorder(new EmptyBorder(10, 10, 10, 10)); JPanel labelPanel = new JPanel(new FlowLayout(FlowLayout.LEFT)); JLabel fileChoserLabel = new JLabel("Please chose a source excel file(support .xlsx file only):"); labelPanel.add(fileChoserLabel); headerPanel.add(labelPanel); JPanel fileChoserPanel = new JPanel(); fileChoserPanel.setLayout(new BoxLayout(fileChoserPanel, BoxLayout.X_AXIS)); JTextField fileNameInput = new JTextField(); fileNameInput.setEnabled(false); fileChoserPanel.add(fileNameInput); fileChoserPanel.add(Box.createHorizontalStrut(10)); JButton fileChoserButton = new JButton("Chose File"); fileChoserPanel.add(fileChoserButton); headerPanel.add(fileChoserPanel);

piExtractorPanel.add(headerPanel, BorderLayout.NORTH); //center JPanel logPanel = new JPanel(); //JScrollPane scrollPanel=new JScrollPane(); JTextArea textArea = new JTextArea(25,80); textArea.setLineWrap(true); textArea.setWrapStyleWord(true); logPanel.add(new JScrollPane(textArea)); piExtractorPanel.add(logPanel, BorderLayout.CENTER);

return piExtractorPanel;

}

public static void main(String[] args) { MainWindow mw = new MainWindow("DA Tool"); mw.add(mw.createPIExtractorContentPanel()); mw.setVisible(true); mw.setDefaultCloseOperation(WindowConstants.DISPOSE_ON_CLOSE); } }

extractor的更多相关文章

Jmeter组件4. Regular Expression Extractor
位置:Post-Processors - Regular Expression Extractor 所谓的Post-Processors直译为后处理器,意思是在域内所有Sampler执行完后才会执行, ...
[爬虫学习笔记]用于提取网页中所有链接的 Extractor 模块
Extractor的工作是从下载的网页中将它包含的所有URL提取出来.这是个细致的工作,你需要考虑到所有可能的url的样式,比如网页中常常会包含相对路径的url,提取的时候需要将它转换 ...
谷歌开源项目Google Preview Image Extractor(PIEX) (附上完整demo代码)
前天偶然看到谷歌开源项目中有一个近乎无人问津的项目Google Preview Image Extractor(PIEX) . 项目地址: https://github.com/google/piex ...
Where is "Active Directory Information Extractor"?
My friend she showed me a screenshot as below yesterday. The name of this document is “EnCase Forens ...
Scala中的Extractor
Scala中使用unapply方法可以实现三种extractor(另外使用unapplySeq也可以实现extractor) def unapply(object: S): Option[(T1, . ...
Day 16: Goose Extractor —— 好用的文章提取工具
Day 16: Goose Extractor -- 好用的文章提取工具 Day 16: Goose Extractor -- 好用的文章提取工具
jmeter后置处理器 JSON Extractor取多个变量值
1.需要获取响应数据的请求右键添加-后置处理器-JSON Extractor 2.如果要获取json响应数据多个值时,设置的Variable names (后续引用变量值的变量名设置)与JSON Pa ...
PyInstaller Extractor安装和使用方法
PyInstaller Extractor是可以提取出PyInstaller所创建的windows可执行文件的资源内容. 关于PyInstaller的介绍:PyInstaller安装使用方法使用Py ...
jmeter之regular expression extractor ，并循环调用匹配到的多个值
jmeter之regular expression extractor 官方介绍:http://jmeter.apache.org/usermanual/regular_expressions.htm ...
JMeter 通过JSON Extractor 插件来提取响应结果
接口响应结果,通常为HTML.JSON格式的数据,对于HTML的响应结果的提取,可以通过正则表达式,也可以通过XPath 来提取. 对于JSON格式的数据,可以通过正则表达式.JSON Extract ...

随机推荐

Hibdernate入门
Hibernate中java对象的三种状态瞬时状态(Transient):通过NEW创建对象后对象并没有立刻持久化他未与数据哭中的数据有任何关联持久状态(Persistent):当对象与Sessi ...
NOIP复习赛20161117
题目链接:http://files.cnblogs.com/files/candy99/%E9%A2%98%E7%9B%AE1117.pdf A n个等比数列求和公式(都感觉数列忘光了) %1e9+7 ...
hadoop安装
环境 RedHad Linux9.0 java6 hadoop1.2.1 hadoop下载地址:http://mirror.bit.edu.cn/apache/hadoop/common/ 版本 ...
IntelliJ IDEA 乱码解决方案（项目代码、控制台等）
IntelliJ IDEA 乱码解决方案 (项目代码.控制台等) 最近IDE从eclipse改成IntelliJ IDEA 了,原因是公司大部分人都在用这个IDE,而且一直推荐用,所以尝尝鲜.换的第一 ...
使用python实现appium的屏幕滑动
前些日子写一个滑动手机页面的小脚本,看到大家给的内容都是swipe方法,这里对swipe方法做一个小介绍: Swipe(int start x,int start y,int end x,int y, ...
分布式监控系统Zabbix-3.0.3-完整安装记录（2）-添加mysql监控
Zabbix3.0 Server以后就自带了MySQL插件来监控mysql数据库的模板,只需要配置好agent客户端,然后在web端给主机增加模板就行了. 以下是公司线上的zabbix3.0环境下添加 ...
Linux Linux程序练习十八
题目:编写一个TCP服务器和客户端,基于TCP的并发远程shell 要求实现: )对于所有收到的客户端消息,作为命令行进行执行, 并且将命令行的输出结果返回给客户端 )要求使用并发结构 )实现关键代码 ...
js(jQuery)获取时间的方法及常用时间类
获取JavaScript 的时间使用内置的Date函数完成 var mydate = new Date();mydate.getYear(); //获取当前年份(2位)mydate.getFullYe ...
基于Nginx dyups模块的站点动态上下线并实现简单服务治理
简介今天主要讨论一下,对于分布式服务,站点如何平滑的上下线问题. 分布式服务在分布式服务下,我们会用nginx做负载均衡, 业务站点访问某服务站点的时候, 统一走nginx, 然后nginx根据一 ...
推公式 HDU 2552
T 给你2个值求另外一个需要推一下 tan(a+b)=(tan(a)+tan(b))/(1-tan(a)*tan(b)); 等式左右取tan tan(atan(a))=a 1/s=tan(...) ...

extractor

extractor的更多相关文章

随机推荐

热门专题