Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱
MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina.com

字符串 CSV解析 表格 逗号分隔值 通讯录 电话簿 MD


目录

CSV文件简介

逗号分隔值:Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号。

逗号分隔值文件以纯文本形式存储表格数据。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。

CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符

通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用记事本来开启,再则先另存新档后用EXCEL开启,也是方法之一。

CSV是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。最广泛的应用是在程序之间转移表格数据,而这些程序本身是在不兼容的格式上进行操作的(往往是私有的和/或无规范的格式)。因为大量程序都支持某种CSV变体,至少是作为一种可选择的输入/输出格式。

CSV文件格式的通用标准并不存在,但是在RFC 4180中有基础性的描述。使用的字符编码同样没有被指定,但是7-bitASCII是最基本的通用编码。

CSV并不是一种单一的、定义明确的格式,在实践中,术语 CSV 泛指具有以下特征的任何文件:

  • 纯文本,使用某个字符集,比如ASCII、Unicode、EBCDIC或GB2312;
  • 由记录组成(典型的是每行一条记录);
  • 每条记录被分隔符分隔为字段(典型分隔符有逗号、分号或制表符;有时分隔符可以包括可选的空格);
  • 每条记录都有同样的字段序列。

在这些常规的约束条件下,存在着许多CSV变体,故CSV文件并不完全互通。然而,这些变异非常小,并且有许多应用程序允许用户预览文件(这是可行的,因为它是纯文本),然后指定分隔符、转义规则等。如果一个特定CSV文件的变异过大,超出了特定接收程序的支持范围,那么可行的做法往往是人工检查并编辑文件,或通过简单的程序来修复问题。因此在实践中,CSV文件还是非常方便的。

解析工具类

数据格式:

微信号,bqt20094,这里是密码,邮箱#909120849@qq.com,QQ#909120849,

工具类

//解析方式之所以定义成这样,是为了兼容我所使用的一款叫"密码本子"的APP
public class CsvUtils {
private static final String COMMA = ",";
private static final String SEPARATOR = "#";
private static final String LINE_SEPARATOR = File.separator;
private static final String ENCODING = "GBK"; public static void obj2CsvFils(List<CsvBean> dataList, File file) {
String content = obj2String(dataList);
writeFile(content, file);
} public static List<CsvBean> csvFils2Obj(String filePath) {
String content = readFile(filePath);
return string2Obj(content);
} private static String obj2String(List<CsvBean> dataList) {
StringBuilder sb = new StringBuilder();
for (CsvBean cvsBean : dataList) {
sb.append(cvsBean.name).append(COMMA).append(cvsBean.account).append(COMMA);
if (isNotEmpty(cvsBean.password)) sb.append(cvsBean.password);//密码有可能为空
sb.append(COMMA);
if (cvsBean.other != null && !cvsBean.other.keySet().isEmpty()) {
for (String key : cvsBean.other.keySet()) {
String value = cvsBean.other.get(key);
if (isNotEmpty(value)) sb.append(key).append(SEPARATOR).append(value).append(COMMA);
}
}
sb.append(LINE_SEPARATOR);
}
return sb.toString();
} private static void writeFile(String content, File file) {
try {
FileOutputStream writer = new FileOutputStream(file);
writer.write(content.getBytes(ENCODING));
writer.close();
} catch (IOException e) {
e.printStackTrace();
}
} private static List<CsvBean> string2Obj(String content) {
if (content == null) return null; String[] array = content.split(LINE_SEPARATOR);
List<CsvBean> list = new ArrayList<CsvBean>();
for (String string : array) {
int index = string.indexOf(COMMA);
if (index >= 0) {
CsvBean bean = new CsvBean();
bean.name = string.substring(0, index);
string = string.substring(index + 1);
index = string.indexOf(COMMA);
if (index >= 0) {
bean.account = string.substring(0, index);
string = string.substring(index + 1);
index = string.indexOf(COMMA);
if (index >= 0) {
bean.password = string.substring(0, index);
string = string.substring(index + 1);
for (int i = 0; i <= string.length(); i++) {
if (string.endsWith(",")) string = string.substring(0, string.length() - 1);
else break;
}
if (string.length() > 0) {
String[] otherStrings = string.split(COMMA);
bean.other = new HashMap<>();
for (String other : otherStrings) {
String[] keyValue = other.split(SEPARATOR);
if (keyValue.length >= 2) {
bean.other.put(keyValue[0], keyValue[1]);
}
}
}
} else {
bean.password = string;
}
} else {
bean.account = string;
}
list.add(bean);
}
}
return list;
} private static String readFile(String filePath) {
File file = new File(filePath);
byte[] temp = new byte[(int) file.length()];
try {
FileInputStream in = new FileInputStream(file);
in.read(temp);
in.close();
return new String(temp, ENCODING);
} catch (IOException e) {
e.printStackTrace();
return null;
}
} private static boolean isNotEmpty(String string) {
return string != null && string.trim().length() > 0 && !string.equalsIgnoreCase("null");
}
}

数据模型

//数据结构之所以定义成这样,是为了兼容我所使用的一款叫"密码本子"的APP
public class CsvBean {
public String name;//必选项
public String account;//必选项
public String password;//可选项
public HashMap<String, String> other;//可选项
@Override
public String toString() {
return "CvsBean [name=" + name + ", account=" + account + ", password=" + password + ", other=" + other + "]";
}
}

2018-9-8

字符串 CSV解析 表格 逗号分隔值 通讯录 电话簿 MD的更多相关文章

  1. 利用FastJson,拼接复杂嵌套json数据&&直接从json字符串中(不依赖实体类)解析出键值对

    1.拼接复杂嵌套json FastJson工具包中有两主要的类: JSONObject和JSONArray ,前者表示json对象,后者表示json数组.他们两者都能添加Object类型的对象,但是J ...

  2. (转)csv — 逗号分隔值文件格式

    原文:https://pythoncaff.com/docs/pymotw/csv-comma-separated-value-files/125 csv 模块主要用于处理从电子数据表格或数据库中导入 ...

  3. C#对.CSV格式的文件--逗号分隔值文件 的读写操作及上传ftp服务器操作方法总结

    前言 公司最近开发需要将数据保存到.csv文件(逗号分隔值 文件)中然后上传到ftp服务器上,供我们系统还有客户系统调用,之前完全没有接触过这个,所以先来看看百度的解释:逗号分隔值(Comma-Sep ...

  4. CSV (逗号分隔值文件格式)

    逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个字符序列,不 ...

  5. LINQ to XML 从逗号分隔值 (CSV) 文件生成 XML 文件

    参考:http://msdn.microsoft.com/zh-cn/library/bb387090.aspx 本示例演示如何使用 语言集成查询 (LINQ) 和 LINQ to XML 从逗号分隔 ...

  6. jsoncpp封装和解析字符串、数字、布尔值和数组

    使用jsoncpp进行字符串.数字.布尔值和数组的封装与解析. 1)下载jsoncpp的代码库 百度网盘地址 :http://pan.baidu.com/s/1ntqQhIT 2)解压缩文件 json ...

  7. [原创]SQL表值函数:把用逗号分隔的字符串转换成表格数据

      我们日常开发过程中,非常常见的一种需求,把某一个用逗号或者/或者其他符号作为间隔的字符串分隔成一张表数据. 在前面我们介绍了 [原创]SQL 把表中字段存储的逗号隔开内容转换成列表形式,当然按照这 ...

  8. CSV.js – 用于 CSV 解析和编码的 JS 工具库

    逗号分隔值(CSV )文件用于以以纯文本的形式存储表格化数据(数字和文本). CSV 文件包含任意数量的记录,通过某种换行符分隔,每条记录由字段,其他一些字符或字符串分隔,最常用的是文字逗号或制表符. ...

  9. 支持各种特殊字符的 CSV 解析类 (.net 实现)(C#读写CSV文件)

    CSV是一种十分简洁的数据结构,在DOTNET平台实际使用中发现微软官方并没有提供默认的方法,而网上好多例子发现实现并不严谨甚至一些含有明显错误,所以后面自己实现了一个读写工具类,这里发出来希望方便后 ...

随机推荐

  1. Web大前端面试题-Day2

    1.伪类与伪元素的区别? 1) 定义区别 伪类 伪类用于选择DOM树之外的信息,或是不能用简单选择器进行表示的信息. 前者包含那些匹配指定状态的元素,比如:visited,:active:后者包含那些 ...

  2. 【莫队算法】【权值分块】bzoj3920 Yuuna的礼物

    [算法一] 暴力. 可以通过第0.1号测试点. 预计得分:20分. [算法二] 经典问题:区间众数,数据范围也不是很大,因此我们可以: ①分块,离散化,预处理出: <1>前i块中x出现的次 ...

  3. 关于Android4.X的Alertdialog对话框

    最近在做Android4.0的开发,发现AlertDialog相比较以前有了较大变化,就是在触摸对话框边缘外部,对话框消失 于是研究其父类发现,可以设置这么一条属性,当然必须先AlertDialog. ...

  4. GDI 泄漏检测方法

    方法一 1.打开电脑的[任务管理器],选择[进程]页,点击菜单项的[查看]项,选择[选择列]: 2.勾选[GDI对象(J)]即可. 3.此时,用户就可以在进程中看到每个进程对应的GDI对象,每个进程的 ...

  5. hdu 5775 Bubble Sort 树状数组

    Bubble Sort 题目连接: http://acm.hdu.edu.cn/showproblem.php?pid=5775 Description P is a permutation of t ...

  6. Linux学习笔记06—系统用户及用户组的管理

    一.认识/etc/passwd和/etc/shadow 1./etc/passwd 由 ‘:’ 分割成7个字段,每个字段的具体含义是: 用户名 存放账号的口令:现在存放在/etc/shadow下,在这 ...

  7. getsockname()/getpeername()函数第一次被调用得到0.0.0.0结果

    int getsockname(int sockfd, struct sockaddr *addr, socklen_t *addrlen); getsockname() returns the cu ...

  8. C#编程(五十一)----------链表

    原文链接: http://blog.csdn.net/shanyongxu/article/details/47024865 链表 LinkedList<T>集合类没有非泛型类的版本,它是 ...

  9. 11i and R12 Table Count in Different Module

    Advertisement Module 11i Tables R12 Tables New Tables AR 551 616 118 BOM 264 337 73 GL 186 309 140 A ...

  10. 【pycharm】pycharm上安装tensorflow,报错:AttributeError: module 'pip' has no attribute 'main' 解决方法

    pycharm上安装tensorflow,报错:AttributeError: module 'pip' has no attribute 'main' 解决方法 解决方法: 在pycharm的安装目 ...