本系列文章目录

[一] 基础篇

[二] 进阶篇——写入CSV

[三] 进阶篇——读取CSV

什么是CSV?

CSV 是一种以纯文本形式存储的表格数据,具体介绍如下(来自维基百科):

逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。

简单的说,CSV 是一种通用的、相对简单的表格文件格式,最广泛的应用就是在不同程序之间转移表格数据。值得注意的是,CSV 并没有一种单一的、定义明确的格式(虽然有一个 RFC 4180 的标准),一般地,CSV 文件具有如下特征:

  1. 纯文本,使用某个特定的字符集保存,例如 ASCII、Unicode 等
  2. 由一条条记录组成,一般每一行代表一条记录
  3. 每条记录被分隔符划分为不同的字段,最常见的分隔符是逗号,毕竟其中文名叫逗号分隔值:)
  4. 每条记录相同的字段序列

因为CSV 并没有一种单一的、定义明确的格式,因此下面的内容以最常见的格式为例,即逗号(,)分隔字段,换行符(\n)分隔记录。

C 语言写入 CSV 文件

首先我们来了解如何写入一个 CSV 文件,下面是示例代码:

// 1-1.c
#include <stdio.h>
#include <stdlib.h> int main()
{
FILE *fp = fopen("tmp.csv", "w+");
if (fp == NULL) {
fprintf(stderr, "fopen() failed.\n");
exit(EXIT_FAILURE);
} fprintf(fp, "ID,Name,Points\n");
fprintf(fp, "1,qwe,1.1\n"); int id = 2;
char *name = "asd";
float point = 2.2;
fprintf(fp, "%d,%s,%f\n", id, name, point); fclose(fp);
return 0;
}

上述代码中,首先便是打开一个 CSV 文件,若打开失败,那么则报告出错结束程序。接下来便是向打开的 CSV 文件写入内容:

fprintf(fp, "ID,Name,Points\n");

常见的CSV文件的分隔符是逗号(,),被分隔符分开的字段会位于不同的列。在上述语句中,IDNamePoints 被分隔符分开,因此这个CSV文件共有3列,分别是IDNamePoints

CSV文件是由一条条记录组成的,常见划分不同记录的符号是换行符(\n)。在上述语句中,IDNamePoints 分别属于同一行上的不同三列,很显然,这条记录是表头。

接下来的 fprintf(fp, "1,qwe,1.1\n"); 语句写入的记录为 1、qwe、1.1,分为三列,正好对应于 ID=1、Name=qwe、Points=1.1。前一条语句采用了直接写入,但很多时候我们的值是变化的,幸运的是,CSV的写入同样支持格式化写入,代码如下:

int id = 2;
char *name = "asd";
float point = 2.2;
fprintf(fp, "%d,%s,%f\n", id, name, point);

最后写入的记录为 2(ID)、asd(Name)、2.2(Points)。运行程序,查看 CSV 文件内容,结果为:

C 语言读取 CSV 文件

示例程序如下:

// 1-2.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h> int main()
{
FILE *fp = fopen("tmp.csv", "r");
if (fp == NULL) {
fprintf(stderr, "fopen() failed.\n");
exit(EXIT_FAILURE);
} char row[80];
char *token;
while (fgets(row, 80, fp) != NULL) {
printf("Row: %s", row);
token = strtok(row, ",");
while (token != NULL) {
printf("Token: %s\n", token);
token = strtok(NULL, ",");
}
} fclose(fp);
return 0;
}

首先要打开将要读取的CSV文件,这一步和写入一样,不再赘述。

while (fgets(row, 80, fp) != NULL) {
printf("Row: %s", row);
// other code
}

因为CSV文件是一个纯文本文件,因此我们可以使用 fgets 函数一行一行地进行读取,这样读取得到的便是CSV文件中一条条记录。接下来要做的就是将不同字段从记录中分隔出来:

token = strtok(row, ",");
while (token != NULL) {
printf("Token: %s\n", token);
token = strtok(NULL, ",");
}

char* strtok(char *restrict str, const char *restrict delim) 函数可以把字符串 str 按照给定的分隔符 delim 进行分隔,如果要解析仍是之前同一个字符串时,需要把 str 设为 NULL。因此 token = strtok(row, ","); 这条语句会尝试用逗号(,)来分割刚刚读取得到的记录,同时使用一个 while (token != NULL) 循环来不断进行分割,直到无法分隔为止,这样就得到每个字段的值。

程序运行输出的结果如下:

$ clang 1-2.c -o 1-2
$ ./1-2
Row: ID,Name,Points
Token: ID
Token: Name
Token: Points Row: 1,qwe,1.1
Token: 1
Token: qwe
Token: 1.1 Row: 2,asd,2.200000
Token: 2
Token: asd
Token: 2.200000

最后总结一下,CSV 文件和普通文件一样,无论读写都需要先打开文件。而后写入或读取时所用的函数和普通文件没有区别,唯一需要注意的是,CSV 文件通过特定的分隔符来区分字段和记录:

  • 用换行符(\n)来区分记录,一条记录会占据CSV文件的一行
  • 用逗号(,)来区分一条记录中的不同字段,每个字段会单独占据一列

如果想要了解进阶的 C 语言读写 CSV 文件的有关内容,欢迎接着阅读进阶篇:

[二] 进阶篇——写入CSV

[三] 进阶篇——读取CSV

C语言读取写入CSV文件 [一]基础篇的更多相关文章

  1. 009-Go 读取写入CSV文件

    package main import( "encoding/csv" "fmt" "os" "strconv" ) t ...

  2. pandas 读写excel 操作(按索引和关键字读取行和列,写入csv文件)

    pandas读写excel和csv操作总结 按索引读取某一列的值 按关键字读取某一列的值 按关键字查询某一行的值 保存成字典并写入新的csv import pandas as pd grades=pd ...

  3. python读取和写入csv文件

    读取csv文件: def readCsv(): rows=[] with file(r'E:\py\py01\Data\system.csv','rb') as f: reads=csv.reader ...

  4. python之读取和写入csv文件

    写入csv文件源码: #输出数据写入CSV文件 import csv data = [ ("Mike", "male", 24), ("Lee&quo ...

  5. python在不同情况下写入csv文件

    情况一(解法一):将列表存储为csv文件.列表的每一项代表csv文件的一行. 列表中的每一项包含多个属性.list=[[属性1,属性2,属性3,……],[属性1,属性2,属性3,……],[属性1,属性 ...

  6. 写入.csv文件

    #include "stdafx.h" #include "WriteCsv.h" CString m_strData;//写入记录的一条数据 CString ...

  7. 读取gzmt.csv文件,计算均值及概率

    问题: 读取gzmt.csv文件所有数据,选取收盘价格(倒数第二列),计算20天均值,权重取成交量(选做:时间权重为半衰期为15天):将该均值修剪为超过600的都设置为1000,并打印出该均值超过55 ...

  8. 利用Python写入CSV文件的方法

    第一种:CSV写入中文 #! /usr/bin/env python # _*_ coding:utf- _*_ import csv csvfile = file('test.csv', 'wb') ...

  9. python3写入csv文件时中文为乱码

    今天修改李万的爬虫时把页面上的中文写入csv文件时,中文总是乱码.通过上网搜索得到解决.解决的办法是打开文件是需加参数 encoding='utf-8-sig' .感谢博客园的菜鸟Alex.他相关博客 ...

随机推荐

  1. 使用子查询获取,使用 all 关键字获取比所有“国内短线游”价格高的线路信息,按照线路类型、线路价格升序显示线路编号、线路名和价格

    查看本章节 查看作业目录 需求说明: 使用子查询获取"国内短线游"及"国内长线游"的线路信息,按照线路类型.线路价格升序显示线路编号.线路名和价格 使用 all ...

  2. Java练习习题,百钱买百鸡问题,用100文钱买鸡,公鸡5文钱一只,母鸡3文钱一只,小鸡3只1文钱

    需求说明: 用100文钱买鸡,公鸡5文钱一只,母鸡3文钱一只,小鸡3只1文钱,要求公鸡.母鸡.小鸡都必须要有,刚好用完100文钱,公鸡.母鸡.小鸡的数量之和也是100. public class te ...

  3. Django在使用logging日志模块时报错无法操作文件 logging error Permission Error [WinError 32]

    产生原因: 这个问题只会在开发的时候遇到,而且配置是写入到setting.py配置文件,我们定义了日志文件大小,当日志满了的时候,这时候就会遇到这个问题, 因为在使用Pycharm运行django的时 ...

  4. C语言 生成一个随机数

    随机数的生成 有缺陷的生成方式 生成随机数可以使用 <stdlib.h> 里的 int rand(void); 函数实现! 注释: C语言中还有一个 random() 函数可以获取随机数, ...

  5. 日志收集系统系列(四)之LogAgent优化

    实现功能 logagent根据etcd的配置创建多个tailtask logagent实现watch新配置 logagent实现新增收集任务 logagent删除新配置中没有的那个任务 logagen ...

  6. Go语言系列之性能调优

    在计算机性能调试领域里,profiling 是指对应用程序的画像,画像就是应用程序使用 CPU 和内存的情况. Go语言是一个对性能特别看重的语言,因此语言中自带了 profiling 的库,这篇文章 ...

  7. axios发送两次请求问题解决

    在使用axios的过程中,会发送两次请求. 看了下是因为有一个请求是OPTIONS来判断跨域的时候让不让发送请求的. 这个不算是一个bug,但是发送两个请求着实让人看着不舒服.于是修改了下,原来的请求 ...

  8. Keepalived高可用、四层负载均衡

    目录 Keepalived高可用 高可用简介 常用的工具 问题 名称解释 VRRP协议 部署keepalived 下载安装 Keepalived配置 保证nginx配置一样 解决keepalived的 ...

  9. office 下载(免费使用

    https://otp.landian.vip/zh-cn/download.html

  10. Centos下安装Scala(1)

    1.登录centos至root角色下 配置环境变量 2.执行下述命令 scala -version 出现结果如下 输入 'y' 3.开始安装 4.安装完成界面 5.启动成功以及测试程序