使用python读取文本中结构化数据

需求

read some .txt file in dir and find min and max num in file.

solution:

echo *.txt > file.name in linux shell

>>>execfile(“mytest.py”);       //equivalent to run mytest.m in matlab

  import os

  fileobj = open("./test2images/2d_xxx.name");

  filestring = fileobj.readline();    //line is a list stored all .txt name

  filestring = filestring.split();

  dir = './test2images/'

 x = [];

 y = [];

 for i in filestring:

     dataname = open(dir + i);

      for j in range(1,15):

          data = dataname.readline();

          if not data:

              break;

          data = data.strip('\r\n');

          data = data.split();	              //It will split the long string line as a list of strings

          x.append(int(data[0]));

          y.append(int(data[1]));

  print min(x)

  print min(y)

//normal structure of while circulation

  #   while 1:

  #       data = dataname.readline();

  #       if not data:

  #           break;

读写中英文参杂的文本

str.decode('utf8')    #str先使用utf8的方式解码，得到每个汉字为一个字符

str.encode('utf8')    #保存str到文件之前，先使用utf8的方式编码，再存储

使用python读取文本中结构化数据的更多相关文章

详解Google-ProtoBuf中结构化数据的编码
本文的主要内容是google protobuf中序列化数据时用到的编码规则,但是,介绍具体的编码规则之前,我觉得有必要先简单介绍一下google protobuf.因此,本文首先会介绍一些google ...
python读取es中的所有数据并计算md5然后进行持久化
#!/usr/bin/python import threading import json import time from elasticsearch import Elasticsearch f ...
Python爬虫(九)_非结构化数据与结构化数据
爬虫的一个重要步骤就是页面解析与数据提取.更多内容请参考:Python学习指南页面解析与数据提取实际上爬虫一共就四个主要步骤: 定(要知道你准备在哪个范围或者网站去搜索) 爬(将所有的网站的内容全 ...
零基础学Python之结构化数据（附详细的代码解释和执行结果截图）
3结构化数据字典(查找表).集合.元组.列表 3.1字典是有两列任意多行的表,第一列存储一个键,第二列存储一个值. 它存储键/值对,每个唯一的键有一个唯一与之关联的值.(类似于映射.表) 它不会维 ...
H5中使用Web Storage来存储结构化数据
在上一篇对Web Storage的介绍中,可以看到,使用Storage保存key—value对时,key.value只能是字符串,这对于简单的数据来说已经够了,但是如果需要保存更复杂的数据,比如保存类 ...
[Python]ctypes+struct实现类c的结构化数据串行处理
1. 用C/C++实现的结构化数据处理在涉及到比较底层的通信协议开发过程中, 往往需要开发语言能够有效的表达和处理所定义的通信协议的数据结构. 在这方面是C/C++语言是具有天然优势的: 通过str ...
Spark读取结构化数据
读取结构化数据 Spark可以从本地CSV,HDFS以及Hive读取结构化数据,直接解析为DataFrame,进行后续分析. 读取本地CSV 需要指定一些选项,比如留header,比如指定delimi ...
TensorFlow从1到2（六）结构化数据预处理和心脏病预测
结构化数据的预处理前面所展示的一些示例已经很让人兴奋.但从总体看,数据类型还是比较单一的,比如图片,比如文本. 这个单一并非指数据的类型单一,而是指数据组成的每一部分,在模型中对于结果预测的影响基本 ...
Bigtable：一个分布式的结构化数据存储系统
Bigtable:一个分布式的结构化数据存储系统摘要 Bigtable是一个管理结构化数据的分布式存储系统,它被设计用来处理海量数据:分布在数千台通用服务器上的PB级的数据.Google的很多项目将 ...

随机推荐

YBT 2.4 AC自动机
其实这个专题NOIP几乎不考 AC自动机,就是能让题自动AC的东西,是不是十分神奇对的,就是这么神奇 AC自动机是解决多模式串与文本串匹配的问题是KMP+Trie树的结合,也是一个毒瘤算法 Key ...
CORS解决跨域访问问题
简言之,CORS就是为了让AJAX可以实现可控的跨域访问而生的. Tomcat下的配置下载cors-filter-1.7.jar,java-property-utils-1.9.jar [下载 ...
DOM基本代码一
dom学习基本代码第一部分 <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> < ...
HDU1815 2-sat+二分
Building roads Time Limit: 10000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Tot ...
神经网络CNN训练心得--调参经验
1.样本要随机化,防止大数据淹没小数据 2.样本要做归一化.关于归一化的好处请参考:为何需要归一化处理3.激活函数要视样本输入选择(多层神经网络一般使用relu)4.mini batch很重要,几百是 ...
aos.js让页面滚动变得丰富
(转)<script src="js/jquery-2.1.1.min.js" type="text/javascript"></script ...
Linux系统查看系统信息
1. CPU # lscpu # cat /proc/cpuinfo //可以知道每个cpu信息,如每个CPU的型号,主频等 2. 内存 # free -m # cat /proc/meminfo / ...
free命令buff和cache的区别
[root@iz8vb8kca7twx6177bqg0fz ~]# free -h total used free shared b ...
bzoj 2200: [Usaco2011 Jan]道路和航线——拓扑+dijkstra
Description Farmer John正在一个新的销售区域对他的牛奶销售方案进行调查.他想把牛奶送到T个城镇 (1 <= T <= 25,000),编号为1T.这些城镇之间通过R条 ...
webpack自动生成项目的html
1 自动生成多个html页面设置webpack.config.js中的plugins属性,多次调用plugin插件(new htmlWebpackPlugin()),同时设置对应数量的.js入口文件 ...

使用python读取文本中结构化数据

需求

读写中英文参杂的文本

使用python读取文本中结构化数据的更多相关文章

随机推荐

热门专题