numpy的np.fromfile会出现如下的问题,只能一次性读取文件的内容,不能追加读取,连续两次的np.fromfile读到的东西一样

如果数据文件太大(几个G或以上)不能一次性全读进去,需要追加读取

而我希望读到的donser1和donser2是连续的两段

(实际使用时,比如说读取的文件是二进制数据文件,每一块文件都包括包头+数据,希望将这两块分开获取,然后再做进一步处理)

代码:

  1. import numpy as np
  2.  
  3. length=2500
  4. plt_arr=np.linspace(0.0, 0.0, length*2048*16)
  5. start=0
  6. tail_size = 40 #40bit
  7. num_size=16*1024-40 # 16kb -40b
  8.  
  9. def one_file(f, loop):
  10. global tail_size, num_size
  11. while loop:
  12. num = np.fromfile(f, dtype=np.int16, count=num_size)
  13. tail=np.fromfile(f, dtype=np.int16, count=tail_size)
  14. loop=loop-1
  15. yield num, tail
  16.  
  17. def main():
  18. file_path="E://1-gl300c.r3f"
  19. global length, plt_arr, start
  20. loop=length
  21. with open(file_path, 'rb') as f:
  22. for num, tail in one_file(f, loop):
  23. plt_arr[start:start+len(num)]=num[:]
  24. start=start+len(num)
  25. return plt_arr[0:start]
  26.  
  27. if __name__ == "__main__":
  28. donser=main()
  29. print(donser)
  1. 假设数据文件的格式是 数据+包尾,plt_arr存储全部的数据部分,包尾丢弃,该方法实现了多次连续追加读取数据文件的内容
    plt_arr最好使用先开好大小再逐次赋值,亲测append方法和concatenate方法时间效率极差
    或者不用numpy也可以,代码:
  1. def read_in_chunks(filePath, chunk_size=16*1024):
  2. file_object = open(filePath,'rb')
  3. count=0
  4. while True:
  5. chunk_data = file_object.read(chunk_size)
  6. if not chunk_data:
  7. break
  8. yield chunk_data[0:16*1024-28]
  9.  
  10. if __name__ == "__main__":
  11. num=0
  12. for chunk in read_in_chunks("E:\\1-gl300c.r3f"):
  13. #process(chunk) # <do something with chunk>
  14. name=str(num)+".bin"
  15. num=num+1
  16. if num<303000:
  17. continue
  18. if num>308001:
  19. break
  20. file_object = open(name, 'wb')
  21. file_object.write(chunk)
  22. file_object.close( )
  1. numpy.fromfile的其他方法可以参考这个

python numpy实现多次循环读取文件 等间隔过滤数据的更多相关文章

  1. php使用PHPexcel类读取excel文件(循环读取每个单元格的数据)

    error_reporting(E_ALL); date_default_timezone_set('Asia/ShangHai'); include_once('Classes/PHPExcel/I ...

  2. Halcon中循环读取文件的实现以及数字与字符的转换

    在循环读取文件的位置时,常用到数字与字符的转换. 数字与字符的转换 将字符转换为数字 tuple_number(StringImageIndex,IntImageIndex)` 1 2 1 2 将数字 ...

  3. 循环读取文件夹中的图片matlab代码

    参考:http://blog.csdn.net/guoxiaojie_415/article/details/21317323:http://blog.csdn.net/qikaihuting/art ...

  4. Day16_95_IO_循环读取文件字节流read()方法(四)

    循环读取文件字节流read()方法(四) 使用 int read(byte[] bytes) 循环读取字节流数据 import java.io.FileInputStream; import java ...

  5. Day16_94_IO_循环读取文件字节流read()方法(二)

    循环读取文件字节流read()方法 通过read()循环读取数据,但是read()每次都只能读取一个字节,频繁读取磁盘对磁盘有伤害,且效率低. import java.io.FileInputStre ...

  6. python 3.x 循环读取文件用户登录

    import os # 导入python自带库的模块 import sys # 导入python自带库的模块 import getpass # 导入python自带库的模块 lock_file = ' ...

  7. Matlab如何循环读取文件

    循环读取图片第一种方法①List =dir('*.jpg'); %如需其它图片格式支持,可以自己[重载dir()]函数,实现查找所有图片文件的功能,%如果图片是其它路径,可以用 ["路径&q ...

  8. linux 循环读取文件的每一行

    在Linux中有很多方法逐行读取一个文件的方法,其中最常用的就是下面的脚本里的方法,而且是效率最高,使用最多的方法.为了给大家一个直观的感受,我们将通过生成一个大的文件的方式来检验各种方法的执行效率. ...

  9. windows 和 linux 上 循环读取文件名称的区别和方法

    function showGetFileName($type){ $url="/opt/mobile_system/gscdn"; //另一台服务器映射到linux过来的路径. # ...

随机推荐

  1. LOFTER 迁移

    title: LOFTER 迁移 date: 2018-09-01 16:41:02 updated: tags: [其他] description: keywords: comments: imag ...

  2. luogu1736 创意吃鱼法

    好的题解使人一下就懂啊-- s1[i][j]表示(i,j)最多向左(或右)延伸多少个格子,使这些格子中的数都是0(不包括(i,j)) s2[i][j]表示(i,j)最多向上延伸多少个格子,使这些格子中 ...

  3. 一个程序员一月的开销统计分析、(附上PC端和移动端android源码)

    图片1(类别): 图片中的数据是我一月的花费统计分析. 这是该网站的地址:http://www.10086bank.com/(需要登录)  没有帐号马上注册一个吧.进入系统后点击“记一笔”  添加数据 ...

  4. windows :Tomcat免安装版环境变量配置 + jdk配置

    1.  下载后解压,我解压的目录为:D:\Tomcat\apache-tomcat-9.0.1-windows-x64 2.  安装jdk和jre, 并配置环境变量: 2.1 用户变量新建JAVA_H ...

  5. python学习-- for和if结合使用

    for和if结合使用: <h1> {% for i in contents %} {{ i }}{# 注意i也要用两个大括号 #} {% endfor %} </h1> < ...

  6. LiveScript 操作符

    The LiveScript Book     The LiveScript Book 操作符 数字 标准的数学操作符: 1.1 + 2 # => 32.3 - 4 # => -13.6 ...

  7. Python爬虫selenium、PhanmJs

    selenium:可以模拟鼠标进行一些操作 实例1:实现自动打开google浏览器,进行百度搜索,并关闭浏览器 from selenium import webdriver from time imp ...

  8. [linx学习篇] ssh远程服务器免密码

    第一步:生成密钥.在终端下执行命令: ssh-keygen -t rsa 一路回车,各种提示按默认不要改,等待执行完毕.然后执行: ls ~/.ssh #可以看到两个密钥文件:id_rsa(私钥) i ...

  9. [uiautomator篇][10] uiautomator进阶

    http://coderlin.coding.me/2016/07/02/Android-%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%87%AA%E5%8A%A8%E5%8C%96% ...

  10. Spring AOP(面向切面)

    什么是AOP?基本概念切面(aspect):横切关注点被模块化的特殊对象.通知(advice):切面必须要完成的工作.切面中的每个方向称之为通知.通知是在切面对象中的.目标(target):被通知的对 ...