python 根据现有文件树创建文件树

# -*- coding: utf-8 -*-

import os, errno

def fileName(path):#获取文件夹

    str = ''

    for i in range(1,len(path.split('\\'))):

        str+=path.split('\\')[i]+'\\'

    return str

def mkdir_p(path): #创建目录树

    try:

        os.makedirs(path)

    except OSError as exc: # Python >2.5 (except OSError, exc: for Python <2.5)

        if exc.errno == errno.EEXIST and os.path.isdir(path):

            pass

        else: raise

def fileTraverse(filepath):

#遍历filepath下所有文件，包括子目录

    files = os.listdir(filepath)

    for fi in files:

        fi_d = os.path.join(filepath,fi)

        if os.path.isdir(fi_d):

            mkdir_p("E:\\"+fileName(fi_d))

            #创建文件夹，文件夹目录树

            fileTraverse(fi_d)#递归遍历

        else:

            print os.path.join(filepath,fi_d)

root = 'F:\\目标2'

root = root.decode('utf-8')#目录名中有中文，需要decode

fileTraverse(root)

# -*- coding: utf-8 -*-

import os, errno

import jieba.posseg as pseg

def fileName(filePath):#获取文件夹

    str = ''

    for i in range(1,len(filePath.split('\\'))):

    str+=filePath.split('\\')[i]+'\\'

    return str

def mkdir_p(path): #创建目录树

    try:

        os.makedirs(path)

    except OSError as exc: # Python >2.5 (except OSError, exc: for Python <2.5)

        if exc.errno == errno.EEXIST and os.path.isdir(path):

            pass

        else: raise

def splitSentence(inputFile):

    filePath = os.path.dirname(inputFile)  #获取路径名

    name = os.path.basename(inputFile)      #获取文件名

    fin = open(inputFile,'r')               #以读的方式打开文件

    outputfile = "E:\\" + fileName(filePath)#~~~~~~~~~~~~~~~~~~~~~~~~~~~源文件~~~~~~~~~~~~~~~~~~~~~~~~~~~

    #outputfile = (outputfile+name).decode('utf-8')

    fout = open(outputfile+name,'w')         #以写得方式打开文件

    for eachLine in fin:

    line = eachLine.strip().decode('utf-8','ignore')      #去除每行首尾可能出现的空格，并转为Unicode进行处理

        line=line.strip('\n')                                       #去掉多余空行

        wordList = pseg.cut(line)                        #用结巴分词，对每行内容进行分词

        outStr = ''

        for word in wordList:#

        #print word.word,word.flag

        outStr += word.word+'/'+word.flag

        #print outStr

        fout.write(outStr.encode('utf-8'))           #将分词好的结果写入到输出文件

        fout.write('\n')

    fin.close()

    fout.close()

def fileTraverse(filePath):

#遍历filepath下所有文件，包括子目录

    files = os.listdir(filePath)

    for fi in files:

    fi_d = os.path.join(filePath,fi)

    if os.path.isdir(fi_d):

    #检验给出的路径是否是一个目录

        mkdir_p("E:\\"+fileName(fi_d))#~~~~~~~~~~~~~~~~~~~~~~~~~~~目标文件~~~~~~~~~~~~~~~~~~~~~~~~~~~

        #创建文件夹，文件夹目录树

        fileTraverse(fi_d)#递归遍历

    else:

        #print os.path.join(filePath,fi_d)#y与fi_d相同

        #print fi_d

        splitSentence(fi_d)

root = 'F:\\source'       #~~~~~~~~~~~~~~~~~~~~~~~~~~~源文件~~~~~~~~~~~~~~~~~~~~~~~~~~~

root = root.decode('utf-8')#目录名中有中文，需要decode

fileTraverse(root)

python 根据现有文件树创建文件树的更多相关文章

php学习笔记--高级教程--读取文件、创建文件、写入文件
打开文件:fopen:fopen(filename,mode);//fopen("test.txt","r"): 打开模式:r 仅仅读方式打开,将文件指针指向 ...
linux中为什么删除文件比创建文件要快，读取文件和删除文件的过程是什么？
一.为什么删除文件比创建文件要快? 因为删除文件只是将bitmap位图表中将文件所占据的inode 和dacablock的使用状态从1变成0,相当于释放了这些快的使用权. 二.读取文件和删除文件的过程 ...
python在windows系统上创建文件
正确方法为:open("test1.txt",'wb')或open("test1.txt",'w') 以下是网上的方法创建遇到的问题使用Python2.7在w ...
Python中根据时间自动创建文件夹
导语电脑桌面文件太多查找起来比较花费时间,并且凌乱的电脑桌面也会影响工作心情,于是利用python根据时间自动建立当日文件夹,这样就可以把桌面上文件按时间进行存放. 代码实现 # _*_codi ...
asp.net上传文件并创建文件夹和删除文件
上传文件部分代码: /// <summary> /// 上传保存文件并返回文件的保存地址和文件名称 /// </summary> /// <param name=&quo ...
[sharepoint]rest api文档库文件上传，下载，拷贝，剪切，删除文件，创建文件夹，修改文件夹属性，删除文件夹，获取文档列表
写在前面最近对文档库的知识点进行了整理,也就有了这篇文章,当时查找这些接口,并用在实践中,确实废了一些功夫,也为了让更多的人走更少的弯路. 系列文章 sharepoint环境安装过程中几点需要注意的 ...
Java File文件操作创建文件\目录，删除文件\目录
Java手册 java.io 类 File java.lang.Object java.io.File 所有已实现的接口: Serializable, Comparable<File> p ...
Java中Io流操作-File类的常用操作-创建文件，创建文件夹
package com.hxzy.IOSer; import java.io.File;import java.io.IOException; public class Demo03 { public ...
linux删除文件、创建文件
1.删除文件 rm huahua.txt 2.创建文件 touch huahua.txt

随机推荐

H5+ 移动app学习之二 Native.js
Native.js技术,简称NJS,是一种将手机操作系统的原生对象转义,映射为JS对象,在JS里编写原生代码的技术.如果说Node.js把js扩展到服务器世界,那么Native.js则把js扩展到手机 ...
js中== 和===中的区别
<!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <m ...
xamarin(3.9.236)里DATETIMENOW的错误。
[ERROR] FATAL UNHANDLED EXCEPTION: System.EntryPointNotFoundException: monodroid_get_system_property ...
消息中间件MetaQ高性能原因分析-转自阿里中间件
简介 MetaQ是一款高性能的消息中间件,经过几年的发展,已经非常成熟稳定,历经多年双11的零点峰值压测,表现堪称完美. MetaQ当前最新最稳定的稳本是3.x系统,MetaQ 3.x重新设计和实现, ...
Puppet自动化运维-资源介绍篇（4）
1.什么是资源? 资源是Puppet最基础的元素,每个资源的定义都具有标题,类型,以及一系列的属性. 资源定义有如下的特性: (1) Puppet使用title在编译时区分每个资源,使用命名变量在 ...
memcache的lru删除机制
惰性删除,get时才删除 LRU原理:当某个单元被请求的时候,维护一个计数器,通过计数器来判断最近谁最少使用,那就把谁踢出去. 注:即使某个key设置的永久有效,也会被踢出来,这个就是永久数据被踢的现 ...
贝塞尔曲线（cubic bezier）
对于css3的Transitions,网上很多介绍,相信大家都比较了解,这里用最简单的方式介绍下: transition语法:transition:<transition-property> ...
spring spring data jpa save操作事务
整合spring spring data jpa的时候,在save方法上加了@Transactional注解.此时调用springdatajpa save方法并不会真的把数据提交给数据库,而是缓存起来 ...
条码固定资产管理PDA应用
条码固定资产管理解决方案一.客户挑战与需求随着企业经营管理的不断升级,固定资产管理的高效化.智能化管理越来越受到企业管理人员的重视.然而,固定资产具有数量大.种类多.价值高.使用周期长.使用地点分 ...
IOS UIAppLocation 单例模式
UIApplocation * app=[UIApplocation shareapplocation]; UIAppLocation 只能被初始化一次. 一个程序中只能被创建一次,称为单例模式. 单 ...

python 根据现有文件树创建文件树

python 根据现有文件树创建文件树的更多相关文章

随机推荐

热门专题