使用vbs脚本进行批量编码转换

最近需要使用SourceInsight查看分析在Linux系统下开发的项目代码,我们知道Linux系统中文本文件默认编码格式是UTF-8,而Windows中文系统中的默认编码格式是Gb2312。系统内的编码格式有所区别倒无伤大雅,关键的是SourceInsight竟不支持UTF-8,导致项目代码内的中文注释全部乱码!

既然SourceInsight不支持UTF-8编码的文件,那我们就得想办法将UTF-8的代码文件转化为GB2312编码的。首先想到的是到网上搜一下“批量编码转换工具”,结果下载后发现编码转换后的文件总是出现乱码,可能是工具的bug吧。既然不能使用工具转换,那就自己写一个程序进行编码转换,但是细想一下觉得C++/java的编码转换程序写起来又比较啰嗦,要是在Linux下写一个shell脚本就能轻松搞定了。还好Windows下有vbs脚本可以帮助我们轻松达到这个目的。

'-------------------------------------------------

'函数名称:ReadFile

'作用:利用AdoDb.Stream对象来读取各种格式的文本文件

'-------------------------------------------------

Function ReadFile(FileUrl, CharSet)

Dim Str

Set stm = CreateObject("Adodb.Stream")

stm.Type = 2

stm.mode = 3

stm.charset = CharSet

stm.Open

stm.loadfromfile FileUrl

Str = stm.readtext

stm.Close

Set stm = Nothing

ReadFile = Str

End Function

我们使用ReadFile函数读取文件,其中FileUrl指定文件的路径,CharSet指定文件的原始编码格式,使用adodb.stream对象读取文件内容到Str。

'-------------------------------------------------

'函数名称:WriteToFile

'作用:利用AdoDb.Stream对象来写入各种格式的文本文件

'-------------------------------------------------

Function WriteToFile (FileUrl, Str, CharSet)

Set stm = CreateObject("Adodb.Stream")

stm.Type = 2

stm.mode = 3

stm.charset = CharSet

stm.Open

stm.WriteText Str

stm.SaveToFile FileUrl, 2

stm.flush

stm.Close

Set stm = Nothing

End Function

然后使用WriteToFile将Str写回原文件FileUrl,并设定新的编码CharSet。

'-------------------------------------------------

'函数名称:ConvertFile

'作用:将一个文件进行编码转换

'-------------------------------------------------

Function ConvertFile(FileUrl)

Call WriteToFile(FileUrl, ReadFile(FileUrl, SrcCode), DestCode)

End Function

这样ConvertFile对上述两个函数封装,实现文件FileUrl的编码转换,其中原始编码SrcCode与目的编码DestCode为全局变量。

如果仅对一个文件进行编码转换,我们不必这么大费周章。我们希望能对任意的文件或文件夹内的所有文件进行编码转换,达到批量转换的目的。

'-------------------------------------------------

'函数名称:ConvertDir

'作用:将任意目录内的文件进行编码转换

'-------------------------------------------------

Function ConvertDir(DirUrl)

If fs.FileExists(DirUrl) Then

Call ConvertFile(DirUrl)

Else

Call SearchDir(DirUrl)

End If

End Function

函数ConvertDir对任意路径的文件/文件夹进行编码转换,使用scripting.filesystemobject对象的FileExists函数判断路径对应的是文件还是文件夹,如果是文件则直接调用ConvertFile进行编码转换,否则调用SearchDir处理文件夹。

'-------------------------------------------------

'函数名称:SearchDir

'作用:递归查找目录内的文件,进行编码转换

'-------------------------------------------------

Function SearchDir(path)

Set folder = fs.getfolder(path)

Set subfolders = folder.subfolders

Set Files = folder.Files

For Each i In Files

Call ConvertFile(i.path)

Next

For Each j In subfolders

Call SearchDir(j.path)

Next

End Function

函数SearchDir是递归的,首先调用getfolder创建文件夹对象,然后取出文件夹内的子文件夹集合subfolders和子文件集合files。对于每个子文件,直接调用ConvertFile进行编码转换即可,而对于每个子文件夹,则递归调用SearchDir重复处理。

'-------------------------------------------------

'设置编码:默认 utf-8  --> gb2312

'-------------------------------------------------

SrcCode="utf-8"

DestCode="gb2312"

'-------------------------------------------------

'解析参数

'-------------------------------------------------

Set fs = CreateObject("scripting.filesystemobject")

Set objArgs = WScript.Arguments

If objArgs.Count>0 Then

For I = 0 To objArgs.Count - 1

FileUrl = objArgs(I)

Call ConvertDir(FileUrl)

Next

Else

MsgBox "没有文件/文件夹被拖入!"

wscript.quit

End If

MsgBox "转换成功!"

最后通过解析脚本文件的参数,由于每个参数对应一个文件/文件夹的路径,将之传递给ConvertDir即可。这里默认的是将UTF-8编码转化为GB2312编码,读者可以根据自身需要自行修改。

将上述代码保存为ConvertCode.vbs,只需要将任意多个文件选中拖动到该脚本文件上即可。或者使用命令行。

> ConvertCode.vbs [filepath]

需要注意的是文件编码是就地转换的,在转换之前最好将原文件/文件夹进行备份。

最后附上脚本文件的所有代码。

  
        FileUrl = objArgs(I)
        
    stm.mode = 
    stm.charset = CharSet
    stm.Open
    stm.loadfromfile FileUrl
    
    stm.mode = 
    stm.charset = CharSet
    stm.Open
    stm.WriteText 
    stm.flush
    stm.Close
    Set stm = Nothing
End Function

使用vbs脚本进行批量编码转换的更多相关文章

  1. 用shell批量编码转换

    -------------------------------------文件内容转换:iconv-------------------------------------- 通常,从其他平台拷贝过来 ...

  2. loadrunner 脚本开发-字符串编码转换

    字符串编码转换 by:授客 QQ:1033553122   相关函数 lr_convert_string_encoding函数 功能:字符串编码转换 原型: int lr_convert_string ...

  3. python实现文件批量编码转换

    起因:大三做日本交换生期间在修一门C语言图像处理的编程课,在配套书籍的网站上下载了sample,但是由于我用的ubuntu18.04系统默认用utf-8编码,而文件源码是Shift_JIS编码,因而文 ...

  4. 远程控制分析之VBS编码转换

    简介 分析这种VBS简单chr()函数编码的脚本技巧.只需要把vbs的execute()函数换成信息输出到控制台(dos窗口)函数就可以了. WSH.Echo "print your mes ...

  5. python基础-2 编码转换 pycharm 配置 运算符 基本数据类型int str list tupple dict for循环 enumerate序列方法 range和xrange

    1.编码转换 unicode 可以编译成 UTF-U GBK 即 #!/usr/bin/env python # -*- coding:utf-8 -*- a = '测试字符' #默认是utf-8 a ...

  6. discuz编码转换UTF8与GBK互转完美适合Discuz3.x系列

    由于一些网站通信编码的问题不得不把一直使用的网站编码由UTF8转为GBK,在转换过程中在官方看了很多方法,自己也都尝试了一些最后都没有能够成功,数据库的转换一直都是没有大问题,不存在丢失什么的,能看到 ...

  7. Vbs脚本经典教材(转)

    Vbs脚本经典教材(最全的资料还是MSDN) —为什么要使用Vbs? 在Windows中,学习计算机操作也许很简单,但是很多计算机工作是重复性劳动,例如你每周也许需要对一些计算机文件进行复制.粘贴.改 ...

  8. 理解perl的编码转换——utf8以及乱码

    工作需要,闲暇之余,仔细研究了一下脚本乱码的问题 1. vim新建的文件 1)在linux命令行 vim命令建立的文件,如果内容中不出现中文,默认是ASCII.那么用notepad++打开的时候,就是 ...

  9. VBS脚本和HTML DOM自动操作网页

    VBS脚本和HTML DOM自动操作网页 2016-06-16 10:24 1068人阅读 评论(0) 收藏 举报  分类: Windows(42)  版权声明:本文为博主原创文章,未经博主允许不得转 ...

随机推荐

  1. 设置CentOS不启用图形界面

    由于linux服务器放在机房长时间运行,或者只是在后台运行,一般通过secureCRT连接服务器: 所以在虚拟机上都不需要图形界面,而且图形界面占用内存. 所以,我们可以通过简单的设置,让linux只 ...

  2. Axure 自适应视图

    假设B为A的子视图 继承: A更新 文字内容.交互事件.禁用: 位置.尺寸.样式.交互样式 时, B都会继承响应更新变化 B更新 文字内容.交互事件.禁用时,A也会更新 B更新 位置.尺寸.样式.交互 ...

  3. 号称21世纪的编辑器Atom

    上个月无意中在一篇软文中看到一篇前端排行榜,其中有一项排行就是编辑器,而排在前三的编辑器分别是sublime.Atom.webstorm.出于好奇,简单的在网上查看了介绍,原来全球最大开源分享网站gi ...

  4. HRPlugin For Xcode发布(附源码地址)

    今天给大家介绍的这个插件,是我在IOS平台上开发以来,一些想法的集合体.因为本人时常感觉在开发过程中无论从GOOGLE资料查找和SQL数据库查询,正则表达式测试,SVN等,这些经常要做的操作中,耽误了 ...

  5. If & Else 语句

    If 语句 user= "吹Sir"passwd= "strong"username = input ("Username:")passwo ...

  6. CEF中select选项错位的解决方法

    使用cef加载页面,移动窗口后选项的位置并不会变化,仍保持上次打开的位置. 经过google查找到这是一个已经解决了的问题:https://bitbucket.org/chromiumembedded ...

  7. BZOJ4455: [Zjoi2016]小星星

    Description 小Y是一个心灵手巧的女孩子,她喜欢手工制作一些小饰品.她有n颗小星星,用m条彩色的细线串了起来,每条细 线连着两颗小星星.有一天她发现,她的饰品被破坏了,很多细线都被拆掉了.这 ...

  8. 使用git把项目提交到github

    1.需要在https://github.com/注册一个账户 2.注册成功后,新建一个repository,用来存放你要上传的项目,如下图所示 这里你需要输入你的项目的名称,可以对你的项目进行描述,如 ...

  9. PHP常见的低级错误

    写代码的时候,最讨厌的莫过于因为粗心而范的低级错误了,下面这些,你们是不是也经常犯呢? 1.标点符号缺失,诸如:“$”(美元符),“,”(逗号),“;”(分号),"->"(单 ...

  10. block 从B界面向A界面传值

    最近在改公司外包项目的代码,发现了一种block传值的用法很有意思,记录一下 A.B两个页面 在B界面.h中定义 @property (nonatomic,strong) void(^block)(N ...