C# winfrom 写的一个搜索助手,可以按照标题和内容搜索,指定目录后,遍历搜索文件和子目,现在只写了支持.DOC.DOCX.XLS.XLSX.PPT.PPTX.PDF.HTML.HTM.TXT等格式的文件搜索,读取execl 内容使用的是NPOI组件,doc,html,txt 格式的使用StreamReader 流文件读取方式,ppt,pdf使用的Spire组件。

直接上代码

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using System.Threading;
using System.Security.AccessControl;
using NPOI.SS.UserModel;
using NPOI.HSSF.UserModel;
using NPOI.XSSF.UserModel;
using Spire.Presentation;
using Spire.Pdf; namespace Search
{
public partial class formMain : Form
{
public formMain()
{
InitializeComponent();
}
//选择文件路径
private void button1_Click(object sender, EventArgs e)
{
try
{
FolderBrowserDialog dialog = new FolderBrowserDialog();
dialog.Description = "请选择文件路径";
if (dialog.ShowDialog() == DialogResult.OK)
{
string foldPath = dialog.SelectedPath;
textBox1.Text = foldPath;
//把选择路径存储在注册表
Application.UserAppDataRegistry.SetValue("ZMJASearchPath", foldPath);
}
}
catch (Exception err)
{
MessageBox.Show(err.Message);
}
} private void button2_Click(object sender, EventArgs e)
{
try
{
string foldPath = textBox1.Text;
if (string.IsNullOrEmpty(foldPath))
{
MessageBox.Show("请选择文件路径!");
return;
}
string searckkey = textBox2.Text;
if (string.IsNullOrEmpty(searckkey))
{
MessageBox.Show("请输入搜索关键字!");
return;
}
string extension = comboBox1.Text;
if (!string.IsNullOrEmpty(extension))
{
extension = extension.ToUpper();
switch (extension)
{
case ".HTML":
extension = ".HTML.HTM";
break;
case ".DOC":
extension = ".DOC.DOCX";
break;
case ".XLS":
extension = ".XLS.XLSX";
break;
case ".PPT":
extension = ".PPT.PPTX";
break;
default:
break;
}
}
else {
extension = ".DOC.DOCX.XLS.XLSX.PPT.PPTX.PDF.HTML.HTM.TXT";
}
dataGridView1.Rows.Clear();
listDirectory(@foldPath, extension, comboBox2.Text, searckkey); lbmessage.Text = "";
MessageBox.Show("搜索完毕");
}
catch (Exception err)
{
MessageBox.Show(err.Message);
}
} /// <summary>
/// 列出path路径对应的文件夹中的子文件夹和文件
/// 然后再递归列出子文件夹内的文件和文件夹
/// </summary>
/// <param name="path">需要搜索文件夹的路径</param>
public void listDirectory(string path,string extension, string coding,string searckkey)
{
DirectoryInfo theFolder = new DirectoryInfo(@path);
DirectorySecurity s = new DirectorySecurity(path, AccessControlSections.Access);
//判断目录是否 可以访问
if (!s.AreAccessRulesProtected)
{ foreach (FileInfo file in theFolder.GetFiles())
{
if (string.IsNullOrEmpty(extension) || extension.Contains(file.Extension.ToUpper()))
{
lbmessage.Text = "正在搜索文件:" + path + "\\" + file.Name;
Application.DoEvents(); #region 仅检索标题
if (comboBox3.Text == "仅标题")
{
if (file.Name.Contains(searckkey))
{
int index = this.dataGridView1.Rows.Add();
this.dataGridView1.Rows[index].Cells[].Value = index + ;
this.dataGridView1.Rows[index].Cells[].Value = file.Name;
this.dataGridView1.Rows[index].Cells[].Value = path + "\\" + file.Name;
break;
}
}
#endregion #region 标题和内容都检索
else
{
#region 检索判断标题
//默认检索 先搜索标题是否有,如果有,则退出循环,如果没有,再检索内容
if (file.Name.Contains(searckkey))
{
int index = this.dataGridView1.Rows.Add();
this.dataGridView1.Rows[index].Cells[].Value = index + ;
this.dataGridView1.Rows[index].Cells[].Value = file.Name;
this.dataGridView1.Rows[index].Cells[].Value = path + "\\" + file.Name;
break;
}
#endregion using (FileStream fs = new FileStream(path + "\\" + file.Name, FileMode.Open, FileAccess.Read))
{
#region 读取Execl if (file.Extension.ToUpper().Contains(".XLS"))
{
try
{
IWorkbook workbook = null;//全局workbook
ISheet sheet;//sheet
switch (file.Extension)
{
//xls是03,用HSSFWorkbook打开,.xlsx是07或者10用XSSFWorkbook打开
case ".xls": workbook = new HSSFWorkbook(fs); break;
case ".xlsx": workbook = new XSSFWorkbook(fs); break;
default: break;
}
fs.Close();//关闭文件流
if (workbook != null)
{
int count = workbook.NumberOfSheets;
bool bo = false; //bo初始化为假
for (int index = ; index < count; index++)
{
if (bo)//如果bo为真
break;//退出第一层循环
sheet = workbook.GetSheetAt(index);//读取到指定的sheet
//遍历读取cell
for (int i = sheet.FirstRowNum; i <= sheet.LastRowNum; i++)
{
if (bo)//如果bo为真
break;//退出第二层循环
IRow row = sheet.GetRow(i);//得到一行
if (row != null)
{
for (int j = row.FirstCellNum; j < row.LastCellNum; j++)
{
ICell cell = row.GetCell(j);//得到cell
if (cell != null)//如果cell为null,则赋值为空
{
if (row.GetCell(j).ToString().Contains(searckkey))
{
int GridIndex = this.dataGridView1.Rows.Add();
this.dataGridView1.Rows[GridIndex].Cells[].Value = GridIndex + ;
this.dataGridView1.Rows[GridIndex].Cells[].Value = file.Name;
this.dataGridView1.Rows[GridIndex].Cells[].Value = path + "\\" + file.Name;
bo = true;//bo赋为真
break;//退出第三层循环
}
}
}
}
}
}
}
//释放资源
workbook = null;
sheet = null;
}
catch (Exception err)
{
//MessageBox.Show(err.Message);
}
}
#endregion #region 读取ppt内容
else if (file.Extension.ToUpper().Contains(".PPT"))
{
try
{
//初始化一个Presentation类实例,并加载文档
Presentation ppt = new Presentation();
ppt.LoadFromFile(path + "\\" + file.Name);
bool bo = false;
foreach (ISlide slide in ppt.Slides)
{
if (bo)//如果bo为真
break;//退出第一层循环
foreach (Spire.Presentation.IShape shape in slide.Shapes)
{
if (bo)//如果bo为真
break;//退出第一层循环
if (shape is IAutoShape)
{
foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
{
if (tp.Text.Contains(searckkey))
{
int GridIndex = this.dataGridView1.Rows.Add();
this.dataGridView1.Rows[GridIndex].Cells[].Value = GridIndex + ;
this.dataGridView1.Rows[GridIndex].Cells[].Value = file.Name;
this.dataGridView1.Rows[GridIndex].Cells[].Value = path + "\\" + file.Name;
bo = true;//bo赋为真
break;//退出第三层循环
}
}
} }
}
ppt = null; //释放资源
}
catch (Exception err)
{
//MessageBox.Show(err.Message);
}
}
#endregion #region 读取pdf文件
else if (file.Extension.ToUpper().Contains(".PDF")) {
try
{
PdfDocument pdf= new PdfDocument();
pdf.LoadFromFile(@path + "\\" + file.Name);
foreach (PdfPageBase page in pdf.Pages)
{
string content = page.ExtractText();
if (content.Contains(searckkey)) {
int GridIndex = this.dataGridView1.Rows.Add();
this.dataGridView1.Rows[GridIndex].Cells[].Value = GridIndex + ;
this.dataGridView1.Rows[GridIndex].Cells[].Value = file.Name;
this.dataGridView1.Rows[GridIndex].Cells[].Value = path + "\\" + file.Name;
break;
}
}
pdf = null;//释放资源
}
catch (Exception err) { }
}
#endregion #region 读取其他文本文件
else
{
Encoding codingType = Encoding.Default;
if (!string.IsNullOrEmpty(coding))
{
codingType = Encoding.GetEncoding(coding.ToUpper());
}
else
{
codingType = common.GetType(path + "\\" + file.Name);
}
StreamReader sr = new StreamReader(fs, codingType);
String str;
while ((str = sr.ReadLine()) != null)
{
if (str.Contains(searckkey))
{
int index = this.dataGridView1.Rows.Add();
this.dataGridView1.Rows[index].Cells[].Value = index + ;
this.dataGridView1.Rows[index].Cells[].Value = file.Name;
this.dataGridView1.Rows[index].Cells[].Value = path + "\\" + file.Name;
sr.Close();
fs.Close();
break;
}
}
}
#endregion }
} #endregion
}
}
}
//遍历文件夹
foreach (DirectoryInfo NextFolder in theFolder.GetDirectories())
{
if ((NextFolder.Attributes & FileAttributes.Hidden) != FileAttributes.Hidden) {
listDirectory(NextFolder.FullName,extension, coding,searckkey);
}
}
} private void OpenFolderAndSelectFile(String fileFullName)
{
System.Diagnostics.ProcessStartInfo psi = new System.Diagnostics.ProcessStartInfo("Explorer.exe");
psi.Arguments = "/e,/select," + fileFullName;
System.Diagnostics.Process.Start(psi);
}
private void dataGridView1_CellMouseDown(object sender, DataGridViewCellMouseEventArgs e)
{ }
//删除文件,这里是一个伪删除了,直接把文件移动到deleteData文件夹中,如果需要删除手动删除
private void button3_Click(object sender, EventArgs e)
{
try
{
int count = ;
int totalCount = dataGridView1.RowCount;
string foldPath = textBox1.Text;
string filderPath = @foldPath + "\\DeleteData";
string fileName = "";
if (Directory.Exists(filderPath) == false)
{
//如果不存
Directory.CreateDirectory(filderPath);
}
for (int i = ; i < dataGridView1.RowCount; i++)
{
lbmessage.Text = "正在删除文件:" + dataGridView1.Rows[i].Cells[].Value.ToString();
Application.DoEvents();
count += ;
fileName = dataGridView1.Rows[i].Cells[].Value.ToString();
File.Move(dataGridView1.Rows[i].Cells[].Value.ToString(), filderPath + "\\" + fileName);
}
dataGridView1.Rows.Clear();
lbmessage.Text = "";
MessageBox.Show("删除完毕");
}
catch (Exception err)
{
MessageBox.Show(err.Message);
}
finally {
lbmessage.Text = "";
}
} //清空列表
private void button4_Click(object sender, EventArgs e)
{
dataGridView1.Rows.Clear();
} private void comboBox1_SelectedIndexChanged(object sender, EventArgs e)
{
string extension = comboBox1.Text;
if (!string.IsNullOrEmpty(extension))
{
extension = extension.ToUpper();
switch (extension)
{
case ".HTML":
comboBox2.SelectedIndex = comboBox2.Items.IndexOf("UTF-8");
break;
case ".DOC":
comboBox2.SelectedIndex = comboBox2.Items.IndexOf("Unicode");
break;
default: break;
}
}
} //默认加载
private void formMain_Load(object sender, EventArgs e)
{
//默认是全部搜索模式
comboBox3.SelectedText = "全部";
//从注册表把选择路径读取出来
textBox1.Text = Application.UserAppDataRegistry.GetValue("ZMJASearchPath") as string;
} //双击单元格打开文件所在位置
private void dataGridView1_CellDoubleClick(object sender, DataGridViewCellEventArgs e)
{
try
{
if (e.ColumnIndex < || e.RowIndex < )
{
MessageBox.Show("请选择要打开的文件");
return;
}
int index = dataGridView1.CurrentCell.RowIndex;
System.Diagnostics.ProcessStartInfo psi = new System.Diagnostics.ProcessStartInfo("Explorer.exe");
psi.Arguments = "/e,/select," + dataGridView1.Rows[index].Cells[].Value.ToString();
System.Diagnostics.Process.Start(psi);
}
catch (Exception err)
{
MessageBox.Show(err.Message);
}
}
//右键快捷菜单打开文件所在位置
private void 打开文件所在位置ToolStripMenuItem_Click(object sender, EventArgs e)
{
try
{
if (dataGridView1.CurrentRow == null)
{
MessageBox.Show("请选择要打开的文件");
return;
}
int index = dataGridView1.CurrentCell.RowIndex;
System.Diagnostics.ProcessStartInfo psi = new System.Diagnostics.ProcessStartInfo("Explorer.exe");
psi.Arguments = "/e,/select," + dataGridView1.Rows[index].Cells[].Value.ToString();
System.Diagnostics.Process.Start(psi);
}
catch (Exception err)
{
MessageBox.Show(err.Message);
}
} //双击文本框选择路径
private void textBox1_DoubleClick(object sender, EventArgs e)
{
try
{
FolderBrowserDialog dialog = new FolderBrowserDialog();
dialog.Description = "请选择文件路径";
if (dialog.ShowDialog() == DialogResult.OK)
{
string foldPath = dialog.SelectedPath;
textBox1.Text = foldPath;
//把选择路径存储在注册表
Application.UserAppDataRegistry.SetValue("ZMJASearchPath", foldPath);
}
}
catch (Exception err)
{
MessageBox.Show(err.Message);
}
}
}
}

参考博客园里获取文件编码格式的类

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
using System.Threading.Tasks; namespace Search
{
public class common
{
//编码问题目前为止,基本上没人解决,就连windows的IE的自动识别有时还识别错编码呢
//如果文件有BOM则判断,如果没有就用系统默认编码,缺点:没有BOM的非系统编码文件会显示乱码。
//调用方法: common.GetType(filename)
public static System.Text.Encoding GetType(string FILE_NAME)
{
using (FileStream fs = new FileStream(FILE_NAME, FileMode.Open, FileAccess.Read))
{
System.Text.Encoding r = GetType(fs);
fs.Close();
return r;
}
}
/// <summary>
/// 通过给定的文件流,判断文件的编码类型
/// </summary>
/// <param name="fs">文件流</param>
/// <returns>文件的编码类型</returns>
public static System.Text.Encoding GetType(FileStream fs)
{
byte[] Unicode = new byte[] { 0xFF, 0xFE, 0x41 };
byte[] UnicodeBIG = new byte[] { 0xFE, 0xFF, 0x00 };
byte[] UTF8 = new byte[] { 0xEF, 0xBB, 0xBF }; //带BOM
Encoding reVal = Encoding.Default; BinaryReader r = new BinaryReader(fs, System.Text.Encoding.Default);
int i;
int.TryParse(fs.Length.ToString(), out i);
byte[] ss = r.ReadBytes(i);
if (IsUTF8Bytes(ss) || (ss[] == 0xEF && ss[] == 0xBB && ss[] == 0xBF))
{
reVal = Encoding.UTF8;
}
else if (ss[] == 0xFE && ss[] == 0xFF && ss[] == 0x00)
{
reVal = Encoding.BigEndianUnicode;
}
else if (ss[] == 0xFF && ss[] == 0xFE && ss[] == 0x41)
{
reVal = Encoding.Unicode;
}
r.Close();
return reVal; } /// <summary>
/// 判断是否是不带 BOM 的 UTF8 格式
/// </summary>
/// <param name=“data“></param>
/// <returns></returns>
private static bool IsUTF8Bytes(byte[] data)
{
int charByteCounter = ; //计算当前正分析的字符应还有的字节数
byte curByte; //当前分析的字节.
for (int i = ; i < data.Length; i++)
{
curByte = data[i];
if (charByteCounter == )
{
if (curByte >= 0x80)
{
//判断当前
while (((curByte <<= ) & 0x80) != )
{
charByteCounter++;
}
//标记位首位若为非0 则至少以2个1开始 如:110XXXXX...........1111110X
if (charByteCounter == || charByteCounter > )
{
return false;
}
}
}
else
{
//若是UTF-8 此时第一位必须为1
if ((curByte & 0xC0) != 0x80)
{
return false;
}
charByteCounter--;
}
}
if (charByteCounter > )
{
throw new Exception("非预期的byte格式");
}
return true;
}
}
}

C# winfrom 写的一个搜索助手,可以按照标题和内容搜索,支持doc,xls,ppt,pdf,txt等格式的文件搜索的更多相关文章

  1. 用thinkphp写的一个例子:抓取网站的内容并且保存到本地

    我需要写这么一个例子,到电子课本网下载一本电子书. 电子课本网的电子书,是把书的每一页当成一个图片,然后一本书就是有很多张图片,我需要批量的进行下载图片操作. 下面是代码部分: public func ...

  2. 大神写的一个纯CSS圆角框,膜拜!(支持IE9一下的低版本)

    留着提醒自己,底层才是最重要的,不要一直傻瓜的编程下去! <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN&q ...

  3. linux文件管理 文件搜索

    文件搜索命令find 'find [搜索范围] [搜索条件]' 搜索文件 find / -name install.log #避免大范围搜索,会非常消耗系统资源 #find是在系统当中搜索符合条件的文 ...

  4. linux命令:文件搜索命令

    ---恢复内容开始--- 文件搜索命令:which 命令名称:which 命令所在路径:/usr/bin/which 执行权限:所有用户 语法:which  [命令名称] 功能描述:显示系统命令所在目 ...

  5. 自己写的一个Solr搜索实例,增删改查+高亮+分页

    今天个人coding的模块测试,所以闲暇之余继续研究solr,然后顺带写了一个实例,随便搞的,solr真心不熟,期待认识热爱搜索的朋友,共同进步. 1.配置schema.xml文件[solr\coll ...

  6. 搞了我一下午竟然是web.config少写了一个点

    Safari手机版居然有个这么愚蠢的bug,浪费了我整个下午,使尽浑身解数,国内国外网站搜索解决方案,每一行代码读了又想想了又读如此不知道多少遍,想破脑袋也想不通到底哪里出了问题,结果竟然是web.c ...

  7. 自己在项目中写的一个Jquery插件和Jquery tab 功能

    后台查询结果 PDFSearchResult实体类: [DataContract(Name = "PDFSearchResult")] public class PDFSearch ...

  8. QT写的一个小工具:阿里云MQTT连接参数生成器.

    一.工具介绍. 最近在研究MQTT协议联网的一些问题,现在主流的物联网平台都支持MQTT协议. 在做阿里云平台连接测试的时候,连接参数的生成没有好用的工具, 所以就自己写了一个. 这个工具主要用于阿里 ...

  9. 访问github太慢?我写了一个开源小工具一键变快

    前言 GitHub应该是广大开发者最常去的站点,这里面有大量的优秀项目,是广大开发者寻找资源,交友学习的好地方.尤其是前段时间GitHub公布了一项代码存档计划--Arctic Code Vault, ...

随机推荐

  1. 新手必看,史上最全的iOS开发教程集锦,没有之一!

    最近大火的iPhone XS Max和iPhone XS,不知道有没有同学已经下手了呢?一万三的价位确实让很多人望而却步啊.据说为了赢得中国的用户,专门出了双卡双待的,可想而知中国市场这块“肥肉”人人 ...

  2. Sophus libSophus.so

    在编译包含Sophus的源文件的时候,出现如下错误 ../lib/libmyslam.so: undefined reference to `Sophus::SO3::SO3(double, doub ...

  3. spring学习 八 面向切面编程(AOP)概述

    注:本文大部分参考   --------------------- 本文来自 -望远- 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/yanquan345/artic ...

  4. 22.上传app一些相关问题

    1.截取上传的各个屏幕尺寸 1.按最大尺寸截取,快捷键 command+s 2.在模拟器上截取 3. 截图 iphone4 : 640x960 或者 960x640 phone5    640 x 1 ...

  5. Java 数组拷贝方法 System.arraycopy

    System类提供的数组拷贝方法: public static native void arraycopy(Object src, int srcPos, Object dest, int destP ...

  6. 2018.10.27 loj#6035. 「雅礼集训 2017 Day4」洗衣服(贪心+堆)

    传送门 显然的贪心题啊...考试没调出来10pts滚了妙的一啊 直接分别用堆贪心出洗完第iii件衣服需要的最少时间和晾完第iii件衣服需要的最少时间. 我们设第一个算出来的数组是aaa,第二个是bbb ...

  7. Tomcat架构解析(三)-----Engine、host、context解析以及web应用加载

    上一篇博文介绍了Server的创建,在Server创建完之后,就进入到Engine的创建过程,如下: 一.Engine的创建   1.创建Engine实例 当前次栈顶元素为Service对象,通过Se ...

  8. WM_PAINT和WM_ERASEBKGND消息

    1.OnPaint()函数是窗口重绘消息WM_PAINT的响应函数,当窗口重绘时会产生WM_ERASEBKGND消息和WM_PAINT消息,而且WM_ERASEBKGND会先于WM_PAINT产生,所 ...

  9. vba中变量作用域

      参考:http://club.excelhome.net/thread-1237085-1-1.html 全局变量例子public 变量1 AS IntegerSub LLL()变量1 = 111 ...

  10. Mysql中Left Join Right Join Inner Join where条件的比较

    建立一对多的表 company 和 employee company表 id      name      address 1baidu北京 2huawei深圳 3jingdong北京 4tengxu ...