翻看各大插件,都不约而同地出现系列文本处理的功能,自己在使用Excel过程中,在临时性的需求时,也会用上这几种文本处理,但仅适用于小范围的使用,使用这些功能不是数据处理的正确的之道,数据处理的核心需求是:不破坏原有数据的情况下,通过逻辑关系处理,生成符合分析需要的目标数据。文本处理系列功能将有违此原则。。另外提供高阶用户的文本处理最爱的正则表达式处理方法,相信此系列功能将老少咸宜,各取所需。

文章出处说明

原文在简书上发表,再同步到Excel催化剂微信公众号或其他平台上,文章后续有修改和更新将在简书上操作, 其他平台不作同步修改更新,因此建议阅读其他出处的文章时,尽可能跳转回简书平台上查看。

此篇提及的功能,其实有违数据处理的原则,尽可能地少范围使用,可能性能也有瓶颈。Excel催化剂的系列功能没有相应的撤销功能,没有后悔药可吃,使用前请记得对文档进行保存。

更新与修复

  • 20181017
    修复了文本处理中选择整列或整行数据时会遍历所有单元格的问题,改为仅对选择区域与已用区域的交集部分起作用。
    增加一个尾负转前负的小功能,应对SAP系统的负数数值负号在尾巴的情形。
    具体参考链接:https://www.jianshu.com/p/b1f63fe4c2a6

文本处理功能总览

文本处理的几大快捷操作,小白适用

转换组

文本转数值、数值转文本,不详细解释了,有Excel数据结构基础的都好理解。

因Excel本质是3大类型数据结构:文本、数值、和其他错误、逻辑值等。其中特殊点在于数字可以表示为数值和文本还种,文本型数字不能进行计算汇总,需转换为数值,而身份证类的数字,最好保存为文本,防止15位数据有效性原因丢失数据精度。

显示转文本

有时对数值进行了数字格式的设置,使原本的数字在显示层面表现不同,若想重新存储显示层面的数据,可用显示转文本实现。

数字格式影响数据显示

用显示转文本后的效果

插入组

前面插入、后面插入也好理解,不细说。

中间插入

特意做了个示例效果,花了不少功夫,如果不记得可查看示例效果的展示,为了小白们,我也是拼了!
同时有从右边数起第几位,算是个小特色。

中间插入操作,有示例指引

插入后效果

清除和正则提取清除等

文本清除

有按内容类型清除和文本位置清除两种,同样花大力气做了动态示例演示清除的效果。

快速清除,针对特定类型的文本进行清除

清除中文后效果

一般建议用一下清除【非可见字符】就差不多,其他的数据,建议用自定义函数来提取出来或清除,Excel催化剂有一整套非常好用的正则自定义函数,值得你投入时间学习正则的知识。

另外的位置清除,杀伤力较小,也较可控,对规则数据清除效果也不错。

按位置清除,同样可分从左还是从右数起

快速清除和位置清除是互斥关系,一次仅能处理其中一类。具体看示例中演示的作用效果。

正则匹配与替换

在字符串处理的世界中,没有比正则表达式处理更合适的了,若想从各种奇葩的文本字符串中找寻想要的信息,最好还是静下心来,学习掌握下正则表达式.
Excel催化剂已经把它实现在自定义函数和界面操作上,学习完知识,就算没有编程技术一样可以使用起来,投资回报率极高。

正则匹配与替换界面
左侧正则表达式匹配Pattern记录表

方便对曾经使用过,或收集回来有复用价值的Pattern匹配字符进行记录,方便再次调出使用。可以写上自己理解的标识描述文本。填写完内容按回车即可保存。
若需调用,双击Pattern内容的对应的行单元格位置,即可自动把内容存到右则的【正则Pattern参数】区。

正则表达式Options设置

此处的Options,用于辅助Pattern内容的设置,如提取英文时,是否忽略大小写,如果勾上,就可以在[a-z]这样的表达式上,无论大小写都进行匹配,具体可百度学习下细节。

匹配区域选择

因文本处理为破坏性操作,正则也很难一次性保证书写正确,可先用【匹配区域选择】,查看下写的Pattern和Options配置,是否和预期想要匹配的相符,对应到相关的单元格上被选择出来。

保留匹配字符

此处为正则匹配到的内容,重写到单元格内覆盖原内容,并且匹配只会对首次匹配到的内容进行重写,例如:

内容为:中国人真是牛B,能在中国活着就是牛。匹配Pattern为:[\u4e00-\u9fa5]+

只会匹配到【中国人真是牛】,被B隔开的第2组【能在中国活着就是牛】不匹配。
最终重写到单元格中也只有【中国人真是牛】,想更灵活地匹配,建议使用Excel催化剂的正则自定义函数实现。

替换匹配字符

此处为把匹配到的文本,替换为【正则替换参数】,若留空将进行删除操作,替换为空字符就是删除了原匹配到的内容。
替换功能会把所有匹配到的内容组都进行替换,和上面保留匹配字符的仅取首次匹配到的内容不同。如上例中,匹配中文,替换为空,将只剩下【B】字。

正则查询

右侧任务窗格展示保存过的Pattern字符

此为快捷操作调出任务窗格显示Pattern字符串列表,可用于自定义函数编写时调用。
只需鼠标双击Pattern内容列的对应行位置,即可把内容保存到剪切板内,写正则自定义函数时可粘贴出来使用。

鼠标左键双击箭头位置即可复制

系列文章

一文带你全面认识Excel催化剂系列功能
安装过程详解及安装失败解决方法
第1波-工作表导航
第2波-数字格式设置
第3波-与PowerbiDesktop互通互联
第4波-一大波自定义函数高级应用,重新定义Excel函数的学习和使用方法
第5波-使用DAX查询从PowerbiDeskTop中获取数据源
第6波-导出PowerbiDesktop模型数据字典
第7波-智能选区功能
第8波-快速可视化数据
第9波-数据透视表自动设置
第10波-快速排列工作表图形对象
第11波-快速批量插入图片
第12波-快速生成、读取、导出条形码二维码
第13波-一键生成自由报表
第14波-一键生成零售购物篮分析
第15波-接入AI人工智能NLP自然语言处理
第16波-N多使用场景的多维表转一维表
第17波-批量文件改名、下载、文件夹创建等
第18波-在Excel上也能玩上词云图
第19波-Excel与Sqlserver零门槛交互-查询篇
第20波-Excel与Sqlserver零门槛交互-数据上传篇
第21波-Excel与Sqlserver零门槛交互-执行SQL
第22波-Excel文件类型、密码批量修改,补齐Power短板
第23波-非同一般地批量拆分工作表
第24波-批量发送邮件并指点不同附件不同变量

关于Excel催化剂

Excel催化剂先是一微信公众号的名称,后来顺其名称,正式推出了Excel插件,插件将持续性地更新,更新的周期视本人的时间而定争取一周能够上线一个大功能模块。Excel催化剂插件承诺个人用户永久性免费使用!

Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!

Excel催化剂插件下载链接:https://pan.baidu.com/s/1gC6joqGY_SIg_yONga9PaQ

因插件使用VSTO开发技术完成,插件的安装需要电脑满足相关的环境配置才能运行,且需可连接外网的方式实现自动更新机制,若下载安装过程中有任何疑问或需要离线版安装等,尽量不单独私聊询问,加QQ群可高效解决(群内已汇集了VSTO开发、Powerbi技术、Sqlserver商业智能等方面的国内顶尖大牛人物,进群的好处不用多说了)

Excel催化剂插件交流群群二维码

联系作者.png

公众号.png

取名催化剂,因Excel本身的强大,并非所有人能够立马享受到,大部分人还是在被Excel软件所虐的阶段,就是头脑里很清晰想达到的效果,而且高手们也已经实现出来,就是自己怎么弄都弄不出来,或者更糟的是还不知道Excel能够做什么而停留在不断地重复、机械、手工地在做着数据,耗费着无数的青春年华岁月。所以催生了是否可以作为一种媒介,让广大的Excel用户们可以瞬间点燃Excel的爆点,无需苦苦地挣扎地没日没夜的技巧学习、高级复杂函数的烧脑,最终走向了从入门到放弃的道路。

最后Excel功能强大,其实还需树立一个观点,不是所有事情都要交给Excel去完成,也不是所有事情Excel都是十分胜任的,外面的世界仍然是一个广阔的世界,Excel只是其中一枚耀眼的明星,还有其他更多同样精彩强大的技术、工具等。*Excel催化剂也将借力这些其他技术,让Excel能够发挥更强大的爆发!

关于Excel催化剂作者

姓名:李伟坚,从事数据分析工作多年(BI方向),一名同样在路上的学习者。
服务过行业:零售特别是鞋服类的零售行业,电商(淘宝、天猫、京东、唯品会)

技术路线从一名普通用户,通过Excel软件的学习,从此走向数据世界,非科班IT专业人士。
历经重重难关,终于在数据的道路上达到技术平原期,学习众多的知识不再太吃力,同时也形成了自己的一套数据解决方案(数据采集、数据加工清洗、数据多维建模、数据报表展示等)。

擅长技术领域:Excel等Office家族软件、VBA&VSTO的二次开发、Sqlserver数据库技术、Sqlserver的商业智能BI技术、Powerbi技术、云服务器布署技术等等。

2018年开始职业生涯作了重大调整,从原来的正职工作,转为自由职业者,暂无固定收入,暂对前面道路不太明朗,苦重新回到正职工作,对Excel催化剂的运营和开发必定受到很大的影响(正职工作时间内不可能维护也不可能随便把工作时间内的成果公布于外,工作外的时间也十分有限,因已而立之年,家庭责任重大)。

和广大拥护者一同期盼:Excel催化剂一直能运行下去,我所惠及的群体们能够给予支持(多留言鼓励下、转发下朋友圈推荐、小额打赏下和最重点的可以和所在公司及同行推荐推荐,让我的技术可以在贵司发挥价值,实现双赢(初步设想可以数据顾问的方式或一些小型项目开发的方式合作)。)

个人永久性免费-Excel催化剂功能第25波-小白适用的文本处理功能的更多相关文章

  1. 个人永久性免费-Excel催化剂功能第105波-批量调整不规范的图形对象到单一单元格内存储

    在日常制表过程中,一个不得不面对的问题,许多的工作起点是基于其他人加工过的表格,无论自己多大的本领,面对不规范的其他人的制作的表格,经过自己的手,该擦的屁股还是要自己去亲手去擦,而带出来的也只会是一堆 ...

  2. 个人永久性免费-Excel催化剂功能第104波-批量选择多种类型的图形对象

    在Excel的日常操作过程中,选择绝对是一个高频的操作,之前开发过一些快速选择单元格区域的辅助功能,除了单元格区域,Excel强大之处在于,类似PhotoShop那般可以存放多种图形,并且有图层先后顺 ...

  3. 个人永久性免费-Excel催化剂功能第102波-批量上传本地图片至网络图床(外网可访问)

    自我突破,在100+功能后,再做有质量的功能,非常不易,相对录制视频这些轻松活,还是按捺不住去写代码,此功能虽小,但功课也做了不少,希望对真正有需要的群体带来一些惊喜. 背景介绍 图床的使用,一般是写 ...

  4. 个人永久性免费-Excel催化剂功能第103波-批量打开多文件或多链接

    有时简单的东西,却带来许多的便利,为了让大家可以记住并容易找寻到此功能,也将这么简单的功能归为一波,反正已经100+波了,也无需为了凑功能文章而故意罗列一些小功能带忽悠性地让人觉得很强大. 使用场景 ...

  5. 个人永久性免费-Excel催化剂功能第101波-批量替换功能(增加正则及高性能替换能力)

    数据处理无小事,正如没有人活在真空理想环境一下,在数据分析过程中,也没有那么真空理想化的数据源可以使用,数据处理占据数据分析的80%的时间,每一个小小的改善,获益都良多.Excel查找替换,有其局限性 ...

  6. 个人永久性免费-Excel催化剂功能第99波-手机号码归属地批量查询

    高潮过往趋于平静,送上简单的手机号码归属地查询,因接口有数量限制,仅能满足少量数据需求,如有大规模数据却又想免费获得,这就成为无解了,数据有价,且用且珍惜. 业务使用场景 除了日常自带的手机各种管家为 ...

  7. 个人永久性免费-Excel催化剂功能第100波-透视多行数据为多列数据结构

    在数据处理过程中,大量的非预期格式结构需要作转换,有大家熟知的多维转一维(准确来说应该是交叉表结构的数据转二维表标准数据表结构),也同样有一些需要透视操作的数据源,此篇同样提供更便捷的方法实现此类数据 ...

  8. 个人永久性免费-Excel催化剂功能第98波-零代码零距离轻松接触并拥有金融大数据

    数据产生价值的一个最突出的领域-金融领域,股票.证券.上市公司财务报表等,多少人在其中发掘出宝贵的数据价值.今天Excel催化剂联合Tushare金融大数据平台,让这一切的数据都能成为你我普通人零代码 ...

  9. 个人永久性免费-Excel催化剂功能第97波-快递单号批量查询物流信息

    电商时代,快递已进千万家,做电商零售行业的,快递信息的再挖掘,也显得更有意义,是数据精细化运营中必不可少的一环.一般站在系统的角度,数据用于业务流转的增删改查使用,而对于分析需求来说,这些业务系统里集 ...

随机推荐

  1. DBShop 电子商务网店系统

    DBShop 电子商务网店系统,采用业界知名框架 ZendFramework 2 开发而成. 下面为功能简介 1.在线更新:在线系统更新和在线模板安装与更新,简单.方便.快捷,省却了手动更新的繁琐步骤 ...

  2. 跨进程访问VCL的一个用例(Delphi6、TurboDelphi测试通过)

    Controls.pas单元中有一个FindControl函数,通过句柄获得对应的TWinControl对象. function FindControl(Handle: HWnd): TWinCont ...

  3. 浅谈stylus与sass的对比

    all we konw , 这两个都是css的预编译工具,但虽然都是编译工具,但还是存在差别的,下面来讲讲其中的区别 1.变量 sass定义变量是以这种形式进行定义的$xxx:10;而stylus的定 ...

  4. delphi hook alt+F4 ctrl+delete+alt win键等

    unit uHook; interface uses  Windows, Messages, SysUtils, Variants, Classes, Controls, Forms, Dialogs ...

  5. java8计算时间差

    示例1:计算指定时间单位的时间差 import java.time.Instant;import java.time.LocalDateTime;import java.time.temporal.C ...

  6. 阿里云ssl证书NGINX配置https,wss

    server { listen 443; server_name server.sentiger.com; ssl on; root /home/wwwroot/Service/beta/public ...

  7. Java学习笔记——Linux下安装配置tomcat

    朝辞白帝彩云间,千里江陵一日还. 两岸猿声啼不住,轻舟已过万重山. ——早发白帝城 首先需要安装配置JDK,这里简单回顾下.Linux下用root身份在/opt/文件夹下创建jvm文件夹,然后使用ta ...

  8. python算法与数据结构-数据结构中常用树的介绍(45)

    一.树的定义 树是一种非线性的数据结构,是由n(n >=0)个结点组成的有限集合.如果n==0,树为空树.如果n>0,树有一个特定的结点,根结点根结点只有直接后继,没有直接前驱.除根结点以 ...

  9. Linux使用socks代理

    安装一些依赖 yum install epel-release yum install python-pip python-devel gcc gcc-c++ cmake git 安装shadowso ...

  10. 通过CDN引入jQuery的几种方式

    百度 CDN <head> <script src="https://apps.bdimg.com/libs/jquery/2.1.4/jquery.min.js" ...