从2021强网杯的一道题学习docx文件操作
[强网先锋]寻宝
啊对就是这道题,大佬们都贼快,菜如我还得慢慢整
key1
大佬们都一笔带过,哎,虽然简单,但是也别这么虐我们啊
我来简单写一下吧
<?php
header('Content-type:text/html;charset=utf-8');
error_reporting(0);
highlight_file(__file__); function filter($string){
$filter_word = array('php','flag','index','KeY1lhv','source','key','eval','echo','\$','\(','\.','num','html','\/','\,','\'','0000000');
$filter_phrase= '/'.implode('|',$filter_word).'/';
return preg_replace($filter_phrase,'',$string);
} if($ppp){
unset($ppp);
}
$ppp['number1'] = "1";
$ppp['number2'] = "1";
$ppp['nunber3'] = "1";
$ppp['number4'] = '1';
$ppp['number5'] = '1'; extract($_POST); $num1 = filter($ppp['number1']);
$num2 = filter($ppp['number2']);
$num3 = filter($ppp['number3']);
$num4 = filter($ppp['number4']);
$num5 = filter($ppp['number5']); if(isset($num1) && is_numeric($num1)){
die("非数字");
} else{ if($num1 > 1024){
echo "第一层";
if(isset($num2) && strlen($num2) <= 4 && intval($num2 + 1) > 500000){
echo "第二层";
if(isset($num3) && '4bf21cd' === substr(md5($num3),0,7)){
echo "第三层";
if(!($num4 < 0)&&($num4 == 0)&&($num4 <= 0)&&(strlen($num4) > 6)&&(strlen($num4) < 8)&&isset($num4) ){
echo "第四层";
if(!isset($num5)||(strlen($num5)==0)) die("no");
$b=json_decode(@$num5);
if($y = $b === NULL){
echo 'NULL';
if($y === true){
echo "第五层";
include 'KeY1lhv.php';
echo $KEY1;
}
}else{
die("no4");
}
}else{
die("no3");
}
}else{
die("no2");
}
}else{
die("no1");
}
}else{
die("no111");
}
}
先说下这个东西 extract($_POST);
就是按post的值分配成key=》value的格式传参,然后这里就按照数组格式传就行
num1:php弱比较,num1=2048e,就绕过了
num2:科学计数法可绕过,num2=9e9,注意strlen()是计算‘\x00’的,所以只能传三个字符
num3:md5爆破,脚本如下
import hashlib
for i in range(1,1000000000):
a=hashlib.md5(str(i).encode('utf-8')).hexdigest()
if a[:7]=='4bf21cd':
print(i)
print(a)
break
#61823470
#4bf21cdcfb6ec2d30bad53d41ebe42f2
num4:6个字符就是7的长度,弱比较,0e1234
num5: (对,就是一个空格)
key2
这里之前没拿python处理过docx,所以也是现学了一下,基本上有三种方法
第一种:下一个带搜索文件内容的高级搜索器
第二种:python教底层的一种,利用xml处理
import xml.etree.ElementTree as ET
import zipfile,glob,tqdm
def xml_handle(path):
WORD_NAMESPACE ='{http://schemas.openxmlformats.org/wordprocessingml/2006/main}'
TEXT = WORD_NAMESPACE + 't'
word = zipfile.ZipFile(path)
#print(word)
xml_name = word.read('word/document.xml')
#print(xml_name)
#tree=ET.parse(xml_name) # 从文件
root = ET.fromstring(xml_name) # Element
#print(root)
for child in root.iter(TEXT):
if('KEY2' in child.text):
print(child.text)
print(path)
return True
files=glob.glob('E:\\桌面\\比赛题目\\2021强网杯\\key2\\*\\*\\*.docx')
for doc in tqdm.tqdm(files):
a=xml_handle(doc)
if(a):
break
#秒出
这里问题蛮多的,python3.9以后和以前是不一样的,cElementTree在3.9以后被弃用了,但ElementTree会自己去调,所以没啥区别了,还要就是getiterator()函数变成了iter()
优点:速度极快,可处理其它xml类型
缺点:编写不方便,对docx支持一般
第三种:利用docx模块处理
# pip install python-docx
import docx,glob,tqdm def docx_handle(path):
document = docx.Document(path)
#print(document)
for line in document.paragraphs:
#print(line.text)
if('KEY2' in line.text):
print(line.text)
print(path)
return True files=glob.glob('E:\\桌面\\比赛题目\\2021强网杯\\key2\\*\\*\\*.docx')
for doc in tqdm.tqdm(files):
a=docx_handle(doc)
if(a):
break
# 14s
这个库安装时候有点坑,如果那你是python3,需要输入pip install python-docx。原本的项目已经被官方吸纳进xml库中了(但是作者你倒是把新项目地址挂出来啊,害得我找半天fuck!!!)
优点:编写简单
缺点:速度慢如老狗(3600个文件,到1200个出key,三分之一用了14s,真是垃圾)
ps:学习了大佬的wp后发现tqdm这个库真香啊,可以看循环进度了美滋滋。配合glob直接形成匹配的字典,tql,以后获取文件名啥的都去shi吧哈哈哈!!!
从2021强网杯的一道题学习docx文件操作的更多相关文章
- HTML5学习之文件操作(九)
之前我们操作本地文件都是使用flash.silverlight或者第三方的activeX插件等技术,由于使用了这些技术后就很进行跨平台的处理,另外就是让我们的web应用依赖了第三方的插件,而不是很独立 ...
- python学习笔记:文件操作和集合(转)
转自:http://www.nnzhp.cn/article/16/ 这篇博客来说一下python对文件的操作. 对文件的操作分三步: 1.打开文件获取文件的句柄,句柄就理解为这个文件 2.通过文件句 ...
- python学习总结---文件操作
# 文件操作 ### 目录管理(os) - 示例 ```python # 执行系统命令 # 清屏 # os.system('cls') # 调出计算器 # os.system('calc') # 查看 ...
- Tcl学习之--文件操作
Tcl中文件名称操作遵循Unix/Linux的命名规范. x/y/z表示x文件夹下的y 子文件夹及y以下的子文件夹z. ~admin/email则表示admin用户的email目录. l file ...
- Linux学习之文件操作
Linux,一起学习进步- mkdir The mkdir command is used to create directories.It works like this: mkdir命令是用 ...
- erlang学习笔记(文件操作)
参考这里和这里了解到的文件操作的模块有很多:kernel下有:file,stdlib下有:filelib,filename,file_sorter.(具体查看官方文档)
- Python学习笔记——文件操作
python中,一切皆对象. 一.文件操作流程 (1)打开文件,得到一个文件句柄(对象),赋给一个对象: (2)通过文件句柄对文件进行操作: (3)关闭文件. 文件对象f通过open()函数来创建 ...
- Smart210学习记录-------文件操作
一.linux文件操作(只能在linux系统上用) 创建:int creat(const char* filename, mode_t mode) filename 表示要创建的文件名,mode表示对 ...
- NodeJS学习之文件操作
NodeJS -- 文件操作 Buffer(数据块) JS语言自身只有字符串数据类型,没有二进制数据类型,因此NodeJS提供了一个与String对等的全局构造函数Buffer来提供对二进制数据的操作 ...
随机推荐
- GO语言的JSON03---JSON文件的序列化与反序列化
package main import ( "encoding/json" "fmt" "os" ) type Human2 struct ...
- 重新整理 .net core 实践篇—————3种配置验证[十四]
前言 简单整理一些配置的验证. 正文 配置的验证大概分为3类: 直接注册验证函数 实现IValidteOptions 使用Microsoft.Extensions.Options.DataAnnota ...
- 使用CUDA Warp-Level级原语
使用CUDA Warp-Level级原语 NVIDIA GPU以SIMT(单指令,多线程)的方式执行称为warps 的线程组.许多CUDA程序通过利用warp执行来实现高性能.本文将展示如何使用cud ...
- .Net RabbitMQ实战指南——进阶(一)
备份交换器 备份交换器,英文名称为Alternate Exchange,简称AE.通过在声明交换器(调用channel.ExchangeDeclare方法)时添加alternate-exchange参 ...
- MySQL必知必会复习笔记(1)
MySQL必知必会笔记(一) MySQL必知必会是一本很优秀的MySQL教程书,并且相当精简,在日常中甚至能当成一本工作手册来查看.本系列笔记记录的是:1.自己记得不够牢的代码:2.自己觉得很重要的代 ...
- selenium css定位元素
CSS 选择器: 常见符号: #表示 id选择器 .表示 class选择器 >表示子元素,层级 一个空格也表示子元素,但是是所有的后代子元素,相当于 xpath 中的相对路径 一.css:属性定 ...
- RobotFramework常用断言关键字
变量或者关键字内容判断关键字 1.内容包含或者不包含:should contain . should not contain 与should contain x times *** Test Case ...
- HTML基本标签及语法
HTML简介 什么是HTML 本文素材来源于黑马程序员Pink老师 HTML 指的是超文本标记语言(Hyper Text Markup Language) ,它是用来描述网页的一种语言. HTML 不 ...
- noip2015 总结
神奇的幻方 题目描述 幻方是一种很神奇的N*N矩阵:它由数字1,2,3,--,N构成,且每行.每列及两条对角线上的数字之和都相同. 当N为奇数时,我们可以通过以下方法构建一个幻方:首先将1写在第一行的 ...
- 小白学k8s(8)-Bazel部署go应用
Bazel使用了解 Bazel产生的背景 什么是Bazel 快(Fast) 可伸缩(scalable) 跨语言(multi-language) 可扩展(extensible) Bazel中的主要文件 ...