今天遇到文章标题无论怎么修改,超出二十个汉字不能全部保存,系统只截取前二十个汉字的内容进行保存. 在后台查看系统设置: 系统——其它选项——文档标题最大长度,的值是60,对应的数据库表字段char的长度也是60. 一个汉字占2个字节,按说应该能保存30个汉字才对,搜索后发现以下内容 原因分析:因为UTF-8编码1个中文汉字占用的是3个字节,GBK占用的是2个字节. 对应自己的织梦系统编码为UTF-8,那么60对应的就是20个汉字了. 于是将文档标题最大长度进行修改,如100 数据库dede_ar…
由于工作的需要,研究c#抽取pdf文档标题有3个月了.这项工作是一项"伟大而艰巨"的任务.应该是我目前研究工作中最长的一次.我觉得在长时间忙碌后,应该找些时间,把自己的心路历程归纳整理,倾诉给读者,使自己的心回归,重新回归自然.平静的状态.每一次的研究工作,说实话,都很累,犹如爬山.在到达山顶的那一刹那,也许你很快乐,也许你即将面临征服另一座山,问题是,我们知道自己迟早是要回归大地的.人生不是也是如此吗?我可以肯定地说,我们来源于宇宙,终将归于宇宙,至于我们从宇宙的何处而来,我不知道,…
word文档标题级别批量更改——批量降级与升级实例   word文档标题级别批量更改——批量降级实例 2012年12月21日16:30:44 现有一个3级文档结构的word文档,如下图所示 先需要将上图中的各级标题均降一级,方法如下: 1.先切换到大纲视图 2.选中所有标题 3.点击降级按钮统一降级 主要过程截图见下图 完成后切换回普通视图,可以在文档结构图中看到各级标题均降了一级,如下图所示 小结:此实例是标题的批量降级,其实标题的批量升级也是大同小异,无非是选中所有标题统一升级.至于局部的升…
做一些网站的时候,文档标题会滚动,这个效果是走马灯的效果. <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>走马灯的效果</title> </head> <body> <script> var dir=""; function zouma(){ var tit=document.title…
小明在学习采集,弄了个dedecms作为发布平台,几个小时后跑来报喜说好简单,但又不想制造那么多spam,每个分类只保留几条就好.在后台删除这些文章,每页只显示30个,看了下有100多页,立马沮丧了,数据库批量删除又不会.问我要怎么修改“文档列表”每一页显示的文档条数. 打开这个文件dede/content_list.php(dede是后台目录,一般会改名),找到$dlist->pageSize = 30;将默认的30改为300,以后打开文章列表每页就显示300条了,数字可以自行设置,but设置…
[注意]我们注意到我们的文档的创建的时候我们会发现系统会去调用Doc类中的OnNewDocument函数,这里我们知道他是一个虚函数,我们可以在这里设置我们的文档的标题. 代码如下: BOOL CGraphicwangDoc::OnNewDocument() { if (!CDocument::OnNewDocument()) return FALSE; // TODO: add reinitialization code here // (SDI documents will reuse th…
大家好,又见面啦. 在前一篇文档<JAVA中自定义扩展Swagger的能力,自动生成参数取值含义说明,提升开发效率>中,我们探讨了如何通过自定义注解的方式扩展swagger的能力让Swagger支持自动从指定的枚举类生成接口文档中的字段描述的实现思路. 其实swagger作为一个被广泛使用的在线接口文档辅助工具,上手会用很容易,但想用好却还是需要一定功夫的.所以呢,本篇文档就和大家一起来聊一聊如何用好swagger,让其真正的成为我们项目交付过程中的神兵利器. 更改接口文档总标题与描述 默认的…
前言: 你先得知道HelpPageConfig文件,不知道说明你现在不需要这个,所以下文就不用看了,等知道了再看也不急.当然如果你很知道这个,下文也不用看了,因为你会了. 方法一: new XmlDocumentationProvider(HttpContext.Current.Server.MapPath("~/App_Data/Documentation.xml")) 替换成 new XmlDocumentationProvider("PluginsFolder/*.xm…
问题:PDF2SWF转换只有一页的PDF文档,在FlexPaper不显示! FlexPaper 与 PDF2SWF 结合是解决在线阅读PDF格式文件的问题的,多页的PDF文件转换可以正常显示,只有一页的PDF文件不能显示,我下了FlexPaper.PDF2SWF  N个版本都不行... 解决方法:在执行的命令后面加上“/usr/local/swftools/bin/pdf2swf  -T 9”转换成flash 9 格式即可解决~~ 知识点: SWFTools 是一组用来处理 Flash 的 sw…
首先看看我的项目结构: 从上面的结果图中,我们可以看出,主要用了两个库:itextsharp.dll 和 pdfbox-1.8.9.dll,dll文件夹存放引用的库,handles文件夹存放抽取的处理代码,lib文件夹中,相当于数据库中的DBHelp类的作用.model文件夹就不用介绍了,大家都知道. 我们从大的逻辑开始介绍,TitleHandle类中有一个方法: 从此方法可以看出,它接收两个参数:block和isTrainModel,返回 HandleResult类型. 我们先来看看Block…
前言:记录下写代码中遇到的小问题,帮同事写一个批量更新文档库标题字段的小程序,本来以为就Update一下就可以了,10分钟可以搞定.结果10分钟过去了,代码写好了,执行起来不报错,调试也没问题,只是要更新的东西没更新.然后问了下,文档库开启了签入签出(不判断会报错)和版本控制,找到问题所在了,Update是不行的. 1.废话不多说,上图和代码. SPFile file = listitemcoll[j].File; file.CheckOut(); file.Update(); file.Ite…
上一篇介绍了整体流程以及利用库读取pdf内容形成字符集合.这篇着重介绍下,过滤规则,毕竟我们是使用规则过滤,最后得到标题的. 首先看归一化处理,什么是归一化呢?就是使结果始终处于0-1之间(包括0,1). private static double GetMark(BlockInfo block, double maxHeight, double maxWidth, double maxYSize, double maxXSize, double maxSpace) { ; ) result +…
public class IETitle { public static List<WordInfo> WordsInfo = new List<WordInfo>(); private static string pdfcontent; public static HandleResult GetTitle(string path, string realtitle) { WordsInfo.Clear(); string content = string.Empty; try…
此项目是解决officeOnline文档预览只能用域名提交的限制 http://officeOnline文档预览域名或IP/op/generate.aspx // 微软原生页面 创建链接后会生成全屏预览和嵌入预览两种方式 全屏预览:http://1.1.1.204/op/view.aspx?src=文档http域名方式 嵌入预览:http://1.1.1.204/op/embed.aspx?src=文档http域名方式 举例: www.zmoli775.com 域名A记录解析地址为 161.13…
为了理解MongoDB的名词,可以将其于关系型数据库进行对比: 一.文档 概述 文档是MongoDB的核心概念,是数据的基本单元,非常类似于关系数据库中的行.在MongoDB中,文档表示为键值对的一个有序集.MongoDB使用Javascript shell,文档的表示一般使用Javascript里面的对象的样式来标记,如下: {"title":"hello!"} {"title":"hello!","recomme…
讲述了如何通过iis的webdav支持实现客户端的office直接编辑服务器上的文件,本篇将讲解如何实现客户端的office直接编辑数据库中的二进制形式保存的office文件. 实现的关键:模拟IIS,自己实现一个webdav的服务器端. 首先,我们简单了解一下webdav:webdav,中文可以翻译为网络分布式协作协议,它解决了http协议中一个问题:http无法实现版本和单访问控制.什么是单访问控制呢?假设我们有一个页面编辑某条数据,这个页面可以同时被多个用户使用,那么最终的数据是最后一个用…
Xpage大纲: 解析: 1.通过[link2]点击触发jQuery事件来展开[面板:thispanel] 2.[面板:thispanel]写了onClientLoad事件:让thispanel隐藏. 3.[面板:thispanel]添加数据:domino文档.缺省操作:打开文档.文档表示符:getUniversalID(); 4.[富文本:inputRichText1]只需要进行简单的数据绑定即可.数据源:document1   绑定到:Body 总结: 1.repeat控件总结: Value…
在文档集界面中显示Word文档,是文档大师的一个核心功能. 最近在 Win10 升级到最新版后,发现 无法正常显示Office 文档的问题. 一开始以为是Word版本问题,从2007升级到2016,问题仍没解决. 用关键字“ie11 word 显示不全”搜索,看了几个搜索结果,找到了答案:"关闭IE11". 操作: 1. Win10 控制面板,在卸载软件界面左边栏有“打开和关闭win功能”,打开后将IE前面的对勾去掉 2.重启机器后,打开文档大师,显示正常了. 当然,问题的本质是Win…
我的一位同事告诉我,pdf抽取标题,用机器学习可以完美解决问题,抽取的准确率比较高.于是,我看了一些资料,就动起手来,实践了下. 我主要是根据以往历史块的特征生成一个决策树,然后利用这棵决策树,去判断一个新的块到底是不是标题.理论上,历史块的数量越庞大,那么结果越准确.其实经过实践不是这样的,我觉得影响结果判断的因素越少,而且库的数量达到一定数量后,判断越准确.这个记录块信息的历史库,就是供计算机学习的原料. 首先看下,如何形成一个决策树? private static DecisionTree…
加上 <script src="{dede:field name='phpurl'/}/count.php?view=yes&aid={dede:field name='id'/}&mid={dede:field name='mid'/}" type='text/javascript' language="javascript"></script> 即可…
1 先在后台管理: 2 在数据库修改表dede_archives: ALTER TABLE `dede_archives` CHANGE `title` `title` VARCHAR( 250 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL DEFAULT '';…
为了更好的保护PDF文件,可以将其转换为图片的格式,再重新排版编辑. 使用压缩率更高的JPEG 2000图片格式更佳. ------------------------------------------------------------------------------------- 安装好福昕阅读器后,在PowerPoint.Excel.Word的菜单栏都会出现下列的选项,直接点击创建PDF即可. 打开 Word--视图--导航窗格,然后按照标题级别进行排列,左侧导航栏便会自动生成文档结…
界面 //所有的数据全部在集合中             //dgv控件绑定List集合,List集合中有User类的对象,对象里有属性,把属性绑定到没列的数据上             dgv.DataSource = list;//绑定数据 姓名,密码,性别,年龄列的DataPropertyName分别对应List集合中对象的Name,Password,Gender,Age属性 后台代码 using System; using System.Collections.Generic; usin…
在进入轮播图管理页面时,要把轮播图显示在页面上,所以后台要向前台返回: 图片路由,:image_url 优先级: priority def get(self, request): # priority = models.Banner.PRI_CHOICEH # priority = tuple([models.Banner.PRI_CHOICEH]) # 优先级 以字典形式返回 OrderedDict 将元祖 转为有序的字典, priority = OrderedDict(models.Bann…
HTML文件是什么? q  HTML表示超文本标记语言(Hyper Text Markup Language). q  HTML文件是一个包含标记的文本文件. q  这些标记保速浏览器怎样显示这个页面. q  HTML文件必须有htm或者html扩展名. q  HTML文件可以用一个简单的文本编辑器创建. 想不想尝试一下? 假如你运行的是windows系统,打开记事本,在其中输入以下文本: <html> <head>    <title>Title of page<…
最近有一个项目需要将一个word文档中的数据提取到数据库中.就去网上查了好多资料,最靠谱的就是用poi实现word文档的提取. 喝水不忘挖井人,我查了好多资料就这个最靠谱,我的这篇博客主要是借鉴https://blog.csdn.net/qq_16601953/article/details/82415518 现在讲一下思路: 1.首先我们要用poi将word中的数据提取出来,我把提取的数据存到字符数组中, 2.然后通过sql数据将字符串数组中的数据存到mysql数据库中 当然需要jar包依赖…
我们在建站时有的时候发现之前的文章有错误了,要进行修改,但又不知道文章名,只知道大概的文章id,那么可以搜索到DedeCms后台文章列表文档id吗?或者快速定位文章id方便修改? 第一种方法:复制下面的链接地址,直接修改文章id(aid=1183这个数字),就进入文章编辑页面了 http://www.*.com/dede/archives_do.php?aid=1183&dopost=editArchives 第二种方法:后台那边添加搜索文档id功能,打开文件/dede/content_list…
程序主窗口标题栏的一般形式为: 文档标题—主窗口标题 1.修改文档标题 修改CExamDoc::onNewDocument()函数为: BOOL CExamDoc::OnNewDocument() { if(!CDocument::OnNewDocument()) return FALSE; SetTitle("文档标题"); return TRUE; } 2.修改主窗口标题 修改CMainFrame的成员函数PreCreateWindowO为: BOOL CMainFrame::Pr…
一:描述,将读取的文档标题添加到下拉框中 二:代码 #region 方法:得到Word文档标题的内容 public static List<string> GetTitles(int j,int m)//标题深度,标题字符个数选取标准 { List<string> title = new List<string>(); ; i <= j; i++)//标题深度 { Microsoft.Office.Interop.Word.Application app = ne…
问题:在使用dedecms的文档关键词替换功能时,会造成交叉替换 如: 长尾关键词1:男人喝金丝皇菊有什么好处? 长尾关键词2:喝金丝皇菊有什么好处? 主关键词3:金丝皇菊 使用系统默认的功能时,在替换主关键词的时候,会将上面已经替换好的长尾关键词中的“金丝皇菊”也替换掉,从而破坏了原有的长尾关键词锚文本. 最终效果可以看下八岩茶业官网的内页文章: 金丝皇菊_福鼎白茶_普洱茶:http://www.bayantea.cn 解决思路: 1.先将要替换的关键词替换成类似: 关键词1:'#####0#…