首页
Python
Java
IOS
Andorid
NodeJS
JavaScript
HTML5
【
【搜索引擎Jediael开发笔记】v0.1完整代码
】的更多相关文章
【搜索引擎Jediael开发笔记1】搜索引擎初步介绍及网络爬虫
详细可参考 (1)书箱:<这就是搜索引擎><自己动手写网络爬虫><解密搜索引擎打桩实践> (2)[搜索引擎基础知识1]搜索引擎的技术架构 (3)[搜索引擎基础知识2]网络爬虫的介绍 (一)搜索引擎的开发一般可分为以下三大部分 1.数据采集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi 2.数据分析处理层:将从互联网上获取到的数据进行提取归类.分词.语义分析得出索引得内容,等待用户查询使用,重要的开源项目有Lucene 3.视图层:也用户的交互界面,如…
【搜索引擎Jediael开发笔记】v0.1完整代码
详细代码请见 E:\Project\[重要]归档代码\SearchEngine归档代码 或 https://code.csdn.net/jediael_lu/jediael/tree/10991c839c51d32f825708b09451b2618a20ee94 或 http://download.csdn.net/detail/jediael_lu/7402827 本版本完成以下功能: (1)创建用于保存种子URL的配置文件及其数据结构 (2)创建用于保存Todo信息(未下载URL)的数据结…
【搜索引擎Jediael开发笔记】v0.1完整代码 2014-05-26 15:17 463人阅读 评论(0) 收藏
详细代码请见 E:\Project\[重要]归档代码\SearchEngine归档代码 或 https://code.csdn.net/jediael_lu/jediael/tree/10991c839c51d32f825708b09451b2618a20ee94 或 http://download.csdn.net/detail/jediael_lu/7402827 本版本完成以下功能: (1)创建用于保存种子URL的配置文件及其数据结构 (2)创建用于保存Todo信息(未下载URL)…
【搜索引擎Jediael开发笔记】V0.1完整代码 2014-05-26 15:16 443人阅读 评论(0) 收藏
详细代码请见 E:\Project\[重要]归档代码\SearchEngine归档代码 或 https://code.csdn.net/jediael_lu/jediael/tree/10991c839c51d32f825708b09451b2618a20ee94 或 http://download.csdn.net/detail/jediael_lu/7402827 本版本完成以下功能: (1)创建用于保存种子URL的配置文件及其数据结构 (2)创建用于保存Todo信息(未下载URL)…
【搜索引擎Jediael开发笔记3】使用HtmlParser提取网页中的链接
关于HtmpParser的基本内容请见 HtmlParser基础教程 本文示例用于提取HTML文件中的链接 package org.ljh.search.html; import java.util.HashSet; import java.util.Set; import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.filte…
【搜索引擎Jediael开发笔记2】使用HttpClient下载网页至本地文件
本文使用HttpClient根据url进行网页下载.其中 (1)HttpClient的相关知识请参见HttpClient基础教程 (2) package org.ljh.search.downloadpage; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStream; import java.io.PrintWriter; import java.io.Writer;…
【搜索引擎Jediael开发4】V0.01完整代码
截止目前,已完成如下功能: 1.指定某个地址,使用HttpClient下载该网页至本地文件 2.使用HtmlParser解释第1步下载的网页,抽取其中包含的链接信息 3.下载第2步的所有链接指向的网页至本地文件 下一步需要完成的功能: 1.创建用于保存种子URL的配置文件及其数据结构 2.创建用于保存Todo信息(未下载URL)的数据结构 3.创建用于保存Visited信息(已下载的URL)的数据结构 4.下载网页时同步更新Tode与Visited. 5.从上述第3步下载的网页抽取链接并继续下载…
【搜索引擎Jediael开发4】V0.01完整代码 分类: H_HISTORY 2014-05-21 21:35 470人阅读 评论(0) 收藏
截止目前,已完成如下功能: 1.指定某个地址,使用HttpClient下载该网页至本地文件 2.使用HtmlParser解释第1步下载的网页,抽取其中包含的链接信息 3.下载第2步的所有链接指向的网页至本地文件 下一步需要完成的功能: 1.创建用于保存种子URL的配置文件及其数据结构 2.创建用于保存Todo信息(未下载URL)的数据结构 3.创建用于保存Visited信息(已下载的URL)的数据结构 4.下载网页时同步更新Tode与Visited. 5.从上述第3步下载的网页抽取链接并继续下载…
Javascript开发笔记:不完整的继承
Javascript的继承和标准的oop继承有很大的区别,Javascript的继承是采用原型链的技术,每个类都会将“成员变量”和“成员函数”放到 prototype 上,Js++都过superclass将其链接起来即 C.prototype.superclass = C.superclass = P.prototype;当 var c = new C()时,c.__proto__ = C.prototype ;当 c访问“成员变量”时,如果在__proto__无法获取时,就会到C.protot…
Lucene/Solr搜索引擎开发笔记 - 第1章 Solr安装与部署(Jetty篇)
一.为何开博客写<Lucene/Solr搜索引擎开发笔记> 本人毕业于2011年,2011-2014的三年时间里,在深圳前50强企业工作,从事工业控制领域的机器视觉方向,主要使用语言为C/C++:现就职于一家大型国企所属电子商务公司,主要使用语言为Java,负责公司新一代搜索引擎的开发工作,故开此系列来总结自己在Lucene/Solr上的学习历程,同时,也希望能给予对搜索引擎开发有兴趣的朋友一些帮助和启发. 二.Lucene和Solr简要介绍 Lucene是apache软件基金会4 jakar…
《ArcGIS Runtime SDK for Android开发笔记》——(7)、示例代码arcgis-runtime-samples-android的使用
1.前言 学习ArcGIS Runtime SDK开发,其实最推荐的学习方式是直接看官方的教程.示例代码和帮助文档,因为官方的示例一般来说都是目前技术最新,也是最详尽的.对于ArcGIS Runtime SDK for Android的开发资料,例如示例代码我们可以在以下网址获得: https://developers.arcgis.com/android/sample-code/ 示例代码托管在github的仓库中,可以直接使用git工具下载,也可以在已下载的SDK文件夹下的Sample文件夹…
JPG学习笔记3(附完整代码)
#topics h2 { background: rgba(43, 102, 149, 1); border-radius: 6px; box-shadow: 0 0 1px rgba(95, 90, 75, 1), 1px 1px 6px 1px rgba(10, 10, 0, 0.5); color: rgba(255, 255, 255, 1); font-family: "微软雅黑", "宋体", "黑体", Arial; font-si…
TERSUS无代码开发(笔记09)-简单实例前端样式设计
前端常用样式设计 ==================================================================================================== 上一篇:TERSUS无代码开发(笔记08)-简单实例电脑端后台逻辑开发 下一篇:…
TERSUS无代码开发(笔记08)-简单实例电脑端后台逻辑开发
主管审批功能逻辑开发 1.查询逻辑开发(查询待审批记录) 2.批准处理(将选中的一条记录进行批准处理) ==================================================================================================== 上一篇:TERSUS无代码开发(笔记07)-简单实例手机端后台逻辑开发 下一篇:TERSUS无代码开发(笔记09)-简单实例前端样式设计…
TERSUS无代码开发(笔记07)-简单实例手机端后台逻辑开发
提交申请逻辑开发 1.添加父级对象引用(从父级对象中获取前端输入框的值) 1.设计数据库表(表名和字段名称不能用中文) 2.设计置数据库主键(可设联合主键) 3.传值形成数据实列处理 4.服务器端处理 5.子逻辑刷新处理(保存完输入的申清信息后对输入框进行刷新处理,刷新后输入框为空值状态) 请假记录手机端页面逻辑处理 1.查询所有记录(预处理优先处理) 2.转换后显示到表格中(记录对象转换成表格对象) ==============================================…
TERSUS无代码开发(笔记06)-简单实例手机端页面设计
手机端的设计 1.页面说明 2.默认页面===>提交请假单(上面页面双击进入,页面主要编辑区) 2.1默认页面===>提交请假单===>头部区(页面部份主要编辑区01) 2.1.1默认页面===>提交请假单===>头部区===>我的请假记录(点这个按钮将跳转到我的请假记录页面) 2.1.2改变按钮样式说明 2.1.3默认页面===>提交请假单===>头部区===>我的请假记录===>On Click(点击这个按钮跳转到我的请假记录表页面,这里我…
TERSUS无代码开发(笔记05)-简单实例电脑端页面设计
案例笔记电脑端页面设计 1.新建项目(请假管理qjgl) 2.开发软件界面介绍(常用的功能按键) 3.目录中显示元件对象 4.对元件对象的操作主要方式是双击(双击哪个元件,哪个元件就最大化显示) 5.设计页面(电脑端页面) 5.1在Desktop View中放入一个Pane元件,一个Pane元件就是一个页面. 5.2设计Pane属性: width:100%;height:100% 5.3在 Pane 中加入页面布局…
TERSUS无代码开发(笔记04)-CSS样式设置
CSS样式设置 1.常用显示样式 大小尺寸 说明 间距边距 说明 各类颜色 说明 width 宽 margin 外边距 color 颜色 height 高 padding 内边距 background-color 背景色 font-weight 字体加粗 float 浮动 font-size 字体大小 text-align 水平对齐 2.样式文件的位置 bootstrap框架 less语言处理:一门向后兼容的 CSS 扩展语言. 3.boo…
TERSUS无代码开发(笔记03)-常用快捷键
常用快捷键 1.a 普通行为元件调用 2.b 判断输入的值是什么值 3.c 有条件的传值处理 4.e 输出元件 5.f 传值或流程 6.t 输入元件 7.p 调用元件查询 8.x 判断是否有输入值 图标 名称 快捷键 说明 传值或流程 f 输出 e 触发器/输入 t 普通行为处理 a 服务器端行为处理 s 是否有值/对象 x 是哪些值 b 有条件传值 c 元件选项板中元件查询 p ========================================…
TERSUS无代码开发(笔记02)-简单实例加法
简单实例加法 1.用户端元件(显示元件)(40个) 图标 英文名称 元件名称 使用说明 服务器端 客户端 Pane 显示块 是一个显示块,是HTML的div标签 √ Row 行 行元件中的显示元件默认是排成一行显示的 √ Column 列 列元件中的显示元件是排成一列的 √ Toolbar 工具条 有默认样式的行显示块 √ Button Group 按钮组 可以将多个按钮放一起统一管理 √ Button 按钮 有默认样式的按钮元件,可以修改或自定义按钮样式 √ Image…
TERSUS无代码开发(笔记01)-按装下载和基础语法
1.中国官网 https://tersus.cn/ 2.下载:https://tersus.cn/download/ 3.开发文档:https://tersus.cn/docs/ 4.基本元件说明 图标 英文名称 元件名称 使用说明 服务器端 客户端 Select 单击选中 单击选中一个开发元件对象 Marquee 框选多个 框选多个开发元件件对象 Flow 传值或流程 将内容传给对象或流程走向 √ √ Remove 删除对象 去掉对象,可以连向复数对象,如一条线可删除表格中多行…
JPG学习笔记2(附完整代码)
#topics h2 { background: rgba(43, 102, 149, 1); border-radius: 6px; box-shadow: 0 0 1px rgba(95, 90, 75, 1), 1px 1px 6px 1px rgba(10, 10, 0, 0.5); color: rgba(255, 255, 255, 1); font-family: "微软雅黑", "宋体", "黑体", Arial; font-si…
微信公众号开发笔记(C#)
这篇文章还不错,使用 .net , 对微信用户的想公众号发送的文字进行回复.比较简单,自己可以修改更复杂的回复. 微信公众号开发笔记(C#) 原文地址 需求分析 根据用户在微信上发送至价值中国公众号的消息,查询与该消息相关的内容返回给用户. 例如,用户发送[美国经济]后收到包含[美国经济]的内容,点击可查看全文.若没有查询到相关内容,则返回默认消息. 运行环境 .NET 准备工作 1.在微信公众平台申请开发者. 2.功能页面完成后上传至自己的网站并能正常访问该URL(以下统称:目标接口…
cocos2dx3.0 超级马里奥开发笔记(两)——正确的规划游戏逻辑
我将不得不拿出一个完整的开发笔记.由于个人原因.代码已OK该,博客,那么就不要粘贴代码,直接解释了整个游戏设计,更确切地说,当新手应该注意的地方发展. 1.继承类和扩展作用的权----展阅读(MVC). 我们要封装一个角色类,第一印象就是封装一个继承自sprite的精灵,里面封装好玛丽的动作和角色属性等.继承自sprite是可行的,我们仅仅要重写几个static create函数,然后把这个精灵贴到层上就可以. 细致考虑一下,假设角色要再加入一个特效尾随呢.角色吃到道具出现幻影分身呢?一系列的B…
PHP开发笔记
PHP开发笔记 JSON数据的解析 $json_data = isset($_GET['json_data']) ? $_GET['json_data'] : null; $json_data=str_replace("\",'',$json_data); 从前台接收到的json字符串,在json_decode的时候需要先将多余的反斜线字符处理掉,才能正确转换成对象或数组. JQuery支持的数组去重方法 var yearArray = new Array(2009, 2009, 20…
Java开发笔记(八十四)文件与目录的管理
程序除了处理内存中的数据结构,还要操作磁盘上的各类文件,这里的磁盘是个统称,泛指可以持久保留数据的存储介质,包括但不限于:插在软驱中的软盘.固定在机箱中的硬盘.插在光驱中的光盘.插在USB接口上的U盘.笔记本电脑里的固态盘.手机中的闪存.相机里的SD卡等等.当然,操作系统层面已经统一了这些存储介质,故而编程语言无须理会它们之间的区别,只需专心访问存储介质上保存的文件.为表述方便,接下来将用"磁盘"二字代指以上罗列的各种存储介质.Java使用File工具来操作磁盘文件,只要在构造方法中填…
Java开发笔记(八十三)利用注解技术检查空指针
注解属于比较高级的Java开发技术,前面介绍的内置注解专用于编译器检查代码,另外一些注解则由各大框架定义与调用,像Web开发常见的Spring框架.Mybatis框架,Android开发常见的ButterKnife框架等等,都使用了大量的注解.为了更好地弄清注解的应用原理,接下来不妨尝试自定义注解,并在实际开发中对自定义的注解加以运用.之前介绍异常预防的时候,为了避免出现空指针异常,可谓是八仙过海各显神通,一路试验了多项新技术.其中校验某个字段非空尤其是个难点,案例中的苹果类共有四个字段,包括名…
Java开发笔记(二十三)数组工具Arrays
数组作为一种组合形式的数据类型,必然要求提供一些处理数组的简便办法,包括数组比较.数组复制.数组排序等等.为此Java专门设计了Arrays工具,该工具包含了几个常用方法,方便程序员对数组进行加工操作.Arrays工具的方法说明如下: Arrays.equals(a1, a2); // 判断a1和a2两个数组是否相等,也就是每个元素是否都相等 Arrays.fill(a, val); // 往数组a全部填入指定的数值val dest = Arrays.copyOf(src, newLength)…
Java开发笔记(二十四)方法的组成形式
经过前面的学习,我们发现演示的Java代码越来越复杂,而且每个例子的代码都堆在入口方法main内部,这会导致如下问题:1.一个方法内部堆砌了太多的代码行,看着费神,维护起来也吃力:2.部分代码描述的是通用算法,比如牛顿迭代法.二分查找法等等,这些通用的算法代码结构固定,很多地方会用到,倘若每次都复制粘贴无疑是苦大仇深:基于此,亟需对纷繁复杂的代码段加以梳理,一方面把代码行依据功能进行划分,这样剥离出来的各段代码不会相互影响:另一方面封装通用的算法代码,做到只定义一次,就能被多次调用.这样既提高了…
Java开发笔记(三十五)字符串格式化
前面介绍了字符串变量的四种赋值方式,对于简单的赋值来说完全够用了,即便是两个字符串拼接,也只需通过加号把两个目标串连起来即可.但对于复杂的赋值来说就麻烦了,假设现在需要拼接一个很长的字符串,字符串内部包含了各种类型的变量,有整型,有双精度型,有布尔型,有字符型,中间还夹杂着一些起粘合作用的子串,如此一来只能使劲地填写加号,把各种变量努力加加加加上去,就像有时打印日志调用System.out.println就非常痛苦,加号多到让你眼花缭乱.为了不让加号如此横行霸道,String类型从Java5开始…