开源搜索引擎Iveely 0.7.0发布,不一样,那就让他不一样!
2012年08月05日,Iveely Search Engine 0.1.0发布,今天,怀着对于未来的追求,终于,0.7.0如期和大家见面了,7个版本,历时2年4个月,感谢大家的支持,感谢我不离不弃的战友魏琪,奋斗到深夜,放弃了周末的社交,就为0.7.0如期而至;感谢Bogdan P Sliwowski先生,您的支持,让我们的激情和梦想靠得越来越近。下载安装编译部署,请参考Github,Web访问的时候,请确定您的浏览器支持WebSocket。
- 概 要
此次的版本,最大的技术改变是将纯C#迁移到了纯Java,由于是第一次迁移至Java且由于Java功底不好,所以,代码难免有不足之处,还请大家多多谅解。如果您有比较好的建议可以在这里提供给我们。整个项目由Iveely.Framework和Iveely.Computing以及Iveely.Search组成,Iveely.Search是基于Iveely.Computing的应用。Iveely.Framwork是一切程序的基础。本次版本包含了四大功能:文本检索、图像检索、百科检索、问答检索,其中问答检索是核心。下面看一下整体效果截图:
1. 1 文本检索功能
1.2 图片搜索
1.3 百科搜索
1.4 问答搜索
问答搜索一直是我们的核心业务,我们绝大部分时间和精力都集中在这里,不过还好,目前看,部分数据的效果还是不错的。
当然还有移动客户端的搜索结果:
以上均是无监督自我学习数据产生,但是由于服务器和数据量有限,某些结果不是很满意,当然我们也会积极改进。
1.2 技术窥视
在这里介绍详细的技术细节,可能不太现实。Iveely.Computing是整个程序运行的基础,也是让Iveely.Search变成分布式结构的运行平台,这点和0.6.0中C#版本有一定的改变,0.6.0种Iveely.Computing是一个分布式计算平台,可以进行多台机器计算一个任务,例如100亿个数相加。但是在0.7.0中,我们移除了这部分,因为我们也许不是去重新实现一个storm,以我们的实力和精力,是不够的,何况偏离了我们核心的业务,我们需要专注于我们需要实现什么,所以我们让Iveely.Computing更佳符合Iveely.Search的规范,多台机器协同工作,可以控制运行数据,拥有分布式缓存,目前则足以。
也许您很关心,Iveely能否能够像其它开源搜索引擎一样正常长期运行,这点,我们经过了严格测试,7*24小时无监督搜集数据和上线新数据,并提供服务。由于服务器的关系,我们在开源社区的示例,只提供了少量数据,我们的服务器上也只提供了少量数据。
对于专业的搜索引擎开发者,也许您更关心,如何搜集用户的行为数据,为广告投放和个性化搜索提供帮助?您可以很轻易的修改代码实现,其中我们已经做了部分在您点击搜索结果页面的时候,数据已经被采集,包括搜索词和此搜索词下用户点击的链接,可以帮助我们更好的进行网页排序。当然您也可以很容易的添加用户感兴趣的搜索,例如用户搜索完”手表“之后又搜索了”欧米茄“,且这样的用户很多,那么下回在搜索”手表“的时候,您可以把”欧米茄“的广告投放上去,效果应该不错,当然广告投放是很专业的,我当年研究生毕业的时候,论文就是广告投放和推荐,如果有机会,他对于未来的iveely非常重要,不管是移动端和web端。
博客园是个好地方,要是您对内部深入的技术感兴趣,可以在我们的开源主页中的issue中提问,我们会收到您的邮件,会尽量回复您。
1.3 Iveely Search Engine 0.8.0的未来
这两年中历时了7个版本,如果0.7.0是终结版,那么是一件多么可笑的事情,尽管我们遇到了很多困难,很多问题,几乎不可解决,但是在坚持下依然得到了期待的结果,假设现在放弃,怎能对得起未来,所以,0.8.0依然在路上等着我们,而且会越来越好,从0.1.0到0.7.0我们已经看到了这个趋势。0.8.0的任务主要集中在:问答的智能分析推理和图片分析上。为什么是这两项?对不起,我们选择了自己的路,并坚信它是对的,正如题目所说”不一样,那就让他不一样!“。
1.4 关于梦想
一般的时候,我不愿意写这种很”酸“的东西,所以我把这块写在最后,尽可能不要影响本文的核心点,梦想是一个说不清,道不明,但是却让你前行的东西,他的力量超越了欲望,世界在不断的变化,人也在不断的变化,但是总有一件事情没有变化,那就是我们的坚持,坚持是充满痛楚的,所以我们也总在寻找快乐,但最快乐的,莫过于为理想而奋斗!
1.5 捐助我们
我原本是不想写这小节,因为博客园是一个纯净的地方,但是希望大家能够原谅我,如果您愿意,我们非常希望您能够帮助我们,也许在您的帮助下,Iveely 0.8.0 将会是Iveely第一个向外提供服务的版本(我的邮箱:liufanping@iveely.com)。
您的朋友,凡平.
开源搜索引擎Iveely 0.7.0发布,不一样,那就让他不一样!的更多相关文章
- 开源搜索引擎Iveely 0.8.0发布,终见天日
这是一篇博客,不是,这是一篇开源人的心酸和喜悦,没有人可以理解我们的心情,一路的辛酸一路的艰辛,不过还好,在大家的支持下,总算是终见天日,谢谢那些给予我们无私帮助的朋友.您的支持,依然是我们无限的动力 ...
- 开源搜索引擎Iveely 0.8.0
开源搜索引擎Iveely 0.8.0 这是一篇博客,不是,这是一篇开源人的心酸和喜悦,没有人可以理解我们的心情,一路的辛酸一路的艰辛,不过还好,在大家的支持下,总算是终见天日,谢谢那些给予我们无私帮助 ...
- 开源搜索 Iveely Search Engine 0.6.0 发布 -- 黎明前的娇嫩
快两年了,Iveely Search Engine已经走过了5个版本的岁月,虽出生“贫寒”,没有任何开源基金会的支持,没有优秀的“干爹.干妈”,它凭着它的爱好者的支持,0.6.0终于破壳而出,7年前, ...
- 开源分布式计算引擎 & 开源搜索引擎 Iveely 0.5.0 为大数据而生
Iveely Computing 产生背景 08年的时候,我开始接触搜索引擎,当时遇到的第一个难题就是大数据实时并发处理,当时实验室的机器我们可以随便用,至少二三十台机器,可以,却没有程序可以将这些机 ...
- Iveely Search Engine 0.4.0 的发布
千呼万唤始出来,Iveely Search Engine 0.4.0 的发布 经过无数个夜晚的奋战,以及无数个夜晚的失眠,Iveely Search Engine 0.4.0 终于熬出来了,这其中 ...
- Java 开源博客——B3log Solo 0.6.1 正式版发布了!
Java 开源博客 —— B3LOG Solo 0.6.1 正式版发布了!欢迎大家下载. 该版本主要是改善细节体验,并加入了一款 Metro 风格的皮肤. 特性 基于标签的文章分类 Ping Goog ...
- GNU libmicrohttpd 0.9.29 发布 - 开源中国社区
GNU libmicrohttpd 0.9.29 发布 - 开源中国社区 GNU libmicrohttpd 0.9.29 发布
- virtenv 0.8.6 发布,虚拟桌面配置工具 - 开源中国社区
virtenv 0.8.6 发布,虚拟桌面配置工具 - 开源中国社区 virtenv 0.8.6 发布,virtenv 是一个用 QT4 开发的应用,用来配置和启动基于 LXC 的虚拟桌面环境.该容器 ...
- Java 开源博客——B3log Solo 0.6.7 正式版发布了!
Java 开源博客 -- B3log Solo 0.6.7 正式版发布了!欢迎大家下载. 另外,欢迎观摩 B3log 团队的新项目:Wide,也非常欢迎大家参与进来 :-) 特性 基于标签的文章分类 ...
随机推荐
- SQL Server游标的使用【转】
游标是邪恶的! 在关系数据库中,我们对于查询的思考是面向集合的.而游标打破了这一规则,游标使得我们思考方式变为逐行进行.对于类C的开发人员来着,这样的思考方式会更加舒服. 正常面向集合的思维方式是: ...
- Java读写文件方法总结
Java读写文件方法总结 Java的读写文件方法在工作中相信有很多的用处的,本人在之前包括现在都在使用Java的读写文件方法来处理数据方面的输入输出,确实很方便.奈何我的记性实在是叫人着急,很多时候既 ...
- apache CXF wsdl2java工具的使用
cxf的wsdl2java命令和JDK的wsimport命令的区别和使用 JDK提供了一个wsimport.exe的命令,主要是用于将WebService生成客户端代码,然后好调用WebService ...
- Android开发之 Windows环境下通过Eclipse创建的第一个安卓应用程序(图文详细步骤)
第一篇 windows环境下搭建创建的第一个安卓应用程序 为了方便,我这里只采用了一体包进行演示. 一.下载安卓环境的一体包. 官网下载:安卓官网(一般被墙了) 网盘下载: http://yunpa ...
- 烂泥:LVM学习之逻辑卷、卷组及物理卷删除
本文由秀依林枫提供友情赞助,首发于烂泥行天下. 上篇文章,我们介绍了有关LVM的逻辑卷及卷组的空间缩小.这次我们来介绍下如何删除一个逻辑卷及卷组. 删除逻辑卷需要以下几个步骤: 1. 卸载已经挂载的逻 ...
- Node.js的模块载入方式与机制
Node.js中模块可以通过文件路径或名字获取模块的引用.模块的引用会映射到一个js文件路径,除非它是一个Node内置模块.Node的内置模块公开了一些常用的API给开发者,并且它们在Node进程开始 ...
- cut
cut是一个针对行的数据选取命令 SYNOPSIS cut [OPTION]... [FILE]... OPTION -b 以字节为单位进行分割,如果是多字节的话就需要注意了 -c 以字符为单位进行分 ...
- AMO olap Test C# generate tsql and mdx
通过AMO访问online的cube,生成等值的TSql和mdx 自动生成等值的TSQL和MDX进行Cube测试.其中难度比较大的部分是拼接TSQL. 暂时不处理calculations,只除理met ...
- mysql 防止update/delete误操作
身为一php开发攻城狮,常常涉及在应用中写update/delete语句,忘记加where,后果不堪设想. 还会出现在cml下直接操作mysql的情况,如果mysql 权限够大,一个update/de ...
- HDU 3333 Turing Tree --树状数组+离线处理
题意:统计一段序列[L,R]的和,重复元素只算一次. 解法:容易看出在线做很难处理重复的情况,干脆全部讲查询读进来,然后将查询根据右端点排个序,然后离散化数据以后就可以操作了. 每次读入一个数,如果这 ...