2012年08月05日,Iveely Search Engine 0.1.0发布,今天,怀着对于未来的追求,终于,0.7.0如期和大家见面了,7个版本,历时2年4个月,感谢大家的支持,感谢我不离不弃的战友魏琪,奋斗到深夜,放弃了周末的社交,就为0.7.0如期而至;感谢Bogdan P Sliwowski先生,您的支持,让我们的激情和梦想靠得越来越近。下载安装编译部署,请参考Github,Web访问的时候,请确定您的浏览器支持WebSocket。

  1. 概  要

此次的版本,最大的技术改变是将纯C#迁移到了纯Java,由于是第一次迁移至Java且由于Java功底不好,所以,代码难免有不足之处,还请大家多多谅解。如果您有比较好的建议可以在这里提供给我们。整个项目由Iveely.Framework和Iveely.Computing以及Iveely.Search组成,Iveely.Search是基于Iveely.Computing的应用。Iveely.Framwork是一切程序的基础。本次版本包含了四大功能:文本检索、图像检索、百科检索、问答检索,其中问答检索是核心。下面看一下整体效果截图:

1. 1  文本检索功能

1.2  图片搜索

1.3  百科搜索

1.4  问答搜索

问答搜索一直是我们的核心业务,我们绝大部分时间和精力都集中在这里,不过还好,目前看,部分数据的效果还是不错的。

当然还有移动客户端的搜索结果:

        

以上均是无监督自我学习数据产生,但是由于服务器和数据量有限,某些结果不是很满意,当然我们也会积极改进。

1.2 技术窥视

在这里介绍详细的技术细节,可能不太现实。Iveely.Computing是整个程序运行的基础,也是让Iveely.Search变成分布式结构的运行平台,这点和0.6.0中C#版本有一定的改变,0.6.0种Iveely.Computing是一个分布式计算平台,可以进行多台机器计算一个任务,例如100亿个数相加。但是在0.7.0中,我们移除了这部分,因为我们也许不是去重新实现一个storm,以我们的实力和精力,是不够的,何况偏离了我们核心的业务,我们需要专注于我们需要实现什么,所以我们让Iveely.Computing更佳符合Iveely.Search的规范,多台机器协同工作,可以控制运行数据,拥有分布式缓存,目前则足以。

也许您很关心,Iveely能否能够像其它开源搜索引擎一样正常长期运行,这点,我们经过了严格测试,7*24小时无监督搜集数据和上线新数据,并提供服务。由于服务器的关系,我们在开源社区的示例,只提供了少量数据,我们的服务器上也只提供了少量数据。

对于专业的搜索引擎开发者,也许您更关心,如何搜集用户的行为数据,为广告投放和个性化搜索提供帮助?您可以很轻易的修改代码实现,其中我们已经做了部分在您点击搜索结果页面的时候,数据已经被采集,包括搜索词和此搜索词下用户点击的链接,可以帮助我们更好的进行网页排序。当然您也可以很容易的添加用户感兴趣的搜索,例如用户搜索完”手表“之后又搜索了”欧米茄“,且这样的用户很多,那么下回在搜索”手表“的时候,您可以把”欧米茄“的广告投放上去,效果应该不错,当然广告投放是很专业的,我当年研究生毕业的时候,论文就是广告投放和推荐,如果有机会,他对于未来的iveely非常重要,不管是移动端和web端。

博客园是个好地方,要是您对内部深入的技术感兴趣,可以在我们的开源主页中的issue中提问,我们会收到您的邮件,会尽量回复您。

1.3  Iveely Search Engine 0.8.0的未来

这两年中历时了7个版本,如果0.7.0是终结版,那么是一件多么可笑的事情,尽管我们遇到了很多困难,很多问题,几乎不可解决,但是在坚持下依然得到了期待的结果,假设现在放弃,怎能对得起未来,所以,0.8.0依然在路上等着我们,而且会越来越好,从0.1.0到0.7.0我们已经看到了这个趋势。0.8.0的任务主要集中在:问答的智能分析推理图片分析上。为什么是这两项?对不起,我们选择了自己的路,并坚信它是对的,正如题目所说”不一样,那就让他不一样!“。

1.4  关于梦想

一般的时候,我不愿意写这种很”酸“的东西,所以我把这块写在最后,尽可能不要影响本文的核心点,梦想是一个说不清,道不明,但是却让你前行的东西,他的力量超越了欲望,世界在不断的变化,人也在不断的变化,但是总有一件事情没有变化,那就是我们的坚持,坚持是充满痛楚的,所以我们也总在寻找快乐,但最快乐的,莫过于为理想而奋斗

1.5  捐助我们

我原本是不想写这小节,因为博客园是一个纯净的地方,但是希望大家能够原谅我,如果您愿意,我们非常希望您能够帮助我们,也许在您的帮助下,Iveely 0.8.0 将会是Iveely第一个向外提供服务的版本(我的邮箱:liufanping@iveely.com)。

您的朋友,凡平.

开源搜索引擎Iveely 0.7.0发布,不一样,那就让他不一样!的更多相关文章

  1. 开源搜索引擎Iveely 0.8.0发布,终见天日

    这是一篇博客,不是,这是一篇开源人的心酸和喜悦,没有人可以理解我们的心情,一路的辛酸一路的艰辛,不过还好,在大家的支持下,总算是终见天日,谢谢那些给予我们无私帮助的朋友.您的支持,依然是我们无限的动力 ...

  2. 开源搜索引擎Iveely 0.8.0

    开源搜索引擎Iveely 0.8.0 这是一篇博客,不是,这是一篇开源人的心酸和喜悦,没有人可以理解我们的心情,一路的辛酸一路的艰辛,不过还好,在大家的支持下,总算是终见天日,谢谢那些给予我们无私帮助 ...

  3. 开源搜索 Iveely Search Engine 0.6.0 发布 -- 黎明前的娇嫩

    快两年了,Iveely Search Engine已经走过了5个版本的岁月,虽出生“贫寒”,没有任何开源基金会的支持,没有优秀的“干爹.干妈”,它凭着它的爱好者的支持,0.6.0终于破壳而出,7年前, ...

  4. 开源分布式计算引擎 & 开源搜索引擎 Iveely 0.5.0 为大数据而生

    Iveely Computing 产生背景 08年的时候,我开始接触搜索引擎,当时遇到的第一个难题就是大数据实时并发处理,当时实验室的机器我们可以随便用,至少二三十台机器,可以,却没有程序可以将这些机 ...

  5. Iveely Search Engine 0.4.0 的发布

    千呼万唤始出来,Iveely Search Engine 0.4.0 的发布   经过无数个夜晚的奋战,以及无数个夜晚的失眠,Iveely Search Engine 0.4.0 终于熬出来了,这其中 ...

  6. Java 开源博客——B3log Solo 0.6.1 正式版发布了!

    Java 开源博客 —— B3LOG Solo 0.6.1 正式版发布了!欢迎大家下载. 该版本主要是改善细节体验,并加入了一款 Metro 风格的皮肤. 特性 基于标签的文章分类 Ping Goog ...

  7. GNU libmicrohttpd 0.9.29 发布 - 开源中国社区

    GNU libmicrohttpd 0.9.29 发布 - 开源中国社区 GNU libmicrohttpd 0.9.29 发布

  8. virtenv 0.8.6 发布,虚拟桌面配置工具 - 开源中国社区

    virtenv 0.8.6 发布,虚拟桌面配置工具 - 开源中国社区 virtenv 0.8.6 发布,virtenv 是一个用 QT4 开发的应用,用来配置和启动基于 LXC 的虚拟桌面环境.该容器 ...

  9. Java 开源博客——B3log Solo 0.6.7 正式版发布了!

    Java 开源博客 -- B3log Solo 0.6.7 正式版发布了!欢迎大家下载. 另外,欢迎观摩 B3log 团队的新项目:Wide,也非常欢迎大家参与进来 :-) 特性 基于标签的文章分类 ...

随机推荐

  1. SQL Server游标的使用【转】

    游标是邪恶的! 在关系数据库中,我们对于查询的思考是面向集合的.而游标打破了这一规则,游标使得我们思考方式变为逐行进行.对于类C的开发人员来着,这样的思考方式会更加舒服. 正常面向集合的思维方式是: ...

  2. Java读写文件方法总结

    Java读写文件方法总结 Java的读写文件方法在工作中相信有很多的用处的,本人在之前包括现在都在使用Java的读写文件方法来处理数据方面的输入输出,确实很方便.奈何我的记性实在是叫人着急,很多时候既 ...

  3. apache CXF wsdl2java工具的使用

    cxf的wsdl2java命令和JDK的wsimport命令的区别和使用 JDK提供了一个wsimport.exe的命令,主要是用于将WebService生成客户端代码,然后好调用WebService ...

  4. Android开发之 Windows环境下通过Eclipse创建的第一个安卓应用程序(图文详细步骤)

    第一篇  windows环境下搭建创建的第一个安卓应用程序 为了方便,我这里只采用了一体包进行演示. 一.下载安卓环境的一体包. 官网下载:安卓官网(一般被墙了) 网盘下载: http://yunpa ...

  5. 烂泥:LVM学习之逻辑卷、卷组及物理卷删除

    本文由秀依林枫提供友情赞助,首发于烂泥行天下. 上篇文章,我们介绍了有关LVM的逻辑卷及卷组的空间缩小.这次我们来介绍下如何删除一个逻辑卷及卷组. 删除逻辑卷需要以下几个步骤: 1. 卸载已经挂载的逻 ...

  6. Node.js的模块载入方式与机制

    Node.js中模块可以通过文件路径或名字获取模块的引用.模块的引用会映射到一个js文件路径,除非它是一个Node内置模块.Node的内置模块公开了一些常用的API给开发者,并且它们在Node进程开始 ...

  7. cut

    cut是一个针对行的数据选取命令 SYNOPSIS cut [OPTION]... [FILE]... OPTION -b 以字节为单位进行分割,如果是多字节的话就需要注意了 -c 以字符为单位进行分 ...

  8. AMO olap Test C# generate tsql and mdx

    通过AMO访问online的cube,生成等值的TSql和mdx 自动生成等值的TSQL和MDX进行Cube测试.其中难度比较大的部分是拼接TSQL. 暂时不处理calculations,只除理met ...

  9. mysql 防止update/delete误操作

    身为一php开发攻城狮,常常涉及在应用中写update/delete语句,忘记加where,后果不堪设想. 还会出现在cml下直接操作mysql的情况,如果mysql 权限够大,一个update/de ...

  10. HDU 3333 Turing Tree --树状数组+离线处理

    题意:统计一段序列[L,R]的和,重复元素只算一次. 解法:容易看出在线做很难处理重复的情况,干脆全部讲查询读进来,然后将查询根据右端点排个序,然后离散化数据以后就可以操作了. 每次读入一个数,如果这 ...