开源搜索引擎Iveely 0.7.0发布,不一样,那就让他不一样!
2012年08月05日,Iveely Search Engine 0.1.0发布,今天,怀着对于未来的追求,终于,0.7.0如期和大家见面了,7个版本,历时2年4个月,感谢大家的支持,感谢我不离不弃的战友魏琪,奋斗到深夜,放弃了周末的社交,就为0.7.0如期而至;感谢Bogdan P Sliwowski先生,您的支持,让我们的激情和梦想靠得越来越近。下载安装编译部署,请参考Github,Web访问的时候,请确定您的浏览器支持WebSocket。
- 概 要
此次的版本,最大的技术改变是将纯C#迁移到了纯Java,由于是第一次迁移至Java且由于Java功底不好,所以,代码难免有不足之处,还请大家多多谅解。如果您有比较好的建议可以在这里提供给我们。整个项目由Iveely.Framework和Iveely.Computing以及Iveely.Search组成,Iveely.Search是基于Iveely.Computing的应用。Iveely.Framwork是一切程序的基础。本次版本包含了四大功能:文本检索、图像检索、百科检索、问答检索,其中问答检索是核心。下面看一下整体效果截图:
1. 1 文本检索功能
1.2 图片搜索
1.3 百科搜索
1.4 问答搜索
问答搜索一直是我们的核心业务,我们绝大部分时间和精力都集中在这里,不过还好,目前看,部分数据的效果还是不错的。
当然还有移动客户端的搜索结果:
以上均是无监督自我学习数据产生,但是由于服务器和数据量有限,某些结果不是很满意,当然我们也会积极改进。
1.2 技术窥视
在这里介绍详细的技术细节,可能不太现实。Iveely.Computing是整个程序运行的基础,也是让Iveely.Search变成分布式结构的运行平台,这点和0.6.0中C#版本有一定的改变,0.6.0种Iveely.Computing是一个分布式计算平台,可以进行多台机器计算一个任务,例如100亿个数相加。但是在0.7.0中,我们移除了这部分,因为我们也许不是去重新实现一个storm,以我们的实力和精力,是不够的,何况偏离了我们核心的业务,我们需要专注于我们需要实现什么,所以我们让Iveely.Computing更佳符合Iveely.Search的规范,多台机器协同工作,可以控制运行数据,拥有分布式缓存,目前则足以。
也许您很关心,Iveely能否能够像其它开源搜索引擎一样正常长期运行,这点,我们经过了严格测试,7*24小时无监督搜集数据和上线新数据,并提供服务。由于服务器的关系,我们在开源社区的示例,只提供了少量数据,我们的服务器上也只提供了少量数据。
对于专业的搜索引擎开发者,也许您更关心,如何搜集用户的行为数据,为广告投放和个性化搜索提供帮助?您可以很轻易的修改代码实现,其中我们已经做了部分在您点击搜索结果页面的时候,数据已经被采集,包括搜索词和此搜索词下用户点击的链接,可以帮助我们更好的进行网页排序。当然您也可以很容易的添加用户感兴趣的搜索,例如用户搜索完”手表“之后又搜索了”欧米茄“,且这样的用户很多,那么下回在搜索”手表“的时候,您可以把”欧米茄“的广告投放上去,效果应该不错,当然广告投放是很专业的,我当年研究生毕业的时候,论文就是广告投放和推荐,如果有机会,他对于未来的iveely非常重要,不管是移动端和web端。
博客园是个好地方,要是您对内部深入的技术感兴趣,可以在我们的开源主页中的issue中提问,我们会收到您的邮件,会尽量回复您。
1.3 Iveely Search Engine 0.8.0的未来
这两年中历时了7个版本,如果0.7.0是终结版,那么是一件多么可笑的事情,尽管我们遇到了很多困难,很多问题,几乎不可解决,但是在坚持下依然得到了期待的结果,假设现在放弃,怎能对得起未来,所以,0.8.0依然在路上等着我们,而且会越来越好,从0.1.0到0.7.0我们已经看到了这个趋势。0.8.0的任务主要集中在:问答的智能分析推理和图片分析上。为什么是这两项?对不起,我们选择了自己的路,并坚信它是对的,正如题目所说”不一样,那就让他不一样!“。
1.4 关于梦想
一般的时候,我不愿意写这种很”酸“的东西,所以我把这块写在最后,尽可能不要影响本文的核心点,梦想是一个说不清,道不明,但是却让你前行的东西,他的力量超越了欲望,世界在不断的变化,人也在不断的变化,但是总有一件事情没有变化,那就是我们的坚持,坚持是充满痛楚的,所以我们也总在寻找快乐,但最快乐的,莫过于为理想而奋斗!
1.5 捐助我们
我原本是不想写这小节,因为博客园是一个纯净的地方,但是希望大家能够原谅我,如果您愿意,我们非常希望您能够帮助我们,也许在您的帮助下,Iveely 0.8.0 将会是Iveely第一个向外提供服务的版本(我的邮箱:liufanping@iveely.com)。
您的朋友,凡平.
开源搜索引擎Iveely 0.7.0发布,不一样,那就让他不一样!的更多相关文章
- 开源搜索引擎Iveely 0.8.0发布,终见天日
这是一篇博客,不是,这是一篇开源人的心酸和喜悦,没有人可以理解我们的心情,一路的辛酸一路的艰辛,不过还好,在大家的支持下,总算是终见天日,谢谢那些给予我们无私帮助的朋友.您的支持,依然是我们无限的动力 ...
- 开源搜索引擎Iveely 0.8.0
开源搜索引擎Iveely 0.8.0 这是一篇博客,不是,这是一篇开源人的心酸和喜悦,没有人可以理解我们的心情,一路的辛酸一路的艰辛,不过还好,在大家的支持下,总算是终见天日,谢谢那些给予我们无私帮助 ...
- 开源搜索 Iveely Search Engine 0.6.0 发布 -- 黎明前的娇嫩
快两年了,Iveely Search Engine已经走过了5个版本的岁月,虽出生“贫寒”,没有任何开源基金会的支持,没有优秀的“干爹.干妈”,它凭着它的爱好者的支持,0.6.0终于破壳而出,7年前, ...
- 开源分布式计算引擎 & 开源搜索引擎 Iveely 0.5.0 为大数据而生
Iveely Computing 产生背景 08年的时候,我开始接触搜索引擎,当时遇到的第一个难题就是大数据实时并发处理,当时实验室的机器我们可以随便用,至少二三十台机器,可以,却没有程序可以将这些机 ...
- Iveely Search Engine 0.4.0 的发布
千呼万唤始出来,Iveely Search Engine 0.4.0 的发布 经过无数个夜晚的奋战,以及无数个夜晚的失眠,Iveely Search Engine 0.4.0 终于熬出来了,这其中 ...
- Java 开源博客——B3log Solo 0.6.1 正式版发布了!
Java 开源博客 —— B3LOG Solo 0.6.1 正式版发布了!欢迎大家下载. 该版本主要是改善细节体验,并加入了一款 Metro 风格的皮肤. 特性 基于标签的文章分类 Ping Goog ...
- GNU libmicrohttpd 0.9.29 发布 - 开源中国社区
GNU libmicrohttpd 0.9.29 发布 - 开源中国社区 GNU libmicrohttpd 0.9.29 发布
- virtenv 0.8.6 发布,虚拟桌面配置工具 - 开源中国社区
virtenv 0.8.6 发布,虚拟桌面配置工具 - 开源中国社区 virtenv 0.8.6 发布,virtenv 是一个用 QT4 开发的应用,用来配置和启动基于 LXC 的虚拟桌面环境.该容器 ...
- Java 开源博客——B3log Solo 0.6.7 正式版发布了!
Java 开源博客 -- B3log Solo 0.6.7 正式版发布了!欢迎大家下载. 另外,欢迎观摩 B3log 团队的新项目:Wide,也非常欢迎大家参与进来 :-) 特性 基于标签的文章分类 ...
随机推荐
- centos7.2 yum安装lamp环境
一.准备工作 1. 下载并安装centos7.2,配置好网络环境,确保centos能上网,可以获取到yum源. centos7.2的下载地址:http://pan.baidu.com/s/1eRT ...
- 2015.8.1 bootstrap学习(个人每日学习的随笔,比较凌乱
写在前面: 记录自己的学习中遇到的问题和解决办法.因为是每日晚上总结,可能只是随便一笔带过方便自己记忆.如有写的错误或者凌乱之处,请勿介意 1.<html lang="zh-hans& ...
- android使用微软雅黑字体
android使用微软雅黑字体,需要下载字体 ttf文件 下载地址:http://download.csdn.net/detail/xiaoliu123586/9049815 放在assert,然后引 ...
- Window I/O 完成端口 (Windows I/O Completion Port (IOCP))
相关对象 IO EndPoint, 所有支持重叠IO(overlapped IO)的设备,比如文件,Winsock,管道等. IOCP, IO完成端口内核对象,可以使用API CreateIoComp ...
- 终于完成了Josephus的C语言实现啦~~
/*以下程序用来解决Josephus问题,现在只是完成了M>N的情况,2015-08-20 22:22:20*//*发现一个问题:数组的赋值问题:char People[N]={1};并不代表所 ...
- xml in hadoop ETL with pig summary
项目中需要把source为xml的文件通过flume放置到hdfs,然后通过MR导入到vertica中去,我之前做过简单的 尝试,是通过pig的piggybank的xmlloader然后Regex_e ...
- 深搜+剪枝 POJ 1724 ROADS
POJ 1724 ROADS Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 12766 Accepted: 4722 D ...
- TP快捷函数
U();创建URL地址 C();获取或设置系统变量信息 A();实例化控制器对象 R():实例化控制器对象且同时调用控制器里的某个方法 I();过滤表单提交的数据,代替$_POST
- ArcGis 创建IWorkspace
); ESRI.ArcGIS.esriSystem.IName name = (ESRI.ArcGIS.esriSystem.IName)workspaceName; ...
- Git之分支创建策略
分支策略:git上始终保持两个分支,master分支与develop分支.master分支主要用于发布时使用,而develop分支主要用于开发使用. 创建master的分支developgit che ...