正好近期部门有一个小需求需要做商品的搜索,虽然最终由于工作量等原因先做数据库搜索,我依然用刚接触的Lucene弄了一套自嗨. 首先看需求:搜索:根据商品标题和内容搜索 没错,就这么简单! 我想了想,数据源大概有以下两种: 1.根据需要搜索的字段,从数据库读取信息加载,并创建Lucene索引 2.利用爬虫定时抓取数据,并创建Lucene索引 由于是非正式的,数据库不方便访问,因此我选择利用爬虫去抓取指定网页,并清理内容来建立索引 其中,针对链接,做商品详情页的过滤,这样能保证最快速.最精准的建立我…