当前在线人数:0 登录
云端分布式搜索技术 关注云端搜索技术:elasticsearch,nutch,hadoop,nosql,mongodb,hbase,cassandra

标签: solr (3)

solr4.3索引分片拆分实现原理

solr4.3版本出了,支持分片拆分功能,就是可以把一个分片切分成两个小分片。比如shard1,切分后就变成shard1_0和shard1_1,以后对shard1的索引和搜索操作会路由到这两个分片。

大致步骤如下:
1.在shard1所在节点新增两个core,覆盖新的哈希范围(solr是通过哈希范围来决定数据存放在那个分片,和一致性哈希有点类似)
2.这两个core进入维护模式

nutch1.3和solr3.x集成时出现Invalid UTF-8 character问题

今天更新了下nutch,发现已经出了1.3版,下载时就发现只有70多M,之前的可是100多M的,肯定是什么东西删了,下载完后发现原来nutch自带的搜索功能都被删了,现在只能用solr作为索引和搜索来使用。

Solr1.4+Nutch1.2构建分布式搜索服务

网上有很多文章介绍配置solr+nutch,但感觉没多少是完整的,有些只是配置出用solr建立nutch索引并能用solradmin查找到数据就完事,我这篇文章主要介绍怎样把solr集成到nutch的搜索前台,让nutch能用到solr的索引服务从而构建出分布式搜索服务。由于本文主要介绍solr和n