Full-Text Search: 電子文書やら電子データのメタデータらを検索する。
英文の場合、スペースが単語の区切りと見做せるので楽なのだが、日本語の場合どこに
区切りを設ければいいのか難しいみたい。
ここでは古典なNamazuを取り上げる。

Namazu

[root@c ~]# yum install perl-NKF perl-ExtUtils-MakeMaker
[root@c ~]# mkdir -p /opt/Namazu/src
[root@c ~]# cd /opt/Namazu/src
[root@c src]# wget ftp://ftp.riken.jp/lang/CPAN/authors/id/K/KN/KNOK/File-MMagic-1.29.tar.gz
[root@c src]# gzip -cd File-MMagic-1.29.tar.gz | tar xf -
[root@c src]# cd File-MMagic-1.29
[root@leaf File-MMagic-1.29]# perl Makefile.PL; make; make test; make install
[root@leaf File-MMagic-1.29]# cd ..
 
[root@c src]# wget http://kakasi.namazu.org/stable/kakasi-2.3.4.tar.gz
[root@c src]# gzip -cd kakasi-2.3.4.tar.gz | tar xf -
[root@c src]# cd kakasi-2.3.4
[root@c kakasi-2.3.4]# ./configure
[root@c kakasi-2.3.4]# make; make install     */usr/local/binに
[root@c kakasi-2.3.4]# cd ..
[root@c src]# echo "/usr/local/lib" > /etc/ld.so.conf.d/local.conf
[root@c src]# ldconfig
 
[root@c src]# wget ftp://ftp.riken.jp/lang/CPAN/authors/id/D/DA/DANKOGAI/Text-Kakasi-2.04.tar.gz
[root@c src]# gzip -cd Text-Kakasi-2.04.tar.gz | tar xf -
[root@c Text-Kakasi-2.04]# perl Makefile; make; make test; make install
[root@c Text-Kakasi-2.04]# cd ..
 
[root@c src]# wget http://www.namazu.org/stable/namazu-2.0.21.tar.gz
[root@c src]# gzip -cd namazu-2.0.21.tar.gz | tar xf -
[root@c src]# cd namazu-2.0.21/
[root@c namazu-2.0.21]# ./configure --prefix=/opt/Namazu/2.0.21; make; make check; make install

各種文書対応
■pdfファイル[Poppler]
http://poppler.freedesktop.org/
[Poppler is a PDF rendering library based on the xpdf-3.0 code base.]とのこと。

[root@c ~]# yum install poppler-utils

■wordファイル

[root@c ~]# wget http://downloads.sourceforge.net/project/wvware/wv/1.2.4/wv-1.2.4.tar.gz
[root@c ~]# gzip -cd wv-1.2.4.tar.gz | tar xf -
[root@c ~]# cd wv-1.2.4
[root@c ~]# ./configure
[root@c ~]# make; make install

インデックスを作成する設定

[root@c ~]# cd /opt/Namazu
[root@c Namazu]# cp src/namazu-2.0.21/conf/mknmzrc-sample mknmzrc
[root@c Namazu]# ./current/bin/mknmz --config=mknmzrc --show-config

実際のインデックス作成

[root@c ~]# mkdir /opt/Namazu/idx.20130604
[root@c ~]# /opt/Namazu/current/bin/mknmz --config=mknmzrc.orig --use-kakasi \
> --output-dir=/opt/Namazu/idx.20130604 /home/foo

yum install glib2-devel libgsf-devel
wget http://downloads.sourceforge.net/project/wvware/wv2-0.4.2.tar.bz2
bzip2 -cd wv2-0.4.2.tar.bz2 | tar xf -
mkdir build; cd build
cmake ../wv2-0.4.2


トップ   編集 添付 複製 名前変更     ヘルプ   最終更新のRSS
Last-modified: 2013-06-14 (金) 14:54:30 (1441d)