Full-Text Search: 電子文書やら電子データのメタデータらを検索する。
英文の場合、スペースが単語の区切りと見做せるので楽なのだが、日本語の場合どこに
区切りを設ければいいのか難しいみたい。
ここでは古典なNamazuを取り上げる。
[root@c ~]# yum install perl-NKF perl-ExtUtils-MakeMaker
[root@c ~]# mkdir -p /opt/Namazu/src
[root@c ~]# cd /opt/Namazu/src
[root@c src]# wget ftp://ftp.riken.jp/lang/CPAN/authors/id/K/KN/KNOK/File-MMagic-1.29.tar.gz
[root@c src]# gzip -cd File-MMagic-1.29.tar.gz | tar xf -
[root@c src]# cd File-MMagic-1.29
[root@leaf File-MMagic-1.29]# perl Makefile.PL; make; make test; make install
[root@leaf File-MMagic-1.29]# cd ..
[root@c src]# wget http://kakasi.namazu.org/stable/kakasi-2.3.4.tar.gz
[root@c src]# gzip -cd kakasi-2.3.4.tar.gz | tar xf -
[root@c src]# cd kakasi-2.3.4
[root@c kakasi-2.3.4]# ./configure
[root@c kakasi-2.3.4]# make; make install */usr/local/binに
[root@c kakasi-2.3.4]# cd ..
[root@c src]# echo "/usr/local/lib" > /etc/ld.so.conf.d/local.conf
[root@c src]# ldconfig
[root@c src]# wget ftp://ftp.riken.jp/lang/CPAN/authors/id/D/DA/DANKOGAI/Text-Kakasi-2.04.tar.gz
[root@c src]# gzip -cd Text-Kakasi-2.04.tar.gz | tar xf -
[root@c Text-Kakasi-2.04]# perl Makefile; make; make test; make install
[root@c Text-Kakasi-2.04]# cd ..
[root@c src]# wget http://www.namazu.org/stable/namazu-2.0.21.tar.gz
[root@c src]# gzip -cd namazu-2.0.21.tar.gz | tar xf -
[root@c src]# cd namazu-2.0.21/
[root@c namazu-2.0.21]# ./configure --prefix=/opt/Namazu/2.0.21; make; make check; make install
各種文書対応
■pdfファイル[Poppler]
http://poppler.freedesktop.org/
[Poppler is a PDF rendering library based on the xpdf-3.0 code base.]とのこと。
[root@c ~]# yum install poppler-utils
■wordファイル
[root@c ~]# wget http://downloads.sourceforge.net/project/wvware/wv/1.2.4/wv-1.2.4.tar.gz
[root@c ~]# gzip -cd wv-1.2.4.tar.gz | tar xf -
[root@c ~]# cd wv-1.2.4
[root@c ~]# ./configure
[root@c ~]# make; make install
インデックスを作成する設定
[root@c ~]# cd /opt/Namazu
[root@c Namazu]# cp src/namazu-2.0.21/conf/mknmzrc-sample mknmzrc
[root@c Namazu]# ./current/bin/mknmz --config=mknmzrc --show-config
実際のインデックス作成
[root@c ~]# mkdir /opt/Namazu/idx.20130604
[root@c ~]# /opt/Namazu/current/bin/mknmz --config=mknmzrc.orig --use-kakasi \
> --output-dir=/opt/Namazu/idx.20130604 /home/foo
yum install glib2-devel libgsf-devel
wget http://downloads.sourceforge.net/project/wvware/wv2-0.4.2.tar.bz2
bzip2 -cd wv2-0.4.2.tar.bz2 | tar xf -
mkdir build; cd build
cmake ../wv2-0.4.2