Full-Text Search: 電子文書やら電子データのメタデータらを検索する。 英文の場合、スペースが単語の区切りと見做せるので楽なのだが、日本語の場合どこに 区切りを設ければいいのか難しいみたい。 ここでは古典なNamazuを取り上げる。 ***Namazu [#n7938e91] #code(nonumber){{ [root@c ~]# yum install perl-NKF perl-ExtUtils-MakeMaker [root@c ~]# mkdir -p /opt/Namazu/src [root@c ~]# cd /opt/Namazu/src [root@c src]# wget ftp://ftp.riken.jp/lang/CPAN/authors/id/K/KN/KNOK/File-MMagic-1.29.tar.gz [root@c src]# gzip -cd File-MMagic-1.29.tar.gz | tar xf - [root@c src]# cd File-MMagic-1.29 [root@leaf File-MMagic-1.29]# perl Makefile.PL; make; make test; make install [root@leaf File-MMagic-1.29]# cd .. [root@c src]# wget http://kakasi.namazu.org/stable/kakasi-2.3.4.tar.gz [root@c src]# gzip -cd kakasi-2.3.4.tar.gz | tar xf - [root@c src]# cd kakasi-2.3.4 [root@c kakasi-2.3.4]# ./configure [root@c kakasi-2.3.4]# make; make install */usr/local/binに [root@c kakasi-2.3.4]# cd .. [root@c src]# echo "/usr/local/lib" > /etc/ld.so.conf.d/local.conf [root@c src]# ldconfig [root@c src]# wget ftp://ftp.riken.jp/lang/CPAN/authors/id/D/DA/DANKOGAI/Text-Kakasi-2.04.tar.gz [root@c src]# gzip -cd Text-Kakasi-2.04.tar.gz | tar xf - [root@c Text-Kakasi-2.04]# perl Makefile; make; make test; make install [root@c Text-Kakasi-2.04]# cd .. [root@c src]# wget http://www.namazu.org/stable/namazu-2.0.21.tar.gz [root@c src]# gzip -cd namazu-2.0.21.tar.gz | tar xf - [root@c src]# cd namazu-2.0.21/ [root@c namazu-2.0.21]# ./configure --prefix=/opt/Namazu/2.0.21; make; make check; make install }} 各種文書対応 ■pdfファイル[Poppler] http://poppler.freedesktop.org/ [Poppler is a PDF rendering library based on the xpdf-3.0 code base.]とのこと。 #code(nonumber){{ [root@c ~]# yum install poppler-utils }} ■wordファイル wget http://downloads.sourceforge.net/project/wvware/wv/1.2.4/wv-1.2.4.tar.gz #code(nonumber){{ [root@c ~]# wget http://downloads.sourceforge.net/project/wvware/wv/1.2.4/wv-1.2.4.tar.gz [root@c ~]# gzip -cd wv-1.2.4.tar.gz | tar xf - [root@c ~]# cd wv-1.2.4 [root@c ~]# ./configure [root@c ~]# make; make install }} インデックスを作成する設定 #code(nonumber){{ [root@c ~]# cd /opt/Namazu [root@c Namazu]# cp src/namazu-2.0.21/conf/mknmzrc-sample mknmzrc [root@c Namazu]# ./current/bin/mknmz --config=mknmzrc --show-config }} 実際のインデックス作成 #code(nonumber){{ [root@c ~]# mkdir /opt/Namazu/idx.20130604 [root@c ~]# /opt/Namazu/current/bin/mknmz --config=mknmzrc.orig --use-kakasi \ > --output-dir=/opt/Namazu/idx.20130604 /home/foo }} yum install glib2-devel libgsf-devel wget http://downloads.sourceforge.net/project/wvware/wv2-0.4.2.tar.bz2 bzip2 -cd wv2-0.4.2.tar.bz2 | tar xf - mkdir build; cd build cmake ../wv2-0.4.2