みかんせい
本家様 https://github.com/soedinglab/MMseqs2
MMseqs2 (Many-against-Many searching) is a software suite to search and cluster huge sequence sets.
MMseqs2 is open source GPL-licensed software implemented in C++ for Linux, Mac OS and Windows.
MMseqs2 is designed to run on multiple cores and servers, making it highly scalable. MMseqs2 matches the sensitivity of BLAST, but with several orders of magnitude faster speed.
It can perform profile searches, like PSI-BLAST, but with a speed advantage of up to 400 times faster.
(日本語訳, deepL様翻訳)
MMseqs2 (Many-against-Many searching) は、巨大な配列セットを検索し、クラスタリングするソフトウェアスイートである。
MMseqs2は、Linux、Mac OS、Windows用のC++で実装されたGPLライセンスのオープンソースソフトウェアである。
MMseqs2はマルチコアやサーバー上で動作するように設計されており、高いスケーラビリティを持つ。MMseqs2はBLASTの感度に匹敵するが、スピードは数桁速い。
PSI-BLASTのようなプロファイル検索が可能ですが、最大400倍のスピードのアドバンテージがあります。
condaでも提供されている. これを使うのが一番楽かな.
こちらでは pyenv/anaconda(miniforge) を敷いて、そこで仮想実行環境を作っています
もし初回なら下記を実施して pyenv/anaconda を敷きます
git clone https://github.com/yyuu/pyenv.git /apps/pyenv
export PYENV_ROOT=/apps/pyenv
export PATH=$PYENV_ROOT/bin:$PATH
pyenv install --list (これで使えるanaconda/miniforgeが確認できます)
pyenv install anaconda3-2024.10-1
pyenv global anaconda3-2024.10-1
source /apps/pyenv/versions/anaconda3-2024.10-1/etc/profile.d/conda.sh
既にpyenv/anaconda を敷いているなら使っているanaconda/miniforgeに対して
source /apps/pyenv/versions/anaconda3-2024.10-1/etc/profile.d/conda.sh
としておきます.
次に MMseqs2 の実行環境を作ります
[root@rockylinux8 ~]# conda create -n mmseqs2 mmseqs2 -c bioconda -c conda-forge
:
# To activate this environment, use
#
# $ conda activate mmseqs2
#
# To deactivate an active environment, use
#
# $ conda deactivate
[root@rockylinux8 ~]#
(確認)
[root@rockylinux8 ~]# conda activate mmseqs2
(mmseqs2) [root@rockylinux8 ~]#
(mmseqs2) [root@rockylinux8 ~]# conda list
# packages in environment at /apps/pyenv/versions/anaconda3-2024.10-1/envs/mmseqs2:
#
# Name Version Build Channel
_libgcc_mutex 0.1 conda_forge conda-forge
_openmp_mutex 4.5 2_gnu conda-forge
aria2 1.23.0 0 bioconda
bzip2 1.0.8 h4bc722e_7 conda-forge
c-ares 1.11.0 h470a237_1 bioconda
ca-certificates 2024.12.14 hbcca054_0 conda-forge
gawk 5.3.1 hcd3d067_0 conda-forge
gmp 6.3.0 hac33072_2 conda-forge
libasprintf 0.22.5 he8f35ee_3 conda-forge
libgcc 14.2.0 h77fa898_1 conda-forge
libgcc-ng 14.2.0 h69a702a_1 conda-forge
libgettextpo 0.22.5 he02047a_3 conda-forge
libgomp 14.2.0 h77fa898_1 conda-forge
libiconv 1.17 hd590300_2 conda-forge
liblzma 5.6.3 hb9d3cd8_1 conda-forge
libsqlite 3.48.0 hee588c1_1 conda-forge
libssh2 1.10.0 haa6b8db_3 conda-forge
libstdcxx 14.2.0 hc0a3c3a_1 conda-forge
libstdcxx-ng 14.2.0 h4852527_1 conda-forge
libxml2 2.13.5 h0d44e9d_1 conda-forge
libzlib 1.3.1 hb9d3cd8_2 conda-forge
mmseqs2 17.b804f hd6d6fdc_1 bioconda
mpfr 4.2.1 h90cbb55_3 conda-forge
ncurses 6.5 h2d0b736_2 conda-forge
openssl 1.1.1w hd590300_0 conda-forge
readline 8.2 h8228510_1 conda-forge
sqlite 3.48.0 h9eae976_1 conda-forge
zlib 1.3.1 hb9d3cd8_2 conda-forge
(mmseqs2) [root@rockylinux8 ~]#
condaなのでpythonが入っている..って訳ではない.
EnvironmentModulesはこんな感じで
[root@rockylinux8 ~]# cat /apps/modulefiles/mmseqs2
#%Module1.0
set root /apps/pyenv/versions/anaconda3-2024.10-1/envs/mmseqs2
prepend-path PATH $root/bin
[root@rockylinux8 ~]#
なので、使う際には
[illya@rockylinux8 ~]$ module use /apps/modulefiles/
[illya@rockylinux8 ~]$ module load mmseqs2
使う際は