本家様 https://openai.com/ja-JP/index/whisper/
pipy https://pypi.org/project/openai-whisper/
文字起こしアプリ
mp3な音声データを取り込んでテキスト化してくれるツールみたい.
[root@rockylinux9 ~]# cat /etc/redhat-release
Rocky Linux release 9.6 (Blue Onyx)
[root@rockylinux9 ~]# cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX Open Kernel Module for x86_64 570.181 Release Build (dvs-builder@U22-I3-AF02-20-5) Wed Jul 30 18:41:07 UTC 2025
GCC version: gcc version 11.5.0 20240719 (Red Hat 11.5.0-5) (GCC)
[root@rockylinux9 ~]# ls -l /usr/local/cuda
ls: cannot access '/usr/local/cuda': No such file or directory
[root@rockylinux9 ~]#「pyenv/conda」環境
git clone https://github.com/yyuu/pyenv.git /apps/pyenv
export PYENV_ROOT=/apps/pyenv
export PATH=$PYENV_ROOT/bin:$PATH
pyenv install miniforge3-25.3.1-0
source /apps/pyenv/versions/miniforge3-25.3.1-0/etc/profile.d/conda.sh
(既に環境があるなら)
source /apps/pyenv/versions/miniforge3-25.3.1-0/etc/profile.d/conda.sh[root@rockylinux9 ~]# conda create -n whisper python=3.9
[root@rockylinux9 ~]# conda activate whisper
(whisper) [root@rockylinux9 ~]# pip install openai-whisper
(whisper) [root@rockylinux9 ~]# conda list
# packages in environment at /apps/pyenv/versions/miniforge3-25.3.1-0/envs/whisper:
#
# Name Version Build Channel
_libgcc_mutex 0.1 conda_forge conda-forge
_openmp_mutex 4.5 2_gnu conda-forge
bzip2 1.0.8 hda65f42_8 conda-forge
ca-certificates 2025.10.5 hbd8a1cb_0 conda-forge
certifi 2025.10.5 pypi_0 pypi
charset-normalizer 3.4.4 pypi_0 pypi
filelock 3.19.1 pypi_0 pypi
fsspec 2025.10.0 pypi_0 pypi
icu 75.1 he02047a_0 conda-forge
idna 3.11 pypi_0 pypi
importlib-metadata 8.7.0 pypi_0 pypi
jinja2 3.1.6 pypi_0 pypi
ld_impl_linux-64 2.44 h1aa0949_4 conda-forge
libexpat 2.7.1 hecca717_0 conda-forge
libffi 3.5.2 h9ec8514_0 conda-forge
libgcc 15.2.0 h767d61c_7 conda-forge
libgcc-ng 15.2.0 h69a702a_7 conda-forge
libgomp 15.2.0 h767d61c_7 conda-forge
liblzma 5.8.1 hb9d3cd8_2 conda-forge
libnsl 2.0.1 hb9d3cd8_1 conda-forge
libsqlite 3.51.0 hee844dc_0 conda-forge
libstdcxx 15.2.0 h8f9b012_7 conda-forge
libstdcxx-ng 15.2.0 h4852527_7 conda-forge
libuuid 2.41.2 he9a06e4_0 conda-forge
libxcrypt 4.4.36 hd590300_1 conda-forge
libzlib 1.3.1 hb9d3cd8_2 conda-forge
llvmlite 0.43.0 pypi_0 pypi
markupsafe 3.0.3 pypi_0 pypi
more-itertools 10.8.0 pypi_0 pypi
mpmath 1.3.0 pypi_0 pypi
ncurses 6.5 h2d0b736_3 conda-forge
networkx 3.2.1 pypi_0 pypi
numba 0.60.0 pypi_0 pypi
numpy 2.0.2 pypi_0 pypi
nvidia-cublas-cu12 12.8.4.1 pypi_0 pypi
nvidia-cuda-cupti-cu12 12.8.90 pypi_0 pypi
nvidia-cuda-nvrtc-cu12 12.8.93 pypi_0 pypi
nvidia-cuda-runtime-cu12 12.8.90 pypi_0 pypi
nvidia-cudnn-cu12 9.10.2.21 pypi_0 pypi
nvidia-cufft-cu12 11.3.3.83 pypi_0 pypi
nvidia-cufile-cu12 1.13.1.3 pypi_0 pypi
nvidia-curand-cu12 10.3.9.90 pypi_0 pypi
nvidia-cusolver-cu12 11.7.3.90 pypi_0 pypi
nvidia-cusparse-cu12 12.5.8.93 pypi_0 pypi
nvidia-cusparselt-cu12 0.7.1 pypi_0 pypi
nvidia-nccl-cu12 2.27.3 pypi_0 pypi
nvidia-nvjitlink-cu12 12.8.93 pypi_0 pypi
nvidia-nvtx-cu12 12.8.90 pypi_0 pypi
openai-whisper 20250625 pypi_0 pypi
openssl 3.5.4 h26f9b46_0 conda-forge
pip 25.2 pyh8b19718_0 conda-forge
python 3.9.23 hc30ae73_0_cpython conda-forge
readline 8.2 h8c095d6_2 conda-forge
regex 2025.11.3 pypi_0 pypi
requests 2.32.5 pypi_0 pypi
setuptools 80.9.0 pyhff2d567_0 conda-forge
sympy 1.14.0 pypi_0 pypi
tiktoken 0.12.0 pypi_0 pypi
tk 8.6.13 noxft_hd72426e_102 conda-forge
torch 2.8.0 pypi_0 pypi
tqdm 4.67.1 pypi_0 pypi
triton 3.4.0 pypi_0 pypi
typing-extensions 4.15.0 pypi_0 pypi
tzdata 2025b h78e105d_0 conda-forge
urllib3 2.5.0 pypi_0 pypi
wheel 0.45.1 pyhd8ed1ab_1 conda-forge
zipp 3.23.0 pypi_0 pypi
zstd 1.5.7 hb8e6e7a_2 conda-forge
(whisper) [root@rockylinux9 ~]#
(whisper) [root@rockylinux9 ~]# conda deactivate
[root@rockylinux9 ~]# dnf install ffmpeg-free
[root@rockylinux9 ~]# ffmpeg -version
ffmpeg version 5.1.4 Copyright (c) 2000-2023 the FFmpeg developers
built with gcc 11 (GCC)
:
:
libavutil 57. 28.100 / 57. 28.100
libavcodec 59. 37.100 / 59. 37.100
libavformat 59. 27.100 / 59. 27.100
libavdevice 59. 7.100 / 59. 7.100
libavfilter 8. 44.100 / 8. 44.100
libswscale 6. 7.100 / 6. 7.100
libswresample 4. 7.100 / 4. 7.100
libpostproc 56. 6.100 / 56. 6.100
[root@rockylinux9 ~]#「/apps/modulefiles/whisper」
#%Module1.0
set root /apps/pyenv/versions/miniforge3-25.3.1-0/envs/whisper
prepend-path PATH $root/binhttps://choimitena.com/Audio/Sample
からサンプルを入手して試してみた
[saber@rockylinux9 ~]$ module use /apps/modulefiles/
[saber@rockylinux9 ~]$ module load whisper
[saber@rockylinux9 ~]$
[saber@rockylinux9 ~]$ whisper /Public/sampleTokyo.wav --model medium --language ja
100%|■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■| 1.42G/1.42G [00:24<00:00, 61.9MiB/s]
[00:00.000 --> 00:07.280] 朝野ともみです 今日の東京株式市場で日経平均株価は小幅俗進となっています
[00:07.280 --> 00:16.120] 終わり値は昨日に比べ22円72,000高の11,088円58,000でした
[00:16.120 --> 00:23.480] 当初一部の値上がり名柄数は1,146 対して値下がりは368
[00:23.480 --> 00:29.560] 変わらずは104名柄となっています ここでプレゼントのお知らせです
[00:29.560 --> 00:36.280] この番組では毎月発行のマンスリーレポート4月号を 抽選で10名様にプレゼントいたします
[00:36.280 --> 00:46.080] お申し込みはお電話で東京030107-8373 030107-8373まで
[00:46.080 --> 00:50.040] 以上番組からのお知らせでした
[saber@rockylinux9 ~]$
[saber@rockylinux9 ~]$ whisper /Public/sampleSuper.mp3 --model medium --language ja
[00:00.880 --> 00:10.280] お買い物中の皆様こんにちは 皆様に楽しくお買い物をしていただくためにお願いがございます
[00:10.280 --> 00:17.920] 新型コロナウイルスは感染者が減ってきているとはいえ まだまだ収束したわけではありません
[00:17.920 --> 00:29.840] 感染が拡大しないようにできるだけマスクの着用をお願いします ショッピングに夢中になっているとついつい人との距離感を忘れてしまい
[00:29.840 --> 00:38.560] ます 密な状況をつくらないようお互いの距離を保ってお買い物してください
[00:39.000 --> 00:51.640] 各店舗の入り口にはアルコール消毒液が設置されています お買い物前とお買い物後には手指の消毒にご協力ください
[00:52.240 --> 01:06.520] マスクをつけていても人の多い売り場での席やすれ違い様の席は気持ちの良いものではありません 席へチケットを守ってショッピングをお楽しみください
[01:07.080 --> 01:16.560] また新しい生活様式を実践するため スタッフ従業員の健康チェックマスク着用
[01:16.560 --> 01:23.720] こまめな手洗いうがい消毒の励行 店舗内のこまめな換気
[01:23.720 --> 01:36.680] 随所に消毒用アルコールの設置 密閉密集密接を避けるなど各店舗で様々な対応をしています
[01:36.720 --> 01:46.680] 今後今まで以上に気を引き締めてご自身やご家族 大切な人を守る行動をお願いします
[01:46.680 --> 01:58.200] 感染拡大を防ぐためには皆さんお一人お一人の協力が必要です マナーを守って楽しいお買い物を
[01:58.200 --> 02:03.960] 皆様のご理解ご協力をお願いいたします
[saber@rockylinux9 ~]$
会議、ミーティング中の文言は拾えるかなぁ...