[Python]Whisperを使って音声データをテキストデータに書き起こす

2025年4月13日

dev-nanigashi

この作業が必要になった経緯

顧客トラブル等に必要になったため

前提と環境

Windows 10 / 11
NVIDIA RTX3070
Intel Core i7 第12世代
管理者権限あり
PowerShell 7を実行可能（Hyper.js使用）

やり方

１．Pythonをダウンロード/インストール

winget install -e --id Python.Python.3.12

２．仮想環境の作成

python -m venv whisper-env //仮想環境作成
whisper-env\Scripts\activate //アクティブ

３．pipとsetuptoolのアップグレード

pip install --upgrade pip setuptools //setuptoolのアプデ

４．Whisperのインストール

pip install openai-whisper

５．エディタで下記を[python transcribe.py]という名前で保存

import whisper

# Whisperモデルの読み込み
print("Loading model...")
model = whisper.load_model("base")

# 音声ファイルの書き起こし
print("Transcribing audio file...")
result = model.transcribe(r"C:\Users\owner\Documents\hoge.m4a", language="Japanese")

# 書き起こし結果の表示
print("Transcription complete:")
print(result["text"])

▼音声ファイル名に「書き起こし」を末尾に加えたテキストファイルに書き起こし結果を出力するようにスクリプト

import whisper
import os

# Whisperモデルの読み込み
print("Loading model...")
model = whisper.load_model("base")

# 音声ファイルのパス
audio_file_path = r"C:\\Users\\owner\\Documents\\hoge.m4a"

# 音声ファイルの書き起こし
print("Transcribing audio file...")
result = model.transcribe(audio_file_path, language="Japanese")

# 書き起こし結果の表示
transcription_text = result["text"]
print("Transcription complete:")
print(transcription_text)

# 音声ファイル名から拡張子を除去してテキストファイル名を作成し、末尾に「書き起こし」を加える
base_name = os.path.splitext(os.path.basename(audio_file_path))[0]
output_file_name = f"{base_name}_書き起こし.txt"

# 書き起こし結果をテキストファイルに保存
with open(output_file_name, 'w', encoding='utf-8') as file:
    file.write(transcription_text)

print(f"The transcription has been successfully written to {output_file_name}")

６．ffmpegをインストール

winget install ffmpeg

ffmpeg -version

７．仮想環境下で実行

python transcribe.py

URLをコピーしました！

URLをコピーしました！

Windows10の更新エラー（KB5034441）への対処法

この記事を書いた人

dev-nanigashi

関西在住。よくいるiPhoneユーザーなのにWindowsが好きなタイプ。小学生時代からタイピングするくせに技術力がつかなかった残念な人。本業はWEB媒体のグラフィックデザイン、LPデザインおよび構築、法人管理下のコーポレートサイトの保守、紙媒体の販促物デザインなどをするインハウスデザイナー。カルト✕ネズミ講２世、DV、リボ払い地獄、OD地獄、二度の鬱状態を経験。現在加療中。モンハンでちょうどいいタイミングで閃光玉を投げるとお尻が浮くほど気分良くなる。

[Python]Whisperを使って音声データをテキストデータに書き起こす

この作業が必要になった経緯

前提と環境

やり方

１．Pythonをダウンロード/インストール

２．仮想環境の作成

３．pipとsetuptoolのアップグレード

４．Whisperのインストール

５．エディタで下記を[python transcribe.py]という名前で保存

６．ffmpegをインストール

７．仮想環境下で実行

この記事を書いた人

コメント

コメントするコメントをキャンセル

[Python]Whisperを使って音声データをテキストデータに書き起こす

この作業が必要になった経緯

前提と環境

やり方

１．Pythonをダウンロード/インストール

２．仮想環境の作成

３．pipとsetuptoolのアップグレード

４．Whisperのインストール

５．エディタで下記を[python transcribe.py]という名前で保存

６．ffmpegをインストール

７．仮想環境下で実行

この記事を書いた人

関連記事

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル