Macの音声入力を試してみた
スマホを使って自分の英語が正確に認識されるか?みたいなのを観た。
そう言えば某番組で「滑舌悪い選手権」みたいな企画もあったよね。
それでふと気になって初めて音声入力を試してみました。
システム環境設定を探すと・・・これだね、「音声入力と読み上げ」。
「言語」から「カスタマイズ」を選んで英語(アメリカ合衆国)を追加。
必要なデータがダウンロードされるのをしばし待つ。
オフラインで利用するので「拡張音声入力を使用」にチェック。
準備が整ったら適当なテキストエディタを立ち上げて、
設定してあったショートカット(fnキーを2回)を叩く。
おぉ!なんかマイクっぽいアイコンが出て入力待ちに!
いざ!
若干ドキドキしながら喋ってみると、
girl とか world はいけたけど rule とかがダメ。
right はいけるけど light がいけない。なんで? night ちゃう!(笑)
S**t!
・・・思わず口走ったその言葉はちゃんと入力されました。(^^;
Turn off the light. みたいな文章にすると認識されやすいみたい。
それもそれでなんか凄い。
ちと感動。
認識精度ってどうなんだろう?
しばらく遊んでいた後に、認識精度が気になった。
(自分の発音が悪いのを棚に上げたわけではありませんw)
そうか、ネイティブが話している映像の音声を直接認識させればその程度が分かるはず。
ということで適当な動画を用意。
さて、次はその音声を直接流し込めるようにすればいい。
・・・ん?
システム環境設定から、ミキシングの項目が無いかサウンド設定あたりを探すも見つからない。
さて困った。
必要なソフトウエアをインストール
仮想オーディオデバイス「Soundflower」
調べると仮想オーディオデバイスを追加してくれる「Soundflower」というソフトがあるらしい。
早速インストール。
デバイスに「Soundflower(2ch)」、「Soundflower(64ch)」という二つのチャンネルが追加された。
素晴らしい。
映像はVLCで再生、オーディオデバイスの設定から出力先を「Soundflower(2ch)」へ変更。
音声入力のソースを「マイク入力」から同じく「Soundflower(2ch)」へ。
テキストエディタを開いて待機、映像を再生したらすかさずショートカットキーで有効化!
おぉ、出来た!
・・・けどスピーカーから音が出ないからよくわからん。(笑
サウンドミキサー「LadioCast」
ググるとサウンドミキサーソフトで「LadioCast」というのがあるらしい。
App Storeから早速インストール。
※ちなみにアプリケーション > ユーティリティにある、「Audio MIDI 設定」からも同様の設定が可能です。
但し「LadioCast」の方が音声レベルを細かく設定できるようです。
これで「Soundflower(2ch)」に流したサウンドを、内蔵スピーカーへも流せるはず。
音声入力時のミュート設定を解除
さぁいざ!・・・と思ったら何故か音が出ません。
ちゃんと設定してあるのになぁ。
音声入力をオンにした途端にミュートされてしまう。
む〜。
しばらく試行錯誤した結果、入力時にミュートされるのは仕様だと判明。
このままでは内蔵スピーカーへと流すよう設定してもムリなようです。
ターミナルからその設定を変更します。
//音声入力時のミュート解除 defaults write com.apple.SpeechRecognitionCore AllowAudioDucking -bool NO defaults write com.apple.speech.recognition.AppleSpeechRecognition.prefs DictationIMAllowAudioDucking -bool NO //音声入力時にミュート(戻す) defaults delete com.apple.SpeechRecognitionCore AllowAudioDucking defaults delete com.apple.speech.recognition.AppleSpeechRecognition.prefs DictationIMAllowAudioDucking
これで無事スピーカーからも音が出るようになりました。
結果&まとめ
実際にネイティブスピーカーの英語を直接音声入力に流し込んでみたところ、
そこそこ精度は出ているのですが、やはり頻繁に間違いは出てきます。
完璧とは言えないようです。まぁ仕方ないとは思いますけど。
でもここまで出来ちゃうようになったのはやっぱり凄い。
結果的にはネイティブの英語で、しかも人間が聞いてもちゃんと分かる所で間違っているのを見ると、
認識されなかったのは自分の発音が原因だとは言えないようです。
あれ?そうとも言えない?(笑
でもまぁあれですよ。
あまり発音だけ気にしても仕方ないですしね。
アクセントなんてネイティブスピーカーでもイギリス、アメリカ、カナダ、オーストラリアなど様々ですし、
むしろそのアクセントがアイデンティティになるわけですから。
・・・某youtuberさんの動画からの受け売りですけど!w
でもまぁ、実際試してみると面白いです。
正直、OSもMavericksだし最新の情報でもないので、今更感が若干否めませんが、
誰かにとって何かのヒントになったりしたら嬉しいので書いてみました。
ぜひお試しあれ。
コメント