Select Your Language

免責事項

  • 本サイトの情報の利用、内容、サービスによって、利用者にいかなる損害、被害が生じても、著者は一切の責任を負いません。ユーザーご自身の責任においてご利用いただきますようお願いいたします。

    本サイトで頒布している基板およびキットは、技術者、またはそれに準ずる電気的知識をお持ちの電子工作ファンの方のためのものです。一般のオーディオファンの方のためのものではありません。
    また、頒布基板およびキットは、いかなる条件でも動作を保証するものではございませんので、あらかじめご了承ください。

    電子工作では、火傷、感電、火災などの可能性があります。十分に注意をして作業して下さい。

    営利目的のご使用は認めておりません。 記事の転載や、基板・キットの商用利用の方は、ご連絡ください。学生やサークルの学習目的でまとめてご購入する場合は特別価格でご提供させていただきます。
無料ブログはココログ

スポンサー

« emerge+ さんが7月末で閉店 | トップページ | 半導体以外の部品もいろいろと入手しにくくなっています »

2021年6月23日 (水)

日本語のAIナレーション

先日、HPA-1000の解説動画を作ったのですが、その中で文章を読んでもらうスピーチソフトをどうしようかと迷いました。

まあ、自分で読むのもひとつの手です。けど滑舌の悪いナレーションよりもスピーチソフトに任せた方が見やすいだろうと思ったのです。

Ppt01

調べてみると、パワーポイントに読んでもらう方法がある。みたい。

マイクロソフトには、コルタナさんというAI 音声認識+音声合成ソフトがあり、活用している人も多いはず(私は使ってない)なのでこれは間違いない!

と思ったのです。

 

 

 

ですが。、

ですが。。。

かなり酷いイントネーション。

これはYoutube動画でよくある棒読みちゃんよりも酷い。ような気がする。

 

 

という訳で、一旦、youtubeにUPした動画をボツにして、Amazon Pollyに読んでもらうことにしました。

Ppt02

実は、Pollyはトラ技の記事にしたこともあったという、いわば旧友のようなものです(笑)

ラズパイで、ネット上から天気予報などのテキスト情報(JSON形式)を持ってきてAmazon Pollyの APIを叩いて音声に変換(mp3ダウンロード)後、mpg123でラズパイのハイレゾDACから再生するという、何というか他人同士をくっつけて自分自身は何も難しいことはしないというプログラムを作って記事にしたものでした。一応、ボタン操作から2~3秒遅れで天気予報を音声で伝えてくれます。(ロケーションはあらかじめプログラムに入れておきます)

 

2017年当時、日本語対応したばかりのPollyはあまり有名ではなかったのですが、AIを活用して流暢な日本語ナレーションをしてくれていました。

当時は今回は女性のみでしたので、今回は男性を選びました。

こんな感じです。

 

マイクロソフトの方と比較できたらもっと違いが分かりやすかったかもしれないですが、ボツにしちゃいました。

 

 

HPA-1000の動画をあれこれ作ってもアンプ自体の特性も音も変わりませんが、設計時に狙ったことをちゃんと説明するのも大切だと思います。

 

にほんブログ村 PC家電ブログ PCオーディオへ にほんブログ村

ブログランキングに参加中です。 めざせ1位! 

もしよろしければ「ぽちっと」お願いします。 

 

« emerge+ さんが7月末で閉店 | トップページ | 半導体以外の部品もいろいろと入手しにくくなっています »

コメント

リニアリティとNFBの事を的確かつサラッと説明されていて、
とても爽快感があります。

「NFBがなければ良い音である」という念仏を最近よく聞くので
ふむぅ!?な気持ちになることがしばしば。

拙動画チャネルでは、「音読さん」というフリーのwebサービスを利用していましたが、読点・句読点、拗音・促音、タイミング調整などを工夫してもやはりイントネーションの不自然さが解消できなかったので、ナレーションは諦めてBGMを流すことにしました。

いや〜、自分の声を聞きたくないって、本当にわかります。

hpa-1000の解説動画ですが、とても興味深く拝見しました。
つい先日、hpa-1000とprt-03の基盤を購入した身として、
たかじんさんの設計思想をより詳しく知れた事を嬉しく思います😃

ところで、hpa-1000用のRコアトランスの第4回募集の可能性はありますでしょうか?
必要な方にはもう行き渡っているのかも知れませんが...

sawanoriichi さん

NFB部分の説明は、あとからみると肝心な部分が抜けていました。 僅かなNFBも2段目からかけていて、最終段からのオーバーオールNFBはない回路になってます。

ただ、NFBをかけたから音が悪い。という訳ではないと思います。
出力段がしょぼいのにNFBで誤魔化してしまうアンプは、特性だけ良くても音に結びついていない。という事は起こりえると思います。


三毛にゃんジェロさん

前後の文脈が絡むので、正確なイントネーションは難しいんでしょうね。 テロップで少しだけ説明を加えて済むような動画ならナレーションを入れる必要はないと思っています。 特に短い動画であれば。
自分の声って、どうにも違和感があってダメです。。。


あみのんさん

ありがとうございます。
そうですね。 夏休みの工作に合わせて7月くらいに一度募集をかけてみるのも良いかもしれません。 昨年から銅が高騰し続けているため、価格は少し上昇してしまうと思われます。あとは人数次第ですね。

コメントを書く

(ウェブ上には掲載しません)

« emerge+ さんが7月末で閉店 | トップページ | 半導体以外の部品もいろいろと入手しにくくなっています »

サイト内検索(new)

2021年9月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30