ナレーション、語学教材作成、VTuber・faceless YouTubeチャンネルまで対応可能!無料でお試しいただけます。 近年、AI技術の進化に伴い、動画制作やコンテンツ配信の現場では音声生成の活用が急速に広がっています。
杉田 (@ane45) です。2024年12月の 「Python Monthly Topics」 は、OpenAIの音声認識モデルWhisperをPythonから使用する方法を解説します。さらに、Whisperモデルを基にした派生ツールやライブラリであるwhisper. cpp、faster-whisper、mlx-whisperについても紹介します。 Whisperとは ...
【プレスリリース】発表日:2026年02月26日さくらインターネット、生成AI向け推論API基盤「さくらのAI Engine」にて「音声合成(TTS)API」を提供開始〜OICEVOX音声モデル対応により、音声入力・会話生成・音声合成の一連処理が国内基盤で完結〜*参考画像は添付の関連資料を参照音声合成(Text to Speech)は、入力したテキストを音声として出力する音声生成技術 ...
IBMは、お客様が求める高性能かつエンタープライズ・グレードの文字起こしおよびリアルタイム字幕機能へのニーズに対応するため、Deepgram社の技術をwatsonx ...
「Whisper」は、ChatGPTで有名なOpenAIが公開しているオープンソースの音声認識モデルだ。高精度な音声認識モデルで、英語だけでなく日本語を含めた多言語の音声をテキストに変換できる。ノイズの多い環境でも高い認識精度を誇り、議事録作成や字幕生成 ...
NTTテクノクロス株式会社(本社:東京都港区、代表取締役社長:岡敦子、以下「NTTテクノクロス」)は、テキストデータを自然な音声で読み上げるAI音声や、特定の話者の声を再現してオリジナルのAI音声を生成する音声合成プロダクト「FutureVoice」の新 ...
NTTテクノクロス株式会社は3日、テキストデータを自然な音声で読み上げるAI音声や、特定の話者の声を再現してオリジナルのAI音声を生成する音声合成プロダクト「FutureVoice」の新版を提供開始したと発表した。 FutureVoiceは、さまざまな分野の「声」に活用 ...
~選べるAI音声の拡充に加え、オリジナルのAI音声が自社で生成可能に~ NTTテクノクロス株式会社(本社:東京都港区、代表取締役社長:岡敦子、以下「NTTテクノクロス」)は、テキストデータを自然な音声で読み上げるAI音声や、特定の話者の声を再現して ...
RECAIUS音声合成ミドルウェア「ToSpeak」シリーズのAI学習モデル(声辞書)が、声の権利を大切に扱う音声AI事業に対する認証「AILAS事業登録認証」を取得 東芝デジタルソリューションズ株式会社(本社:神奈川県川崎市、取締役社長:島田 太郎、以下 当社 ...
NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)とシャープは、エッジコンピューティングにおけるAI映像データ処理の普及拡大を目的にPythonコードによるAIデバイス向け高位合成ツール(HLS: High-Level Synthesis)をApache License 2.0のOSSで公開した ...
「音声合成」に関する情報が集まったページです。 ドコモAI社長が記者会見を行う日は到来するのだろうか――。NTTドコモの前田義晃社長を模したAIアバター「アバター前田社長」は、すでに社内でキャリア相談に活用されている。見た目は本物そっくりで ...
RECAIUS音声合成ミドルウェア「ToSpeak」のハイエンド機器向けラインアップを強化 ~より自然で人の声に近い音質を実現するDNN方式音声合成「ToSpeakHx」シリーズの提供を開始~ 東芝デジタルソリューションズ株式会社(本社:神奈川県川崎市、取締役社長 ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する