ibm-watson-cognitive音声をテキストに変換


備考

IBM Watson Speech to Textは、さまざまな言語とフォーマットのオーディオを転記するためのさまざまなオプションを提供します。

  • WebSockets - 継続的な転写のためにWebSocketプロトコルを介して永続的な接続を確立する

  • セッションレス - セッションの確立と維持のオーバーヘッドなしにオーディオを書き換えます

  • セッション - サービスとの長いマルチターン交換を作成する、またはサービスの特定のインスタンスとの複数のパラレルの会話を確立する

  • 非同期 - オーディオを転記するための非ブロッキングHTTPインターフェイスを提供します。ジョブの状態と結果を通知するコールバックURLを登録するか、サービスをポーリングしてジョブの状態を学習し、手動で結果を取得することができます。

Speech to Textやその他のWatsonサービスを開始する方法については、 「はじめに」のトピックを参照してください。 Speech to Textの詳細と例については、 APIリファレンスドキュメントを 参照してください。

音声をテキストに変換 関連する例