ibm-watson-cognitive Trascrizione di un file audio tramite WebSockets (Node.js)


Esempio

Questo esempio mostra come utilizzare il servizio Watson Discorso in testo di IBM per riconoscere il tipo di file audio e produrre una trascrizione del testo parlato in quel file.

Questo esempio richiede credenziali del servizio vocale e Node.js

  1. Installa il modulo npm per l' SDK Node.js per Watson Developer Cloud :
$ npm install watson-developer-cloud
  1. Creare un file JavaScript (ad esempio, app.js ) e copiare il seguente codice in esso. Assicurati di inserire il username e la password per l'istanza del servizio vocale al testo.
var SpeechToTextV1 = require('watson-developer-cloud/speech-to-text/v1');
var fs = require('fs');

var speech_to_text = new SpeechToTextV1({
  username: 'INSERT YOUR USERNAME FOR THE SERVICE HERE',
  password: 'INSERT YOUR PASSWORD FOR THE SERVICE HERE',
  url: 'https://stream.watsonplatform.net/speech-to-text/api'
});

var params = {
  content_type: 'audio/flac'
};

// Create the stream,
var recognizeStream = speech_to_text.createRecognizeStream(params);

// pipe in some audio,
fs.createReadStream('0001.flac').pipe(recognizeStream);

// and pipe out the transcription.
recognizeStream.pipe(fs.createWriteStream('transcription.txt'));

// To get strings instead of Buffers from received `data` events:
recognizeStream.setEncoding('utf8');

// Listen for 'data' events for just the final text.
// Listen for 'results' events to get the raw JSON with interim results, timings, etc.   
['data', 'results', 'error', 'connection-close'].forEach(function(eventName) {
  recognizeStream.on(eventName, console.log.bind(console, eventName + ' event: '));
});
  1. Salvare il file audio di esempio 0001.flac nella stessa directory. Questo codice di esempio è impostato per elaborare i file FLAC , ma è possibile modificare la sezione params del codice di esempio per ottenere le trascrizioni da file audio in altri formati. I formati supportati includono WAV (tipo audio/wav ), OGG (tipo audio/ogg ) e altri. Vedi il riferimento dell'API al testo dell'API per un elenco completo.

  2. Esegui l'applicazione (usa il nome del file che contiene il codice di esempio)

$ node app.js

Dopo aver eseguito l'applicazione, troverai il testo trascritto dal tuo file audio nel file transcription.txt nella directory da cui hai eseguito l'applicazione.