รหัส JavaScript เพื่อสร้างแอปรู้จำคำพูดสำหรับ ChatGPT?
เพื่อสร้างแอปที่มีการจดจำเสียง, คุณสามารถใช้ Web Speech Recognition API ได้, มีอยู่ในเบราว์เซอร์สมัยใหม่. นี่คือตัวอย่างโค้ดใน HTML และ JavaScript เพื่อสร้างแอปง่ายๆ ที่จดจำเสียงของผู้ใช้และแสดงข้อความที่ถอดเสียง:
htmlคัดลอกโค้ด
<!DOCTYPE html>
<html>
<head>
<title>Riconoscimento Vocale</title>
</head>
<body>
<h1>Riconoscimento Vocale</h1>
<button id="start-recognition">Avvia Riconoscimento</button>
<div id="transcription"></div>
<script>
// Controlla se il browser supporta l'API di riconoscimento vocale
if ('webkitSpeechRecognition' in window) {
const recognition = new webkitSpeechRecognition();
// Imposta alcune opzioni per il riconoscimento
recognition.continuous = true;
recognition.interimResults = true;
recognition.lang = 'it-IT'; // Puoi impostare la lingua desiderata
const startButton = document.getElementById('start-recognition');
const transcription = document.getElementById('transcription');
startButton.addEventListener('click', function() {
startButton.disabled = true;
recognition.start();
});
// Gestisci i risultati del riconoscimento
recognition.onresult = function(event) {
const result = event.results[event.results.length - 1];
const transcript = result[0].transcript;
transcription.innerHTML = transcript;
};
// Gestisci gli errori
recognition.onerror = function(event) {
console.error('Errore di riconoscimento vocale:', event.error);
};
// Termina il riconoscimento quando si preme il pulsante di avvio nuovamente
recognition.onend = function() {
startButton.disabled = false;
};
} else {
alert('Il tuo browser non supporta l\'API di riconoscimento vocale.');
}
</script>
</body>
</html>
In questo esempio, abbiamo un pulsante “Avvia Riconoscimento” che avvia l’API di riconoscimento vocale quando premuto. Il testo trascritto verrà visualizzato nell’elemento <div>
con id “transcription”. Puoi personalizzare la lingua impostando recognition.lang
sulla lingua desiderata.
Assicurati di utilizzare questo codice in un ambiente con supporto per l’API Web Speech Recognition, come un browser moderno. Nota che l’esperienza utente può variare in base al browser e alla lingua selezionata.
Con quali browser é compatibile questo esempio?
L’esempio di riconoscimento vocale fornito nel mio messaggio precedente utilizza l’API webkitSpeechRecognition
, che è specifica per il browser Chrome. Pertanto, questo specifico esempio sarà compatibile solo con il browser Google Chrome.
Tuttavia, è importante notare che la compatibilità con l’API di riconoscimento vocale varia tra i browser e le versioni. Per garantire la compatibilità con una gamma più ampia di browser, puoi utilizzare l’API di riconoscimento vocale standard (SpeechRecognition
) anziché webkitSpeechRecognition
. Ecco un esempio di come puoi modificare il codice per utilizzare l’API standard:
javascriptCopy code
if ('SpeechRecognition' in window || 'webkitSpeechRecognition' in window) {
const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
const recognition = new SpeechRecognition();
// ...
}
Utilizzando window.SpeechRecognition || window.webkitSpeechRecognition
, puoi supportare i browser che utilizzano l’API standard (ad esempio, Firefox) e quelli che utilizzano la versione con prefisso webkit (come Chrome).
Tuttavia, tieni presente che l’implementazione dell’API e il supporto delle lingue possono variare da browser a browser. Pertanto, è importante testare attentamente il riconoscimento vocale in diversi browser per garantire la migliore esperienza utente possibile.
Quali sono i browser che supportano SpeechRecognition?
Al settembre 2021, l’API di riconoscimento vocale (SpeechRecognition
) era supportata da diversi browser, ma il supporto specifico poteva variare a seconda del browser e della piattaforma. Di seguito sono elencati alcuni dei principali browser che supportavano questa API:
- Google Chrome: Chrome ha un buon supporto per l’API di riconoscimento vocale. La API è stata introdotta in Chrome 25 e il supporto è stato costantemente migliorato nel tempo.
- Mozilla Firefox: Firefox ha iniziato a supportare l’API di riconoscimento vocale a partire dalla versione 44. Tuttavia, il supporto potrebbe richiedere l’attivazione manuale nelle impostazioni del browser.
- Microsoft Edge: Anche Microsoft Edge ha iniziato a supportare l’API di riconoscimento vocale. Il supporto potrebbe variare a seconda delle versioni del browser.
- Safari: Safari di Apple supporta l’API di riconoscimento vocale su piattaforme come iOS.
- Opera: Anche Opera offre un supporto per l’API di riconoscimento vocale, ma il supporto specifico potrebbe variare in base alla versione.
È importante notare che il supporto specifico per lingue e funzionalità potrebbe variare tra i browser. Inoltre, i browser mobili come Chrome e Safari spesso supportano l’API di riconoscimento vocale su dispositivi mobili.
Poiché il supporto dei browser può cambiare nel tempo con l’introduzione di nuove versioni e standard, ti consiglio di verificare la documentazione dei browser e testare attentamente l’API sui browser specifici che intendi supportare.