Kod JavaScript umożliwiający utworzenie aplikacji do rozpoznawania mowy dla ChatGPT?
Aby utworzyć aplikację z rozpoznawaniem głosu, możesz użyć interfejsu API rozpoznawania mowy w sieci Web, dostępne w nowoczesnych przeglądarkach. Oto przykład kodu w HTML i JavaScript tworzącego prostą aplikację rozpoznającą głos użytkownika i wyświetlającą transkrybowany tekst:
htmlSkopiuj kod
<!DOCTYPE html>
<html>
<head>
<title>Riconoscimento Vocale</title>
</head>
<body>
<h1>Riconoscimento Vocale</h1>
<button id="start-recognition">Avvia Riconoscimento</button>
<div id="transcription"></div>
<script>
// Controlla se il browser supporta l'API di riconoscimento vocale
if ('webkitSpeechRecognition' in window) {
const recognition = new webkitSpeechRecognition();
// Imposta alcune opzioni per il riconoscimento
recognition.continuous = true;
recognition.interimResults = true;
recognition.lang = 'it-IT'; // Puoi impostare la lingua desiderata
const startButton = document.getElementById('start-recognition');
const transcription = document.getElementById('transcription');
startButton.addEventListener('click', function() {
startButton.disabled = true;
recognition.start();
});
// Gestisci i risultati del riconoscimento
recognition.onresult = function(event) {
const result = event.results[event.results.length - 1];
const transcript = result[0].transcript;
transcription.innerHTML = transcript;
};
// Gestisci gli errori
recognition.onerror = function(event) {
console.error('Errore di riconoscimento vocale:', event.error);
};
// Termina il riconoscimento quando si preme il pulsante di avvio nuovamente
recognition.onend = function() {
startButton.disabled = false;
};
} else {
alert('Il tuo browser non supporta l\'API di riconoscimento vocale.');
}
</script>
</body>
</html>
W tym przykładzie, mamy przycisk “Rozpocznij rozpoznawanie” który po naciśnięciu uruchamia interfejs API rozpoznawania mowy. Transkrypcja tekstu pojawi się w elemencie <div>
identyfikator oszustwa “transkrypcja”. Możesz dostosować język, ustawiając recognition.lang
na żądanym języku.
Upewnij się, że używasz tego kodu w środowisku obsługującym interfejs API rozpoznawania mowy w sieci Web, jak nowoczesna przeglądarka. Należy pamiętać, że doświadczenie użytkownika może się różnić w zależności od przeglądarki i wybranego języka.
Z jakimi przeglądarkami jest kompatybilny ten przykład??
Przykład rozpoznawania mowy podany w mojej poprzedniej wiadomości korzysta z interfejsu API webkitSpeechRecognition
, który jest specyficzny dla przeglądarki Chrome. Dlatego, ten konkretny przykład będzie kompatybilny tylko z przeglądarką Google Chrome.
Jednakże, Należy pamiętać, że zgodność z interfejsem API rozpoznawania mowy różni się w zależności od przeglądarki i jej wersji. Aby zapewnić kompatybilność z szerszą gamą przeglądarek, możesz użyć standardowego interfejsu API rozpoznawania mowy (SpeechRecognition
) zamiast webkitSpeechRecognition
. Oto przykład modyfikacji kodu w celu korzystania ze standardowego interfejsu API:
javascriptKopiuj kod
if ('SpeechRecognition' in window || 'webkitSpeechRecognition' in window) {
const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
const recognition = new SpeechRecognition();
// ...
}
Za pomocą window.SpeechRecognition || window.webkitSpeechRecognition
, możesz obsługiwać przeglądarki korzystające ze standardowego API (Na przykład, Firefoksa) oraz te korzystające z wersji z przedrostkiem webkit (przyjdź do Chrome).
Jednakże, Należy pamiętać, że implementacja API i obsługa języków mogą się różnić w zależności od przeglądarki. Dlatego, Ważne jest, aby dokładnie przetestować rozpoznawanie mowy w różnych przeglądarkach, aby zapewnić użytkownikom najlepszą możliwą wygodę.
Które przeglądarki obsługują rozpoznawanie mowy?
We wrześniu 2021, API rozpoznawania mowy (SpeechRecognition
) był obsługiwany przez kilka przeglądarek, ale konkretna obsługa może się różnić w zależności od przeglądarki i platformy. Poniżej znajdują się niektóre z głównych przeglądarek obsługujących ten interfejs API:
- GoogleChrome: Chrome dobrze obsługuje interfejs API rozpoznawania mowy. Interfejs API został wprowadzony w przeglądarce Chrome 25 a wsparcie było z biegiem czasu stale udoskonalane.
- Mozilla Firefox: Firefox zaczął wspierać interfejs API rozpoznawania mowy począwszy od wydania 44. Jednakże, wsparcie może wymagać ręcznej aktywacji w ustawieniach przeglądarki.
- Microsoft Edge’a: Microsoft Edge zaczął także wspierać API rozpoznawania mowy. Wsparcie może się różnić w zależności od wersji przeglądarki.
- Safari: Safari firmy Apple obsługuje interfejs API rozpoznawania mowy na platformach takich jak iOS.
- Opera: Opera oferuje także wsparcie dla API rozpoznawania mowy, ale konkretne wsparcie może się różnić w zależności od wersji.
Należy pamiętać, że obsługa konkretnego języka i funkcji może się różnić w zależności od przeglądarki. Ponadto, Przeglądarki mobilne, takie jak Chrome i Safari, często obsługują interfejs API rozpoznawania mowy na urządzeniach mobilnych.
Ponieważ obsługa przeglądarek może z czasem ulec zmianie wraz z wprowadzeniem nowych wersji i standardów, Zalecam sprawdzenie dokumentacji przeglądarki i dokładne przetestowanie interfejsu API w konkretnych przeglądarkach, które zamierzasz obsługiwać.