Kod JavaScript umożliwiający utworzenie aplikacji do rozpoznawania mowy dla ChatGPT?

Za pomocą admin11 Październik 16, 2023

Kod JavaScript umożliwiający utworzenie aplikacji do rozpoznawania mowy dla ChatGPT?

Aby utworzyć aplikację z rozpoznawaniem głosu, możesz użyć interfejsu API rozpoznawania mowy w sieci Web, dostępne w nowoczesnych przeglądarkach. Oto przykład kodu w HTML i JavaScript tworzącego prostą aplikację rozpoznającą głos użytkownika i wyświetlającą transkrybowany tekst:

htmlSkopiuj kod

<!DOCTYPE html>
<html>
<head>
    <title>Riconoscimento Vocale</title>
</head>
<body>
    <h1>Riconoscimento Vocale</h1>
    
    <button id="start-recognition">Avvia Riconoscimento</button>
    <div id="transcription"></div>

    <script>
        // Controlla se il browser supporta l'API di riconoscimento vocale
        if ('webkitSpeechRecognition' in window) {
            const recognition = new webkitSpeechRecognition();

            // Imposta alcune opzioni per il riconoscimento
            recognition.continuous = true;
            recognition.interimResults = true;
            recognition.lang = 'it-IT'; // Puoi impostare la lingua desiderata

            const startButton = document.getElementById('start-recognition');
            const transcription = document.getElementById('transcription');

            startButton.addEventListener('click', function() {
                startButton.disabled = true;
                recognition.start();
            });

            // Gestisci i risultati del riconoscimento
            recognition.onresult = function(event) {
                const result = event.results[event.results.length - 1];
                const transcript = result[0].transcript;
                transcription.innerHTML = transcript;
            };

            // Gestisci gli errori
            recognition.onerror = function(event) {
                console.error('Errore di riconoscimento vocale:', event.error);
            };

            // Termina il riconoscimento quando si preme il pulsante di avvio nuovamente
            recognition.onend = function() {
                startButton.disabled = false;
            };
        } else {
            alert('Il tuo browser non supporta l\'API di riconoscimento vocale.');
        }
    </script>
</body>
</html>

W tym przykładzie, mamy przycisk “Rozpocznij rozpoznawanie” który po naciśnięciu uruchamia interfejs API rozpoznawania mowy. Transkrypcja tekstu pojawi się w elemencie <div> identyfikator oszustwa “transkrypcja”. Możesz dostosować język, ustawiając recognition.lang na żądanym języku.

Upewnij się, że używasz tego kodu w środowisku obsługującym interfejs API rozpoznawania mowy w sieci Web, jak nowoczesna przeglądarka. Należy pamiętać, że doświadczenie użytkownika może się różnić w zależności od przeglądarki i wybranego języka.

Z jakimi przeglądarkami jest kompatybilny ten przykład??

Przykład rozpoznawania mowy podany w mojej poprzedniej wiadomości korzysta z interfejsu API webkitSpeechRecognition, który jest specyficzny dla przeglądarki Chrome. Pertanto, ten konkretny przykład będzie kompatybilny tylko z przeglądarką Google Chrome.

Tuttavia, Należy pamiętać, że zgodność z interfejsem API rozpoznawania mowy różni się w zależności od przeglądarki i jej wersji. Aby zapewnić kompatybilność z szerszą gamą przeglądarek, możesz użyć standardowego interfejsu API rozpoznawania mowy (SpeechRecognition) zamiast webkitSpeechRecognition. Oto przykład modyfikacji kodu w celu korzystania ze standardowego interfejsu API:

javascriptKopiuj kod

if ('SpeechRecognition' in window || 'webkitSpeechRecognition' in window) {
    const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
    const recognition = new SpeechRecognition();
    // ...
}

Za pomocą window.SpeechRecognition || window.webkitSpeechRecognition, możesz obsługiwać przeglądarki korzystające ze standardowego API (Na przykład, Firefoksa) oraz te korzystające z wersji z przedrostkiem webkit (przyjdź do Chrome).

Tuttavia, Należy pamiętać, że implementacja API i obsługa języków mogą się różnić w zależności od przeglądarki. Pertanto, Ważne jest, aby dokładnie przetestować rozpoznawanie mowy w różnych przeglądarkach, aby zapewnić użytkownikom najlepszą możliwą wygodę.

Które przeglądarki obsługują rozpoznawanie mowy?

We wrześniu 2021, API rozpoznawania mowy (SpeechRecognition) był obsługiwany przez kilka przeglądarek, ale konkretna obsługa może się różnić w zależności od przeglądarki i platformy. Poniżej znajdują się niektóre z głównych przeglądarek obsługujących ten interfejs API:

GoogleChrome: Chrome dobrze obsługuje interfejs API rozpoznawania mowy. Interfejs API został wprowadzony w przeglądarce Chrome 25 a wsparcie było z biegiem czasu stale udoskonalane.
Mozilla Firefox: Firefox zaczął wspierać interfejs API rozpoznawania mowy począwszy od wydania 44. Tuttavia, wsparcie może wymagać ręcznej aktywacji w ustawieniach przeglądarki.
Microsoft Edge’a: Microsoft Edge zaczął także wspierać API rozpoznawania mowy. Wsparcie może się różnić w zależności od wersji przeglądarki.
Safari: Safari firmy Apple obsługuje interfejs API rozpoznawania mowy na platformach takich jak iOS.
Opera: Opera oferuje także wsparcie dla API rozpoznawania mowy, ale konkretne wsparcie może się różnić w zależności od wersji.

Należy pamiętać, że obsługa konkretnego języka i funkcji może się różnić w zależności od przeglądarki. Ponadto, Przeglądarki mobilne, takie jak Chrome i Safari, często obsługują interfejs API rozpoznawania mowy na urządzeniach mobilnych.

Ponieważ obsługa przeglądarek może z czasem ulec zmianie wraz z wprowadzeniem nowych wersji i standardów, Zalecam sprawdzenie dokumentacji przeglądarki i dokładne przetestowanie interfejsu API w konkretnych przeglądarkach, które zamierzasz obsługiwać.

O NAS

Nasza firma projektuje i tworzy wysoce spersonalizowane awatary do użytku korporacyjnego, wdrażając niezbędne oprogramowanie, aby uczynić je podobnymi do ludzi i osiągnąć swoje cele. Ci wirtualni ludzie mogą reprezentować marki, bądź rzecznikiem swojej firmy, być wykorzystywane przy tworzeniu filmów reklamowych, lub komunikuj się bezpośrednio z użytkownikami, rozmawiając z nimi i oferując swoje usługi poprzez wykorzystanie sztucznej inteligencji.