Verwenden Sie Whisper, um Ihre Stimme kostenlos in mehrere Formate wortwörtlich zu transkribieren!

Praktische AI-TutorialsAktualisiert vor 7 Monaten AI-Austauschkreis

Müssen Sie häufig Sitzungsaufzeichnungen oder Interviews in Text umwandeln? Da das Schreiben von wortwörtlichen Transkripten zeit- und arbeitsintensiv ist, möchten Sie vielleicht KI-Tools verwenden, um Audioaufnahmen in Text umzuwandeln. In diesem Artikel stellen wir Ihnen Whisper vor, ein System zur automatischen Spracherkennung (ASR) des OpenAI-Teams. Laut der Beschreibung von OpenAI auf Github ist Whisper ein Open-Source-Spracherkennungsmodell, das derzeit etwa 96 Sprachen auf der ganzen Welt erkennt und in Text umwandelt. Was die Erkennungsgenauigkeit von Chinesisch angeht, hat Whisper ein ziemlich hohes Niveau erreicht. Als Ergebnis von Flüstern Da es sich um eine Open-Source-Technologie handelt, benötigen die Nutzer lediglich ein Google-Konto und einen Befehlscode, um die Anwendung einzurichten. Sobald Sie Whisper heruntergeladen und auf Ihrem Computer installiert haben, können Sie damit kostenlos und ohne Entwicklereinschränkungen Spracherkennungs- und Transkriptionsaufgaben durchführen.

Whisper Installationscode:!pip install git+https://github.com/openai/whisper.git
Ffmpeg-Installationscode:!sudo apt update && sudo apt install ffmpeg
Code zur Ausführung von Sprache in Text:!whisper "文件名（需要替换）.mp3" --model medium

Schritt 1: Melden Sie sich bei Ihrem Google-Konto an, öffnen Sie Google Drive, klicken Sie oben links auf "+Neu", scrollen Sie nach unten, um "Mehr" zu finden, und klicken Sie dann auf "Weitere Apps verbinden".

Schritt 2: Wenn Sie dies zum ersten Mal tun, wird der Google Workspace App Marketplace geöffnet. Geben Sie "Google Colaboratory" in die Suchleiste ein und wählen Sie es aus.

Schritt 3: Klicken Sie auf "Installieren", um die Installation durchzuführen, und wählen Sie "Weiter", um fortzufahren. Sie werden aufgefordert, sich mit Ihrem Google-Konto anzumelden und den Anweisungen zu folgen, um die Installation abzuschließen.

Schritt 4: Gehen Sie zurück zur Google Drive-Startseite, klicken Sie erneut auf "+Neu" in der oberen linken Ecke und wählen Sie in den weiteren Optionen die App "Google Colaboratory".

Schritt 5: Nach dem Öffnen können Sie den Namen der Datei ändern, um sie später schnell wiederverwenden zu können.

Schritt 6: Klicken Sie in der oberen Spalte auf "Ausführungsphase" und wählen Sie "Ausführungsphasentyp ändern".

Schritt 7: An dieser Stelle können Sie verschiedene Lauftypen und Rechenressourcen auswählen. Bitte wählen Sie "Python 3" und "T4 GPU" und klicken Sie auf "Speichern".

Schritt 8: Suchen Sie das Wort "Verbinden" in der oberen rechten Ecke des Fensters, klicken Sie darauf und warten Sie, bis die Verbindung erfolgreich hergestellt wurde.

Schritt 9: Sobald die Verbindung hergestellt ist, können Sie die Parameter des Computers sehen, einschließlich der Informationen zu Grafikprozessor, Arbeitsspeicher und Festplatte.

Schritt 10: Um Whisper zu installieren, geben Sie den Whisper-Installationscode und den ffmpeg-Installationscode in die erste bzw. zweite Zeile der mittleren Leiste ein und klicken Sie auf Ausführen.

Schritt 11: Nachdem die Installation abgeschlossen ist, klicken Sie auf das Ordnersymbol auf der linken Seite, wählen Sie "Dateien hochladen" und laden Sie die MP3-Dateien hoch, die Sie transkribieren möchten.

Schritt 12: Klicken Sie auf "+Code" und geben Sie den Code für die Ausführung von Sprache zu Text ein. Stellen Sie sicher, dass der Dateiname und das Suffix mit der hochgeladenen Datei übereinstimmen, und klicken Sie abschließend auf "Ausführen".

Praktische AI-Tutorials

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

tana-Notizsoftware: ein Erfahrungsbericht mit 10.000 Wörtern, Aufbau eines zweiten Gehirns mit KI und getaggten Knotenpunkten

Praktische AI-Tutorials

vor 9 Monaten

02.3K

Wisdom Spectrum Version o1: Verwendung von GLM-Zero zum Hinzufügen von Animationseffekten zu Bildern

Praktische AI-Tutorials

vor 7 Monaten

01.4K

Copilot für Microsoft 365-Konto Einführung und Antworten auf verwandte Fragen

Praktische AI-Tutorials

vor 9 Monaten

02.3K

Cursor-Tutorial (chinesische Version)

Praktische AI-Tutorials

vor 10 Monaten

03.6K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

Verwenden Sie Whisper, um Ihre Stimme kostenlos in mehrere Formate wortwörtlich zu transkribieren!

Schritt 1: Melden Sie sich bei Ihrem Google-Konto an, öffnen Sie Google Drive, klicken Sie oben links auf "+Neu", scrollen Sie nach unten, um "Mehr" zu finden, und klicken Sie dann auf "Weitere Apps verbinden".

Schritt 2: Wenn Sie dies zum ersten Mal tun, wird der Google Workspace App Marketplace geöffnet. Geben Sie "Google Colaboratory" in die Suchleiste ein und wählen Sie es aus.

Schritt 3: Klicken Sie auf "Installieren", um die Installation durchzuführen, und wählen Sie "Weiter", um fortzufahren. Sie werden aufgefordert, sich mit Ihrem Google-Konto anzumelden und den Anweisungen zu folgen, um die Installation abzuschließen.

Schritt 4: Gehen Sie zurück zur Google Drive-Startseite, klicken Sie erneut auf "+Neu" in der oberen linken Ecke und wählen Sie in den weiteren Optionen die App "Google Colaboratory".

Schritt 5: Nach dem Öffnen können Sie den Namen der Datei ändern, um sie später schnell wiederverwenden zu können.

Schritt 6: Klicken Sie in der oberen Spalte auf "Ausführungsphase" und wählen Sie "Ausführungsphasentyp ändern".

Schritt 7: An dieser Stelle können Sie verschiedene Lauftypen und Rechenressourcen auswählen. Bitte wählen Sie "Python 3" und "T4 GPU" und klicken Sie auf "Speichern".

Schritt 8: Suchen Sie das Wort "Verbinden" in der oberen rechten Ecke des Fensters, klicken Sie darauf und warten Sie, bis die Verbindung erfolgreich hergestellt wurde.

Schritt 9: Sobald die Verbindung hergestellt ist, können Sie die Parameter des Computers sehen, einschließlich der Informationen zu Grafikprozessor, Arbeitsspeicher und Festplatte.

Schritt 10: Um Whisper zu installieren, geben Sie den Whisper-Installationscode und den ffmpeg-Installationscode in die erste bzw. zweite Zeile der mittleren Leiste ein und klicken Sie auf Ausführen.

Schritt 11: Nachdem die Installation abgeschlossen ist, klicken Sie auf das Ordnersymbol auf der linken Seite, wählen Sie "Dateien hochladen" und laden Sie die MP3-Dateien hoch, die Sie transkribieren möchten.

Schritt 12: Klicken Sie auf "+Code" und geben Sie den Code für die Ausführung von Sprache zu Text ein. Stellen Sie sicher, dass der Dateiname und das Suffix mit der hochgeladenen Datei übereinstimmen, und klicken Sie abschließend auf "Ausführen".

Verwenden Sie Coze + Flying Book Forms, um einen automatisierten EXCEL-Tabellen-Daten-Organizer zu erstellen!

AI-Programmierung: Wie man liebenswert gut nutzt

Ähnliche Artikel

tana-Notizsoftware: ein Erfahrungsbericht mit 10.000 Wörtern, Aufbau eines zweiten Gehirns mit KI und getaggten Knotenpunkten

Wisdom Spectrum Version o1: Verwendung von GLM-Zero zum Hinzufügen von Animationseffekten zu Bildern

Copilot für Microsoft 365-Konto Einführung und Antworten auf verwandte Fragen

Cursor-Tutorial (chinesische Version)

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

Verwenden Sie Whisper, um Ihre Stimme kostenlos in mehrere Formate wortwörtlich zu transkribieren!

Schritt 1: Melden Sie sich bei Ihrem Google-Konto an, öffnen Sie Google Drive, klicken Sie oben links auf "+Neu", scrollen Sie nach unten, um "Mehr" zu finden, und klicken Sie dann auf "Weitere Apps verbinden".

Schritt 2: Wenn Sie dies zum ersten Mal tun, wird der Google Workspace App Marketplace geöffnet. Geben Sie "Google Colaboratory" in die Suchleiste ein und wählen Sie es aus.

Schritt 3: Klicken Sie auf "Installieren", um die Installation durchzuführen, und wählen Sie "Weiter", um fortzufahren. Sie werden aufgefordert, sich mit Ihrem Google-Konto anzumelden und den Anweisungen zu folgen, um die Installation abzuschließen.

Schritt 4: Gehen Sie zurück zur Google Drive-Startseite, klicken Sie erneut auf "+Neu" in der oberen linken Ecke und wählen Sie in den weiteren Optionen die App "Google Colaboratory".

Schritt 5: Nach dem Öffnen können Sie den Namen der Datei ändern, um sie später schnell wiederverwenden zu können.

Schritt 6: Klicken Sie in der oberen Spalte auf "Ausführungsphase" und wählen Sie "Ausführungsphasentyp ändern".

Schritt 7: An dieser Stelle können Sie verschiedene Lauftypen und Rechenressourcen auswählen. Bitte wählen Sie "Python 3" und "T4 GPU" und klicken Sie auf "Speichern".

Schritt 8: Suchen Sie das Wort "Verbinden" in der oberen rechten Ecke des Fensters, klicken Sie darauf und warten Sie, bis die Verbindung erfolgreich hergestellt wurde.

Schritt 9: Sobald die Verbindung hergestellt ist, können Sie die Parameter des Computers sehen, einschließlich der Informationen zu Grafikprozessor, Arbeitsspeicher und Festplatte.

Schritt 10: Um Whisper zu installieren, geben Sie den Whisper-Installationscode und den ffmpeg-Installationscode in die erste bzw. zweite Zeile der mittleren Leiste ein und klicken Sie auf Ausführen.

Schritt 11: Nachdem die Installation abgeschlossen ist, klicken Sie auf das Ordnersymbol auf der linken Seite, wählen Sie "Dateien hochladen" und laden Sie die MP3-Dateien hoch, die Sie transkribieren möchten.

Schritt 12: Klicken Sie auf "+Code" und geben Sie den Code für die Ausführung von Sprache zu Text ein. Stellen Sie sicher, dass der Dateiname und das Suffix mit der hochgeladenen Datei übereinstimmen, und klicken Sie abschließend auf "Ausführen".

Verwenden Sie Coze + Flying Book Forms, um einen automatisierten EXCEL-Tabellen-Daten-Organizer zu erstellen!

AI-Programmierung: Wie man liebenswert gut nutzt

Ähnliche Artikel

tana-Notizsoftware: ein Erfahrungsbericht mit 10.000 Wörtern, Aufbau eines zweiten Gehirns mit KI und getaggten Knotenpunkten

Wisdom Spectrum Version o1: Verwendung von GLM-Zero zum Hinzufügen von Animationseffekten zu Bildern

Copilot für Microsoft 365-Konto Einführung und Antworten auf verwandte Fragen

Cursor-Tutorial (chinesische Version)

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel