AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel

PengChengStarling: Kleineres und schnelleres mehrsprachiges Speech-to-Text-Tool als Whisper-Large v3

Allgemeine Einführung

PengChengStarling (PengCheng Labs) ist ein mehrsprachiges automatisches Spracherkennungswerkzeug (ASR), das Sprache in verschiedenen Sprachen in entsprechenden Text umwandeln kann. Dieses Toolkit wurde auf der Grundlage des icefall-Projekts entwickelt und bietet einen kompletten Spracherkennungsprozess einschließlich Datenverarbeitung, Modelltraining, Inferenz, Feinabstimmung und Bereitstellung. pengChengStarling unterstützt Streaming-Spracherkennung in acht Sprachen, darunter Chinesisch, Englisch, Russisch, Vietnamesisch, Japanisch, Thai, Indonesisch und Arabisch. Zu den wichtigsten Anwendungsszenarien gehören Sprachassistenten, Übersetzungstools, Untertitelerstellung und Sprachsuche. Die Modellgröße beträgt 20% von Whisper-Large v3, und die Inferenzgeschwindigkeit ist 7 Mal schneller als bei Whisper-Large v3.

Es kann mehrsprachige Spracheingaben in einem einheitlichen Rahmen verarbeiten, unterstützt Spracherkennung in Echtzeit, Erkennung beim Sprechen, kann als internationale Konferenzaufzeichnung in Text verwendet werden, mehrsprachige Videos erzeugen automatisch Untertitel, sprachübergreifendes Kundendienstsystem.

PengChengStarling: Mehrsprachiges Programm zur Umwandlung von Sprache in Text, unterstützt mehrsprachige Spracherkennung-1

 

Funktionsliste

  • Datenverarbeitung: Unterstützt die Vorverarbeitung mehrerer Datensätze, um das erforderliche Eingabeformat zu erzeugen.
  • Modelltraining: bietet flexible Trainingskonfigurationen zur Unterstützung mehrsprachiger Spracherkennungsaufgaben.
  • Inferenz: effiziente Inferenzgeschwindigkeit mit Unterstützung für Streaming-Spracherkennung.
  • Feinabstimmung: Unterstützt die Feinabstimmung von Modellen zur Anpassung an spezifische Aufgabenanforderungen.
  • Bereitstellung: stellt Modelle in den Formaten PyTorch und ONNX für eine einfache Bereitstellung bereit.

 

Hilfe verwenden

Ablauf der Installation

  1. Klonen des Projektlagers:
   git clone https://github.com/yangb05/PengChengStarling
cd PengChengStarling
  1. Installieren Sie die Abhängigkeit:
   pip install -r anforderungen.txt
export PYTHONPATH=/tmp/PengChengStarling:$PYTHONPATH

Vorbereitung der Daten

Bevor mit dem Trainingsprozess begonnen werden kann, müssen die Rohdaten zunächst in das gewünschte Eingabeformat umgewandelt werden. Dazu gehört in der Regel die Anpassung derzipformer/prepare.pyden Nagel auf den Kopf treffenmake_*_listMethode zur Erzeugung derDaten.ListeDatei. Nach Fertigstellung generiert das Skript die entsprechenden Schnitte und fbank-Merkmale für jeden Datensatz, die als Eingabedaten für PengChengStarling verwendet werden.

Modellschulung

  1. Konfigurieren Sie die Trainingsparameter: im Fensterconfig_trainum die für das Training erforderlichen Parameter zu konfigurieren.
  2. Ausbildung einleiten:
   . /train.sh

Inferenz

  1. Aufbereitung der Inferenzdaten: Vorverarbeitung der Daten in das gewünschte Format.
  2. Argumentation einleiten:
   . /eval.sh

Feintuning

  1. Feinabstimmung der Daten: Die Daten werden in das gewünschte Format vorverarbeitet.
  2. Initiieren Sie die Feinabstimmung:
   . /train.sh --finetune

Einsätze

PengChengStarling bietet Modelle in zwei Formaten an: PyTorch-Zustandswörterbuch und ONNX-Format. Sie können das geeignete Format für den Einsatz je nach Ihren Bedürfnissen wählen.


CDN1
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " PengChengStarling: Kleineres und schnelleres mehrsprachiges Speech-to-Text-Tool als Whisper-Large v3

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)