AI Speech to Text

Insgesamt 56 Artikel

in Ordnung bringen

Abogen: ein Tool zur Konvertierung verschiedener Textformate in Hörbücher

Allgemeine Einführung Abogen ist ein Open-Source-Tool zur schnellen Konvertierung von ePub-, PDF- oder reinen Textdateien in qualitativ hochwertiges Audio. Es verwendet das Kokoro-82M-Modell, um natürliche und flüssige Sprache zu erzeugen, und unterstützt die gleichzeitige Erzeugung von Untertiteln, was für die Produktion von Hörbüchern geeignet ist...

vor 4 Monaten

010.9K

Kimi-Audio: Open-Source-Audioverarbeitung und Dialogbasis-Modell

Allgemeine Einführung Kimi-Audio ist ein Open-Source-Audiobasismodell, das von Moonshot AI entwickelt wurde und sich auf Audioverstehen, -erzeugung und -dialog konzentriert. Es unterstützt eine breite Palette von Audioverarbeitungsaufgaben wie Spracherkennung, Audio-Q&A und Sprach-Emotionserkennung. Das Modell wurde über 130 Mal getestet...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech # AI Sprachausgabe in Text

vor 4 Monaten

011.4K

On Device AI: AI-Sprachtranskription und Chat-Tool für iPhone Native Running

Allgemeine Einführung On-Device AI ist eine KI-App, die komplett offline läuft und für Apple-Geräte entwickelt wurde, die iOS, macOS und visionOS unterstützen. Sie bietet die Ausführung eines lokalen, groß angelegten Sprachmodells (LLM), Sprachtranskription in Echtzeit, Dokumentenanalyse und vieles mehr, ohne dass eine...

Neueste AI-Ressourcen # AI Lokalisierte Chat-Anwendung # AI Sprachausgabe in Text

vor 4 Monaten

09.9K

Vexa: ein Tool zur Echtzeit-Transkription von Sitzungen und zur intelligenten Wissensextraktion

Umfassende Einführung Vexa ist eine Open-Source-Plattform für die Echtzeit-Transkription von Meetings und das Wissensmanagement, die entwickelt wurde, um effiziente Meeting-Aufzeichnungen und intelligente Wissensextraktionsdienste für Unternehmen und Privatpersonen bereitzustellen. Sie verbindet sich automatisch mit Plattformen wie Google Meet, Zoom usw. durch API-gesteuerte Meeting-Roboter...

Neueste AI-Ressourcen # AI Java Open Source Projekt # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 4 Monaten

014.9K

Open-Source-Tool für Sprache in Text in Echtzeit

Allgemeine Einführung realtime-transcription-fastrtc ist ein Open-Source-Projekt, das sich auf die Umwandlung von Sprache in Text in Echtzeit konzentriert. Es verwendet die FastRTC-Technologie zur Verarbeitung von Audioströmen mit geringer Latenz, kombiniert mit einem lokalen Whisper-Modell, um eine effiziente ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 5 Monaten

014.1K

Transkriptor: das intelligente KI-Transkriptionstool, das Audio und Video in Text umwandelt

Allgemeine Einführung Transkriptor ist ein KI-gesteuertes Transkriptionstool, das sich auf die schnelle Umwandlung von Audio und Video in Text konzentriert. Es unterstützt über 100 Sprachen mit einer Genauigkeitsrate von bis zu 99% und eignet sich für eine Vielzahl von Szenarien wie Meetings, Interviews, Notizen im Klassenzimmer und mehr. Benutzer können Dateien hochladen, direkt...

Neueste AI-Ressourcen # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Übersetzung # AI Sprachausgabe in Text

vor 5 Monaten

012.6K

Otter.ai: Intelligenter Meeting-Assistent mit Echtzeit-Sprachtranskriptionstool

Allgemeine Beschreibung Otter.ai ist ein KI-gestütztes Meeting-Management- und Sprachtranskriptionstool mit Kernfunktionen zur Umwandlung von Sprache in Text in Echtzeit und zur automatischen Erstellung von Meeting-Notizen, Zusammenfassungen und Aktionspunkten. Es wird auf intelligente Weise von einem KI-Meeting-Agenten unterstützt, der automatisch...

Neueste AI-Ressourcen # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 5 Monaten

010.9K

TurboScribe: das Online-Tool für die schnelle Umwandlung von Audio und Video in Text

Allgemeine Beschreibung TurboScribe ist ein KI-basiertes Transkriptionswerkzeug, das sich auf die schnelle Umwandlung von Audio und Video in Text konzentriert. Es unterstützt mehr als 98 Sprachen mit einer Genauigkeitsrate von 99,8% für Benutzer, die Sprachinhalte effizient verarbeiten müssen. Benutzer können Dateien hochladen, Textnotizen generieren...

Neueste AI-Ressourcen # AI Sprachausgabe in Text

vor 5 Monaten

014.3K

Aqua Voice: Akkurate Texterzeugung mit anwendungsübergreifender Spracheingabe

Allgemeine Einführung Aqua Voice ist ein intelligentes sprachbasiertes Texterstellungswerkzeug, das sich auf die schnelle Umwandlung von Benutzersprache in formatierten Text konzentriert. Es wurde 2023 von Finnian Brown und Jack McIntire entwickelt und befindet sich in den Vereinigten Staaten...

Neueste AI-Ressourcen # AI Sprachausgabe in Text

vor 5 Monaten

018.5K

Dolphin: Asiatische Spracherkennung und Speech-to-Text-Modelle für asiatische Sprachen

Umfassende Einführung Dolphin ist ein Open-Source-Modell, das von DataoceanAI und der Tsinghua-Universität entwickelt wurde und sich auf Spracherkennung und Spracherkennung für asiatische Sprachen konzentriert. Es unterstützt 40 Sprachen in Ostasien, Südasien, Südostasien und dem Nahen Osten sowie 22 chinesische Dialekte...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 5 Monaten

09.9K

TwinMind: kostenlose Offline-Sprach-zu-Text-Transkriptions-App

TwinMind ist ein von ThirdEar AI, Inc. entwickeltes intelligentes Tool, das "Ihnen hilft, sich an alles zu erinnern". Es kann Gespräche, Meetings oder Vorlesungen aufzeichnen und in Echtzeit in Text umwandeln, in mehr als 100 Sprachen, sogar mit Ihrem Telefon in der Tasche, und...

Neueste AI-Ressourcen # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 5 Monaten

010.9K

Wispr Flow: Verwenden Sie Ihre Stimme zur schnellen Texteingabe in jeder Anwendung

Allgemeine Beschreibung Wispr Flow ist ein Tool zur Texteingabe per Sprache, das Benutzern hilft, schnell am Computer zu schreiben. Es ist ein "3x schneller als Tippen"-Erlebnis, das es Benutzern ermöglicht, Text in jede Anwendung wie Word, Slack oder G...

Neueste AI-Ressourcen # AI Sprachausgabe in Text

vor 3 Monaten

019.3K

Meeting: Lokale Echtzeit-Transkription und Erstellung von Meeting-Protokollen des Open-Source-Clients

Allgemeine Einführung Meeting Minutes (auch bekannt als Meetily) ist ein kostenloses und quelloffenes KI-Meeting-Assistententool, das von Zackriya Solutions entwickelt wurde und sich darauf konzentriert, Audioaufnahmen von Meetings in Echtzeit zu erfassen, transkribierten Text zu...

Neueste AI-Ressourcen # AI Java Open Source Projekt # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 6 Monaten

014K

Local-NotebookLM: lokales PDF zur Erstellung von Sprachpodcasts von Open-Source-Tools

Umfassende Einführung Local-NotebookLM ist ein Open-Source-Projekt, das darauf abzielt, lokal ausgeführte intelligente Dokumentverarbeitungs- und Inhaltserstellungswerkzeuge bereitzustellen. Es ist inspiriert von Google NotebookLM und konzentriert sich auf die Unterstützung von Benutzern bei der Umwandlung von PDF- und anderen Dokumenten in eine Vielzahl von ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 6 Monaten

012.4K

AssemblyAI: Hochpräzise Sprache-zu-Text- und Audio Intelligence-Analyseplattform

Allgemeine Einführung AssemblyAI ist eine Plattform, die sich auf Sprach-KI-Technologie konzentriert und Entwicklern und Unternehmen effiziente Sprache-zu-Text- und Audio-Analyse-Tools zur Verfügung stellt. Sein Kern Highlight ist die Universal-Familie von Modellen, insbesondere die neu veröffentlichte Universal-2...

Neueste AI-Ressourcen # AI Offene Dienste # AI Sprachausgabe in Text

vor 6 Monaten

012K

FireRedASR: Ein Open-Source-Modell für mehrsprachige hochpräzise Spracherkennung

Allgemeine Einführung FireRedASR ist ein Spracherkennungsmodell, das vom Little Red Book FireRed-Team entwickelt und als Open Source zur Verfügung gestellt wird. Es konzentriert sich auf die Bereitstellung hochpräziser, mehrsprachengestützter automatischer Spracherkennungslösungen (ASR). Das Projekt wird auf GitHub für Entwickler und Forscher gehostet, und bietet...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 6 Monaten

014.6K

WhisperChain: Sprache-zu-Text in Echtzeit und Optimierung von gesprochenen Wörtern

Allgemeine Einführung WhisperChain ist ein KI-basiertes Open-Source-Projekt, das auf GitHub gehostet und vom Entwickler Chris Choy geleitet wird. Es wird hauptsächlich verwendet, um Sprache in Text umzuwandeln und den Ausdruck automatisch durch KI-Technologie zu optimieren, indem Redundanzen entfernt werden...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 6 Monaten

010K

LLPlayer: ein Videoplayer, der in Echtzeit Untertitel mit zweisprachiger Übersetzung erzeugt

Allgemeine Einführung LLPlayer ist ein Open-Source-Medienplayer für Sprachschüler, der auf GitHub gehostet und vom Entwickler umlx5h erstellt wurde. Es integriert eine Vielzahl von nützlichen Funktionen wie zweisprachige Untertitel-Anzeige, AI automatisch generierte Untertitel, Echtzeit-Übersetzung und Wortsuche...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Übersetzung # AI Sprachausgabe in Text

vor 3 Monaten

019.6K

CapsWriter-Offline: Spracheingabe- und Untertitel-Transkriptionstool für den PC

Allgemeine Einführung CapsWriter-Offline ist ein Spracheingabe- und Untertitel-Transkriptionstool für PC, das auf GitHub gehostet und vom Entwickler HaujetZhao erstellt wurde. Es läuft komplett offline und benötigt keine Internetverbindung für Sprache-zu-Text und audiovisuelle...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 6 Monaten

011K

Whisper Input: ein kostenloser und schneller Sprach-zu-Text-Transkriptionsdienst mit Groq

Allgemeine Beschreibung Whisper Input ist ein Open-Source-Tool zur Sprachtranskription, das es dem Benutzer ermöglicht, die Sprachaufnahme durch Drücken der Optionstaste zu starten und die Aufnahme durch Anheben der Taste zu beenden. Das Tool nennt Groq Whisper Large V3 Turbo ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 6 Monaten

012.5K

LiberSonora: Extraktion von Hörbuchuntertiteln und mehrsprachige Übersetzung, Transkription von Hörbüchern in mehrere Sprachen

Umfassende Einführung LiberSonora, was so viel wie "freier Klang" bedeutet, ist ein leistungsstarkes KI-gestütztes Open-Source-Hörbuch-Toolset. Es unterstützt intelligente Untertitel-Extraktion, KI-Titel-Generierung, mehrsprachige Übersetzung usw. und ist in der Lage, Batch-Offline-Verarbeitung unter GPU-Beschleunigung...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Übersetzung # AI Sprachausgabe in Text

vor 7 Monaten

010.8K

AudioNotes: Schnelles Extrahieren von Audio- und Videoinhalten und Erstellen von strukturierten Notizen

Umfassende Einführung AudioNotes ist ein Audio / Video zu strukturierten Notizen System auf FunASR und Qwen2 gebaut. Es kann schnell Audio-/Videoinhalte extrahieren und das große Modell aufrufen, um strukturierte Markdown-Notizen zu generieren, was praktisch für...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 7 Monaten

010.4K

Orate: Eine einheitliche API für die Integration von bekannter Spracherzeugung, Sprachtranskription und Sprachmodellierung

Allgemeine Einführung Orate ist ein KI-Toolkit, das sich auf Spracherzeugung und Transkription konzentriert. Es bietet eine einheitliche API, die sich nahtlos mit führenden KI-Anbietern wie OpenAI, ElevenLabs und AssemblyAI integrieren lässt, um Nutzern zu helfen,...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech # AI Sprachausgabe in Text

vor 7 Monaten

013.8K

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: Kleineres und schnelleres mehrsprachiges Speech-to-Text-Tool als Whisper-Large v3

Umfassende Einführung PengChengStarling (PengCheng Labs) ist ein mehrsprachiges Tool zur automatischen Spracherkennung (ASR), das Sprache in verschiedenen Sprachen in entsprechenden Text umwandeln kann. Dieses Toolkit wurde auf der Grundlage des icefall-Projekts entwickelt und bietet einen vollständigen Spracherkennungsprozess...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 7 Monaten

010.5K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT: Echtzeit-Sprache-zu-Text-Tool für Streaming-Spracherkennung mit niedriger Latenzzeit auf der Grundlage von Whisper

Allgemeine Einführung RealtimeSTT ist eine effiziente Echtzeit-Sprache-zu-Text-Bibliothek mit fortschrittlicher Sprachaktivitätserkennung und Wake-Word-Aktivierung mit geringer Latenz. Sie wurde von Kolja Beigel entwickelt, um Anwendungen zu unterstützen, die eine schnelle und genaue Sprache-zu-Text...

AI-Nachrichten # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 7 Monaten

011.7K

Sherpa-ONNX: Offline-Spracherkennung und -synthese mit ONNXRuntime

Allgemeine Einführung sherpa-onnx ist ein Open-Source-Projekt, das vom Next-gen Kaldi-Team entwickelt wurde, um effiziente Offline-Spracherkennungs- und Sprachsyntheselösungen anzubieten. Es unterstützt mehrere Plattformen, darunter Android, iOS, Raspber...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech # AI Sprachausgabe in Text

vor 8 Monaten

036.3K

Acoust: Online-KI-Spracherzeugung und Text-to-Speech (TTS)-Dienstplattformen

Allgemeine Einführung Acoust ist eine Online-KI-Plattform für Spracherzeugung und Text-to-Speech (TTS), die die neueste KI-Technologie nutzt, um realistische Sprache zu erzeugen. Die Plattform bietet außerdem leistungsstarke Videobearbeitungstools, mit denen die Benutzer die Videoproduktion abschließen können, ohne dass sie mehrere Softwareprogramme...

Neueste AI-Ressourcen # AI Text-to-Speech # AI Sprachausgabe in Text

vor 8 Monaten

09.6K

Notta: KI-Tool zur Aufzeichnung und Transkription von Besprechungen, Interviews oder Aufzeichnungen

Allgemeine Beschreibung Notta ist ein leistungsstarkes KI-Tool für die Aufzeichnung und Transkription von Meetings, Interviews oder Aufzeichnungen, das Benutzern hilft, diese automatisch in durchsuchbaren Text umzuwandeln. Mit Notta können Benutzer einfach transkribieren, bearbeiten, zusammenfassen und zusammenarbeiten, um die Produktivität zu steigern....

Neueste AI-Ressourcen # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 8 Monaten

012.5K

AI no jimaku gumi: Automatische Generierung und Übersetzung von mehrsprachigen Untertiteln für Videos mit Hilfe von KI

Allgemeine Einführung AI no jimaku gumi (AI no subtitle group) ist ein leistungsstarkes Kommandozeilen-Tool zur Verarbeitung von Videountertiteln, das sich auf die automatische Extraktion, Transkription und Übersetzung von Videountertiteln konzentriert. Das Tool integriert fortschrittliche KI-Technologien, einschließlich Whisper-Sprach...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Übersetzung # AI Sprachausgabe in Text

vor 8 Monaten

010.1K

FunClip: Intelligente Bearbeitung von Videoinhalten zu Kurzfilmen, einfaches und genaues Extrahieren/Zuschneiden von Videoclips

Umfassende Einführung FunClip ist ein vollständig quelloffenes, lokalisiertes, automatisiertes Videobearbeitungswerkzeug, das vom TONGYI Speech Lab des Alibaba Dharma Institute entwickelt wurde. Das Tool integriert das industrietaugliche Paraformer-Large-Spracherkennungsmodell, das die Sprache im Video genau identifizieren kann...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text # AI Audio-/Video-Editor

vor 8 Monaten

016.2K

BetterWhisperX: Automatische, vom Sprecher getrennte Spracherkennung, die hochpräzise Zeitstempel auf Wortebene liefert

Allgemeine Einführung BetterWhisperX ist eine optimierte Version des WhisperX-Projekts, das sich auf die Bereitstellung effizienter und genauer automatischer Spracherkennungsdienste (ASR) konzentriert. Als ein verbesserter Ableger von WhisperX wurde das Projekt von Federico ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 8 Monaten

012.7K

Freed: KI-Assistent für die medizinische Transkription, der Arzt-Patienten-Gespräche genau transkribiert und den Papierkram für die Besuchsdokumentation reduziert

Allgemeine Beschreibung Freed ist ein KI-Assistent für die medizinische Transkription, der für medizinisches Fachpersonal entwickelt wurde. Es hilft Ärzten und anderen Fachleuten im Gesundheitswesen, Patientenbesuche automatisch aufzuzeichnen, Papierkram zu reduzieren und die Arbeitseffizienz durch fortschrittliche KI-Technologie zu verbessern....

Neueste AI-Ressourcen # AI Sprachausgabe in Text

vor 8 Monaten

010.7K

Voicenotes: KI-Sprachnotizen, Aufzeichnung und Transkription von Sprache, intelligente Verwaltung von Meeting-Inhalten

Allgemeine Einführung Voicenotes ist eine intelligente App für Sprachnotizen, die Benutzern hilft, Sprachnotizen und Meetings einfach aufzunehmen und zu verwalten. Die App unterstützt die Sprachtranskription in mehr als 100 Sprachen. Benutzer sprechen einfach ihre Gedanken und Voicenotes transkribiert sie automatisch in Text...

Neueste AI-Ressourcen # AI Anmerkungen # AI Sprachausgabe in Text

vor 8 Monaten

012K

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Voice-Pro: multifunktionales Open-Source-Videoübersetzungsprogramm, Sprachtranskription und Übersetzung in mehrere Sprachen, Windows-Installation mit einem Klick

Allgemeine Einführung Voice-Pro ist ein vielseitiges, auf Gradio WebUI basierendes Tool, das Sprache-zu-Text, Text-zu-Sprache, Echtzeit-Übersetzung, YouTube-Video-Downloads und die Trennung menschlicher Stimmen unterstützt. Es integriert Whisper, Faster-Wh...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Übersetzung # AI Sprachausgabe in Text

vor 9 Monaten

012.4K

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换

Zamzar: Multifunktionales Online-Dateiformat-Konvertierungstool, Video-Konvertierung | Audio-Konvertierung | Bild-Konvertierung | Dokument-Konvertierung

Allgemeine Einführung Zamzar ist ein leistungsstarkes Online-Dateikonvertierungstool, das über 1200 Dateiformate unterstützt. Egal, ob es sich um Dokumente, Bilder, Videos, Audios oder eBooks handelt, Zamzar kann alles schnell und effizient konvertieren. Die Benutzer müssen keine Software herunterladen...

Neueste AI-Ressourcen # AI Offene Dienste # AI Sprachausgabe in Text

vor 10 Monaten

014.4K

AI Hear: Echtzeit-Sprachtranskriptions- und Übersetzungssoftware, die nativ offline läuft

Allgemeine Beschreibung Wenn Sie ein MacBook verwenden, sollten Sie AI Hear ausprobieren: Sie können Audio aufnehmen, lokale Sprache in Echtzeit in Text umwandeln, übersetzen und schließlich Untertitel exportieren. Sie können es verwenden, um Sie beim Anhören von länderübergreifenden Meetings und englischen Hörbüchern zu unterstützen. AI Hear ist eine lokal ausgeführte Software, die mit einem Klick Echtzeit...

Neueste AI-Ressourcen # AI Übersetzung # AI Sprachausgabe in Text

vor 10 Monaten

012K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

SoniTranslate: Open-Source-Videoübersetzungs-Synchronisationslösung, Mehrfachsynchronisation, Geschwindigkeitsanpassung und Nachahmung des Originaltons

Allgemeine Beschreibung SoniTranslate ist ein leistungsstarkes und benutzerfreundliches Tool für die mehrsprachige Synchronisation von Videos, das eine Lösung für die Übersetzung von Videos und die Synchronisierung von Audio bietet. Es nutzt fortschrittliche Spracherkennungs- und maschinelle Übersetzungstechnologien, um Videoinhalte in mehrere Sprachen zu übersetzen und den Ton zu synchronisieren. Das ...

Neueste AI-Ressourcen # AI Text-to-Speech # AI Übersetzung # AI Sprachausgabe in Text

vor 10 Monaten

020.9K

FunASR: Open Source Spracherkennungs-Toolkit, Sprechertrennung / Mehr-Personen-Dialog-Spracherkennung

Umfassende Einführung FunASR ist ein Open-Source-Spracherkennungs-Toolkit, das von der Alibaba Dharmo Academy entwickelt wurde, um akademische Forschung und industrielle Anwendungen zu verbinden. Es unterstützt eine breite Palette von Spracherkennungsfunktionen, einschließlich Spracherkennung (ASR), Voice Endpoint Detection (VAD), Interpunktionswiederherstellung, Sprachmodellierung,...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 11 Monaten

021.5K

AsrTools: Werkzeug zur Umwandlung von Sprache in Untertitel, leichtgewichtiger Client mit integrierten Schnittstellen zu Cutscene, Racer und Must-Cut

Umfassende Einführung AsrTools ist ein intelligentes Sprache-zu-Text-Tool mit eingebauten Schnittstellen von großen Herstellern wie Cutscene, Racer, Must Cut, usw. Es erfordert keine GPU oder umständliche Konfiguration und unterstützt effiziente Multi-Thread-Batch-Verarbeitung. Es basiert auf PyQt5 Entwicklung, schöne und benutzerfreundliche Schnittstelle, in der Lage, SRT und TXT-Format Wörter auszugeben...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 11 Monaten

013.4K

Happy Scribe: Plattform für Audiotranskription und Videountertitelung | Kostenlose Software für Videountertitelung

Happy Scribe Allgemeine Beschreibung Happy Scribe bietet automatisierte und manuelle Audiotranskriptionsdienste zur Umwandlung von Audio in Text mit hoher Genauigkeit und Unterstützung für mehrere Sprachen und Formate. Es enthält einen interaktiven Editor, Tools für die Zusammenarbeit, mehrere Exportformate, maschinelle Übersetzung und andere Funktionen...

Neueste AI-Ressourcen # AI Sprachausgabe in Text # AI Audio-/Video-Editor

vor 11 Monaten

012.3K

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop

Whisper GPGPU: OpenAI Whisper läuft unter Windows|Whisperdesktop

Allgemeine Einführung Whisper ist ein Open-Source-Projekt auf GitHub, das von Const-me entwickelt wurde und sich auf die Hochleistungsinferenz des automatischen Spracherkennungsmodells (ASR) Whisper von OpenAI mit GPGPU konzentriert. Dieses Projekt basiert auf der MPL-2.0 Lizenz...

Neueste AI-Ressourcen # AI Sprachausgabe in Text

vor 11 Monaten

019.4K

Buzz: Open-Source-Offline-Audio-Transkriptionsübersetzungstool | IOS-Sprachübersetzung

Buzz Allgemeine Einführung Buzz ist ein von chidiwilliams entwickeltes Open-Source-Projekt, das die Offline-Transkription und -Übersetzung von Audiodaten auf PCs ermöglicht. Das Projekt basiert auf der Whisper-Technologie von OpenAI, die es den Nutzern ermöglicht, sich nicht auf eine Internetverbindung für Audiotext zu verlassen...

Neueste AI-Ressourcen # AI Sprachausgabe in Text

vor 11 Monaten

017K

Deepgram: Service-API für hochpräzise Spracherkennungs- und -syntheselösungen

Allgemeine Beschreibung Deepgram ist ein Unternehmen, das sich auf Technologien zur Spracherkennung und Verarbeitung natürlicher Sprache spezialisiert hat und leistungsstarke Speech-to-Text und Text-to-Speech APIs anbietet....

Neueste AI-Ressourcen # AI Offene Dienste # AI Sprachausgabe in Text

vor 5 Monaten

012.6K

Murf AI: Sprachwandler|Sprache zu Text|Text zu Sprache|Audio Editor

Allgemeine Einführung Murf AI ist ein leistungsstarkes Online-Tool zur Erzeugung künstlicher Intelligenz, das Text in nahezu echte menschliche Sprache umwandelt. Es bietet bis zu 120+ KI-Stimmenoptionen, unterstützt mehr als 20 Sprachen und eignet sich für eine Vielzahl von Situationen wie Podcasts, Videos, professionelle Präsentationen usw...

Neueste AI-Ressourcen # AI Text-to-Speech # AI Sprachausgabe in Text

vor 11 Monaten

012.5K

VideoLingo：视频转录单词级时间轴字幕，视频字幕翻译和本地化配音开源工具

VideoLingo: Videotranskription von Untertiteln auf Wortebene, Übersetzung von Videountertiteln und lokalisierte Synchronisation mit Open-Source-Tools

Allgemeine Beschreibung VideoLingo ist ein One-Stop-Videoübersetzungs- und Lokalisierungs-Synchronisationstool, das entwickelt wurde, um qualitativ hochwertige Untertitel in Netflix-Qualität zu generieren, indem es rohe maschinelle Übersetzungen und mehrzeilige Untertitel eliminiert und qualitativ hochwertige Voiceovers hinzufügt, damit globales Wissen über Sprachbarrieren hinweg geteilt werden kann. Durch...

Neueste AI-Ressourcen # AI Side Hustle Geldverdienen Projekt # AI Übersetzung # AI Sprachausgabe in Text

vor 10 Monaten

012K

ALog: tragbare KI-Sprachtagebuch-App mit Sprache-zu-Text-Unterstützung.

Allgemeine Einführung ALog ist eine KI-basierte Sprachtagebuchanwendung, die Nutzern helfen soll, ihr tägliches Leben per Sprache aufzuzeichnen. Es wird von duxins entwickelt und ist auf GitHub verfügbar. Benutzer können Tagebucheinträge durch Spracheingabe aufzeichnen, und die App wird die Stimme automatisch in Text umwandeln...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 7 Monaten

011.2K

Record Cafe: Audio-/Videoverarbeitungsplattform aus einer Hand|Videoerzeugung|AI Untertitel|Audioextraktion|Speech to Text

Umfassende Einführung Record Cafe ist eine Audio-/Videoverarbeitungsplattform aus einer Hand, die KI-Videodialoge, KI-Untertitel und KI-Sprache-zu-Text-Dienste anbietet. Zu den Funktionen gehören die Aufnahme von Bildschirmen, die Bearbeitung von Videos, die Konvertierung von GIF/Audio usw. und die Unterstützung von Cloud-Speicherung und -Sharing. Die Schnittstelle ist intuitiv und einfach zu bedienen, und es unterstützt auch Multi-Screen-Aufnahme und mehrsprachige intelligente...

Neueste AI-Ressourcen # AI Text zu Video # AI Text-to-Speech # AI Sprachausgabe in Text

vor 9 Monaten

011.8K

CrisperWhisper: Genaue wortgetreue Sprachtranskription

Allgemeine Beschreibung CrisperWhisper ist ein fortschrittliches Spracherkennungswerkzeug, das auf OpenAI Whisper basiert und sich auf eine schnelle, genaue und wortgenaue Sprachtranskription konzentriert. Es liefert genaue Zeitstempel auf Wortebene, auch bei Sprachfüllungen und Pausen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 8 Monaten

013.8K

Babelfish.ai: Browsergestützte Echtzeit-Sprachtranskriptions- und Übersetzungsanwendung

Allgemeine Einführung Babelfish.ai ist eine Echtzeit-Transkriptions- und Übersetzungsanwendung, die auf Huggingface Transformer.js und Supabase Realtime basiert. Die Anwendung kann große Modelle in den Browser laden und...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 12 Monaten

011.5K

FreeTTS: Kostenloses Online-Tool zur Text-zu-Sprache-Umwandlung, Audioverbesserung, Audioclips

FreeTTS Allgemeine Beschreibung FreeTTS ist ein kostenloses Online-Tool zur Umwandlung von Texten in natürlich klingende Sprachdateien. Mit der Unterstützung mehrerer Sprachen und Soundoptionen können Benutzer Text in die Formate MP3, WAV, OGG und ACC umwandeln...

Neueste AI-Ressourcen # AI Text-to-Speech # AI Sprachausgabe in Text # AI Audio-/Video-Editor

vor 12 Monaten

013.1K

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

Umfassende Einführung Easy-Voice-Toolkit ist ein multifunktionales Toolkit, das auf dem Open Source Speech Project basiert und eine breite Palette von automatisierten Audiowerkzeugen für die Spracherkennung, Sprachtranskription, Sprachkonvertierung, Datensatzerstellung und Modelltraining bietet. Benutzer können diese Werkzeuge je nach Bedarf selektiv einsetzen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech # AI-Stimmenklonen

vor 12 Monaten

011.5K

DupDub: KI-gesteuerter Video-Editor|Synchronisation|Video-Übersetzung|Foto-Digitalisierer

Allgemeine Beschreibung Dupdub ist eine seitenlastige Plattform zur Erstellung von Podcasts und Videopräsentationen, die eine Reihe von KI-Tools bietet, um die Kreativität der Nutzer zu unterstützen. Die Funktionen umfassen die Erstellung von Text zu Video, das Angebot von KI-Sprach- und Videosynchronisierungsdiensten sowie Videobearbeitung, Transkription und Untertitelung. Dupdub ist auch ...

Neueste AI-Ressourcen # AI Digital Man # AI Text-to-Speech # AI Sprachausgabe in Text

vor 1 Jahr

012.3K

Tongyi Hören und Verstehen: Ali Tongyi KI-Assistent zur Transkription von Audio- und Videoinhalten

Umfassende Einführung Tongyi Listening and Understanding ist ein von Aliyun lancierter KI-Assistent für das Arbeitsstudium, der sich auf die Transkription und Analyse von Audio- und Videoinhalten konzentriert. Er stützt sich auf die leistungsstarken KI-Modelle von AliCloud, um Audio- und Videoinhalte in Echtzeit in Text zu transkribieren, und bietet Übersetzungen, Zusammenfassungen, Positionierungen und andere Funktionen. Tongyi Listening Woo unterstützt mehrere Sprachen und Szenarien...

Neueste AI-Ressourcen # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 1 Jahr

013.1K

Insanely Fast Whisper: schnelle und effiziente Transkription von Sprache in Text Open-Source-Projekt

Umfassende Einführung insanely-fast-whisper ist eine Audioübertragung, die das Whisper-Modell von OpenAI mit verschiedenen Optimierungstechniken (z.B. Transformers, Optimum, Flash Attention) kombiniert...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 7 Monaten

011.1K

Memo AI: Native Client für Video zu Untertitel, Konvertierung mehrsprachiger Untertitel

Allgemeine Beschreibung MemoAI ist ein leistungsstarkes Videoübersetzungsprogramm, das Video- und Audiodateien in Text, Untertitel und Notizen umwandelt. Ob es sich um ein YouTube-Video, einen Podcast oder eine lokale Datei handelt, MemoAI kann es mit Leichtigkeit verarbeiten. Es unterstützt mehr als 90 Sprachen wie Chinesisch, Englisch, Japanisch...

Neueste AI-Ressourcen # AI Text-to-Speech # AI Sprachausgabe in Text # AI Audio-/Video-Editor

vor 9 Monaten

012.6K

pyvideotrans: Werkzeug zur Videoübersetzung und Synchronisation

pyVideoTrans Allgemeine Einführung pyvideotrans ist ein Videoübersetzungs-Synchronisationstool. Benutzer können Videoinhalte von einer Sprache in eine andere übersetzen und dem Video entsprechende Synchronisationen und Untertitel hinzufügen. Es basiert auf openai-whisper offline...

Neueste AI-Ressourcen # AI Text-to-Speech # AI Sprachausgabe in Text # AI Audio-/Video-Editor

vor 1 Jahr

013.3K

Das ist nicht alles.