Memo AI : client natif pour le sous-titrage de vidéos, conversion de sous-titres multilingues

Dernières ressources sur l'IAMise à jour il y a 9 mois Cercle de partage de l'IA

13.4K 00

Introduction générale

MemoAI est un puissant outil de traduction vidéo conçu pour convertir des fichiers vidéo et audio en texte, sous-titres et notes. Qu'il s'agisse d'une vidéo YouTube, d'un podcast ou d'un fichier local, MemoAI peut le gérer facilement. MemoAI utilise les dernières technologies d'intelligence artificielle pour fournir des sous-titres en temps réel, une synthèse vocale, des résumés intelligents et bien plus encore, et accélère le traitement grâce aux GPU NVIDIA et Silicon d'Apple pour garantir la rapidité, l'efficacité et la sécurité. Les utilisateurs peuvent personnaliser les messages-guides de l'assistant d'intelligence artificielle et conserver tous les traitements de données au niveau local, afin de préserver la confidentialité même lorsqu'ils sont hors ligne.

La version gratuite de MemoAI permet d'accéder à la plupart des fonctionnalités, en limitant uniquement l'utilisation des GPU ou de certains modèles qui fonctionnent plus efficacement.

Mémo

Liste des fonctions

De la vidéo au texte
Prise en charge multilingue
Traduire l'audio
synthèse vocale
Traitement accéléré par le GPU
hovernote
sous-titrage en temps réel
Prise en charge des fichiers multimédias locaux
Montage de clips audio
Pointes d'IA personnalisées
Résumé de l'intelligence artificielle
Options d'exportation (formats Sous-titre, Markdown, Notion)
Multiplateforme (Windows, macOS)
Essai bêta gratuit

Utiliser l'aide

Télécharger et installer le client MemoAI
Importation de fichiers vidéo ou audio
Sélectionnez la fonction souhaitée, telle que la transcription, la traduction ou la synthèse vocale.
Configurer les options d'accélération GPU pour augmenter les vitesses de traitement
Exporter le résultat final dans le format souhaité

Paramètres du service de reconnaissance vocale

Téléchargez le modèle de reconnaissance vocale approprié en fonction de la langue lue dans la vidéo. Plus le modèle est grand, plus la vitesse de génération est lente. Certains modèles sont optimisés individuellement par Momo AI pour le chinois ou l'anglais. Vous pouvez donc utiliser un modèle plus petit pour obtenir d'excellents résultats de reconnaissance vocale. Le service de reconnaissance vocale consiste à convertir la parole en texte de sous-titres.

Paramètres liés à la traduction du texte

Big Language Models pour la traduction de textes, avec un choix de Cloud Big Model API, ou de Ollama Native Big Models.

Configuration du grand modèle local d'Ollama : entrez l'adresse de l'API locale, le port par défaut est 11434, et sélectionnez un modèle local déployé.

Debugging translation prompt word : testez l'effet de la traduction d'un texte d'une ligne et d'un texte de plusieurs lignes, si vous n'êtes pas satisfait, vous pouvez déboguer ici.

Paramètres du service de synthèse vocale

Après avoir traduit les sous-titres de la langue A en texte de la langue B, vous souhaitez que la vidéo soit lue à haute voix dans la langue B, qui doit être définie dans la synthèse vocale.

Edge TTS est l'interface de synthèse vocale gratuite de Microsoft, toutes les autres sont des interfaces API de synthèse vocale basées sur le cloud (payantes).

Si vous n'êtes pas satisfait du service de synthèse vocale ci-dessus, vous pouvez également utiliser d'autres outils de synthèse vocale tiers pour générer le discours après l'exportation de la légende.

Paramètres de reconnaissance des lecteurs multiples

Plusieurs personnages parlent dans la vidéo et le service de reconnaissance vocale les reconnaît tous.

Domaine d'opération fonctionnel principal

La fonctionnalité dépend d'une installation complète, veuillez donc procéder à une installation complète avant d'utiliser l'appareil :

Réécrire/réécrire :Conversion de la parole en sous-titres
Traduction :Convertir les sous-titres actuels dans d'autres langues
Synthèse vocale :Synthèse des sous-titres lecture vocale

Forfaits de tarification des mémos

La grande majorité des fonctionnalités de Memo AI sont proposées et utilisées gratuitement, notamment un nombre illimité de minutes de transcription de texte pour le modèle de base de la parole, un nombre illimité de traductions pour les sous-titres locaux et un nombre illimité de voix de synthèse pour les sous-titres.

Memo possède également des fonctions avancées qui nécessitent Memo Pro pour être débloquées. Étant donné que Memo est encore en cours d'itération, Memo propose Memo Pro et Memo Believer à un prix réduit de près de 50 %.

Memo Pro (édition annuelle)	💗 Memo Believer (version permanente)
Prix du test interne	$25.99 (~~$39.99~~)	$99.99 (~~$199~~)
Nombre d'équipements	2 Equipement	3 Equipement
temps de mise à jour	Mise à jour dans l'année	Mise à jour permanente
Fonctionnalités avancées	Accélération GPU, modèles de haute qualité, mode batch, exportation multiformat, synthèse vocale	Identique à la version Pro
Soutien aux services	Soutien au courrier	Soutien individuel WeChat + Groupe d'actionnaires
avantage	ne pas avoir	Nouveaux produits 100% Discount
Liens d'achat	Mise à niveau de Memo Pro	Devenir un adepte de Memo
offre limitée dans le temps	Rechercher dans WeChat memohq Obtenir des prix réduits	Rechercher dans WeChat memohq Obtenir des prix réduits