Fish Audio - Outil de synthèse vocale et de clonage de sons en IA
Fish Audio est un puissant outil de synthèse vocale générative par IA qui prend en charge la synthèse vocale (TTS) et le clonage de voix. Les utilisateurs n'ont qu'à saisir du texte, l'outil prend en charge la conversion d'une voix naturelle et fluide. La plateforme fournit une variété de langues et de styles de voix à choisir, afin de répondre à différents scénarios et...
SignGemma - Modèle de traduction de la langue des signes de Google DeepMind
SignGemma est le modèle d'IA d'interprétation de la langue des signes le plus puissant au monde de Google DeepMind, prenant en charge la traduction précise de la langue des signes américaine (ASL) en texte anglais. Le modèle est basé sur un entraînement multimodal, combinant des données visuelles et textuelles pour capturer les actions en langue des signes en temps réel et les traduire rapidement en texte....
FLUX.1 Kontext - Modèle de génération et d'édition d'images de la Forêt Noire
FLUX.1 Kontext est un modèle de génération et d'édition d'images de Black Forest Labs qui fournit des techniques de traitement d'images tenant compte du contexte. Le modèle comprend les réponses aux indices de texte et d'image, effectue des tâches telles que la modification d'objets, la conversion de style et le remplacement de l'arrière-plan, tout en conservant le coin...
WebAgent - Ali Tongyi Open Source Autonomous Search AI Agent (Agent IA de recherche autonome)
WebAgent est un agent IA de recherche autonome open source d'Alibaba Tongyi Labs, doté de puissantes capacités de recherche autonome d'informations de bout en bout et de raisonnement en plusieurs étapes. WebAgent peut percevoir, décider et agir activement dans l'environnement réseau comme les humains, et est largement utilisé dans la recherche universitaire, la prise de décision commerciale...
Lingcode IDE - Tongyi Lingcode lance des outils d'environnement de développement natif pour l'IA
Spirit Code IDE est l'environnement de développement intégré (IDE) natif pour l'IA lancé par Tongyi Spirit Code, qui est profondément adapté aux 3 modèles majeurs de Thousand Questions, et possède un puissant mode de programmation intelligent pour soutenir l'accomplissement autonome de tâches telles que la perception du projet, la récupération du code, et l'exécution d'opérations terminales. Il prend en charge les outils MCP et intègre les 3 modèles de Magic Hitch MCP Square....
BAGEL - Modèle de base multimodale open source lancé par Wordpress
BAGEL est un modèle de base multimodal mis à disposition par ByteDance avec 14 milliards de paramètres, dont 7 milliards sont actifs. Le modèle de base et l'architecture experte de transformateur mixte (MoT), qui capture les caractéristiques au niveau du pixel et au niveau sémantique d'une image avec deux encodeurs indépendants respectivement, permettent un traitement efficace de l'image, du texte, de la vidéo...
DeepSeek-R1 - Modèle d'inférence IA de DeepSeek, performance alignée sur la version OpenAI o1
DeepSeek-R1 est un modèle d'inférence IA très performant lancé par DeepSeek, une société basée à Hangzhou, qui se compare à la version officielle o1 d'OpenAI. Le modèle est post-entraîné sur la base de techniques d'apprentissage par renforcement à grande échelle et ne nécessite qu'une très petite quantité de données étiquetées pour raisonner en mathématiques, en code et en langage naturel...
Phantom Boat AI - Plate-forme unique de création de courts métrages d'IA, génération par lots de divers types de contenu vidéo
Phantom Boat AI est une puissante plateforme de création de courts-métrages en IA qui prend en charge la génération efficace par lots de divers types de contenu vidéo, y compris les publicités, les promotions, les animations et plus encore. La plateforme est basée sur Midjourney, Runway et d'autres modèles d'IA de renommée mondiale, et offre aux créateurs une large gamme de services allant de l'écriture de...
Circuit Tracer - L'outil open source d'Anthropic pour visualiser le fonctionnement interne d'un modèle
Circuit Tracer est un outil open source d'Anthropic permettant d'étudier le fonctionnement interne de grands modèles de langage. Basé sur la génération de graphes d'attribution (attribution graphs) pour révéler les étapes internes que le modèle subit lors de la génération d'une sortie particulière ...
Google AI Edge Gallery - Google lance une application d'IA pour aider les téléphones portables à exécuter des modèles d'IA
Google AI Edge Gallery est une application expérimentale de Google qui permet aux utilisateurs d'expérimenter et d'utiliser des modèles d'apprentissage automatique (ML) et d'intelligence artificielle générative (GenAI) sur des appareils natifs. L'application est prise en charge sur les appareils Android.