Dernières ressources sur l'IA

Total 2659 articles
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

méso (chimie)Meeseeks - Ensemble d'évaluation open-source Meeseeks pour évaluer la capacité à suivre les instructions d'un modèle

Meeseeks est un ensemble d'évaluation de grands modèles open source utilisé par l'équipe M17 de Meituan pour évaluer la capacité d'un modèle à suivre les instructions. Meeseeks utilise un cadre d'évaluation à trois niveaux pour mesurer de manière exhaustive si un modèle est capable de générer des réponses en stricte conformité avec les instructions de l'utilisateur, du niveau macro au niveau micro, et n'évalue pas la connaissance du contenu de la réponse comme un élément positif....
Il y a 12 heures
01.2K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

méso (chimie)HunyuanVideo-Foley - Modèle de génération de sons vidéo open source de Tencent

HunyuanVideo-Foley est un modèle open source de génération de sons vidéo conçu par l'équipe de Tencent Mixed Yuan, qui permet d'ajouter des effets sonores adaptés à des vidéos muettes. Le modèle est basé sur l'entraînement d'un ensemble de données à grande échelle, avec une architecture de convertisseur de diffusion multimodale, combinée à la représentation de la fonction de perte d'alignement et aux techniques d'optimisation de la VAE audio ...
Il y a 2 jours
02.6K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - Un modèle de réflexion parallèle introduit par Ask o4 qui ouvre 8 pistes de réflexion en même temps.

Ask White o4 est un modèle innovant de réflexion parallèle qui ouvre 8 voies de réflexion en même temps, analyse le problème sous plusieurs angles et filtre automatiquement la solution optimale. Le modèle incorpore des techniques avancées d'apprentissage par renforcement Long-CoT et d'apprentissage par récompense de processus, possède de puissantes capacités de raisonnement profond et donne de bons résultats dans les tâches complexes.
Il y a 4 jours
07.2K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Modèles de génération de scènes 3D open source de Qunar Technologies

SpatialGen est un modèle de génération de scènes 3D open source de Qunar Technology, basé sur l'architecture du modèle de diffusion, qui prend en charge la génération d'images multi-vues spatio-temporellement cohérentes sur la base de descriptions textuelles, d'images de référence et d'une disposition spatiale 3D, et qui permet de générer des scènes gaussiennes 3D et d'effectuer le rendu de vidéos itinérantes.
Il y a 4 jours
06.2K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR - Une nouvelle génération de modèles de reconnaissance vocale lancée conjointement par Nail et Tongyi

Fun-ASR est un grand modèle de reconnaissance vocale lancé conjointement par Nail et Tongyi Labs. Le modèle a été entraîné avec des données audio massives et peut identifier avec précision la terminologie multi-industrielle, telle que l'Internet, la technologie, la décoration intérieure, etc. Le modèle est combiné avec les informations de l'entreprise Nail pour l'optimisation de l'inférence afin de réduire le problème des...
il y a 5 jours
08.4K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - Plate-forme d'écriture assistée par IA qui alimente l'ensemble du processus, de l'idée à la création

Squibler est une puissante plateforme d'écriture assistée par l'IA, conçue pour les écrivains, qui aide les utilisateurs dans l'ensemble du processus, de la conception à la publication en passant par la création. La plateforme fournit une variété de modèles d'histoires couvrant les romans, les scénarios, les nouvelles, etc. Les utilisateurs n'ont qu'à entrer le concept initial, et l'IA peut générer les grandes lignes, les personnages, les scènes...
il y a 5 jours
07.7K
Aivilization - 港科大推出的多Agent社会模拟平台

Aivilization - une plateforme de simulation sociale multi-agents lancée par HKUST

Aivilization est la première plateforme de simulation sociale de corps multi-intelligents développée par l'Université des sciences et technologies de Hong Kong. Elle constitue un bac à sable numérique visuel où les utilisateurs peuvent créer et guider des milliers d'intelligences IA afin d'observer l'évolution sociale de la future coexistence entre l'homme et l'IA. La plateforme prend en charge...
il y a 5 jours
010.2K
Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

Grok 2.5 - Le modèle d'IA open source xAI de Musk

Grok 2.5 est un modèle d'IA open source de l'entreprise xAI d'Elon Musk. Avec 269 milliards de paramètres, il est basé sur l'architecture Mixed Expertise (MoE) pour des performances et une inférence puissantes. Le modèle a été testé sur des connaissances scientifiques de haut niveau (GPQA), des connaissances générales (MMLU, MM...
il y a 5 jours
08.6K
MIT最新报告《生成式AI鸿沟:2025年商业人工智能现状》

Le nouveau rapport du MIT, The Generative AI Divide : the State of Business AI in 2025 (La fracture de l'IA générative : l'état de l'IA d'entreprise en 2025).

Le dernier rapport du MIT, The Generative AI Divide : the State of Business AI in 2025, révèle le cœur du processus d'adoption de l'IA générative (GenAI) auquel les entreprises sont confrontées en menant des recherches approfondies sur plus de 300 projets d'IA, des entretiens avec 52 organisations et une enquête auprès de 153 dirigeants....
Il y a 6 jours
014K
AutoClip - 开源的AI视频切片工具,一键生成专题视频合集

AutoClip - Outil de découpage vidéo AI open source pour générer des collections de vidéos thématiques en un seul clic !

AutoClip est un outil d'édition vidéo IA open source, basé sur une technologie IA avancée pour réaliser le processus complet de traitement vidéo automatisé. Les outils peuvent automatiquement identifier les points forts de la vidéo, l'extraction précise du contenu précieux, peut être basé sur la similitude du thème de clustering intelligent, pour générer une collection de contenu.AutoClip support...
il y a 1 semaine
010K
ToonComposer - 腾讯开源的生成式AI动画制作工具

ToonComposer - Outil d'animation générative d'IA open source de Tencent

ToonComposer est un outil d'animation générative par IA lancé conjointement par l'Université chinoise de Hong Kong, Tencent PCG ARC Lab et l'Université de Pékin. Grâce à la technologie générative post keyframe, la génération d'images intermédiaires et le processus de coloration sont intégrés dans un processus automatisé, ne nécessitant qu'une esquisse et un...
il y a 1 semaine
010.4K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Modèle scientifique multimodal léger mis à disposition par le Shanghai AI Lab

Intern-S1-mini est un macromodèle scientifique multimodal léger avec une échelle de paramètres de 8B lancé par le Shanghai Artificial Intelligence Laboratory (SAL). Il hérite des puissantes capacités d'Intern-S1, combinant à la fois des capacités scientifiques générales et spécialisées, et convient à un déploiement rapide et à un développement secondaire. En termes de performances, I...
il y a 1 semaine
09.9K
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - Le modèle VLA efficace du groupe Amoy

CombatVLA est un modèle 3D innovant spécifique aux jeux de rôle et d'action (ARPG), développé par l'équipe du Future Life Lab du groupe Amoy. CombatVLA est un modèle vision-linguistique-action (VLA), construit sur une échelle paramétrique de 3B, qui recueille les données du joueur humain par l'intermédiaire d'un...
il y a 1 semaine
09.9K
DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - Le dernier modèle d'IA open source de DeepSeek

DeepSeek V3.1 est une nouvelle génération de modèles d'IA introduits par DeepSeek, avec d'importantes améliorations par rapport à son prédécesseur, V3. DeepSeek V3.1 introduit une architecture de raisonnement hybride qui permet au modèle de basculer de manière flexible entre les modes de réflexion et de non-réflexion, améliorant de manière significative la...
il y a 1 semaine
010.2K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - Plate-forme robotique polyvalente à code source ouvert de Jiyuan, en collaboration avec Beihang et d'autres organismes

Genie Envisioner (GE) est une plateforme unifiée pour les opérations robotiques développée par l'équipe de Genie Robotics en collaboration avec l'Université nationale de Singapour, l'Université d'aéronautique et d'astronautique de Pékin et d'autres institutions. Elle permet aux robots de mieux comprendre et d'exécuter des tâches en "imaginant d'abord, puis en agissant".
Il y a 2 semaines
011.9K
DINOv3 - Meta AI推出的新一代自监督视觉基础模型

DINOv3 - Modèle de base de vision auto-supervisée de nouvelle génération de Meta AI

DINOv3 est un modèle de base de vision auto-supervisée de nouvelle génération de Meta AI qui utilise un paradigme d'apprentissage auto-supervisé pour apprendre les caractéristiques des images sans données d'étiquetage. Il résout le problème de la dégradation des caractéristiques en améliorant la préparation des données et en introduisant l'ancrage Gram, et améliore la généralisation...
Il y a 2 semaines
016.3K
Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft - Cadre open source de Tencent Hunyuan permettant de générer des vidéos interactives pour les jeux de nouvelle génération.

Hunyuan-GameCraft est un cadre de génération de vidéos de jeux interactifs open source de l'équipe Hunyuan de Tencent. A partir d'une simple image et d'invites, ce cadre permet de générer des vidéos de jeux hautement dynamiques. L'utilisateur peut contrôler le contenu vidéo en temps réel à l'aide d'un clavier et d'une souris.
Il y a 2 semaines
013.4K
RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - Le modèle open source de compréhension du monde de l'Institut Ali Dharma

RynnEC est un modèle de compréhension du monde présenté par l'Alibaba Dharma Institute, qui se concentre sur les tâches d'intelligence incarnée. Le modèle est basé sur une technologie de fusion multimodale, combinant les données vidéo et le langage naturel, et peut analyser les objets d'une scène à partir de plusieurs dimensions, prenant en charge des fonctions telles que la compréhension des objets, la perception spatiale et la segmentation des cibles vidéo.
Il y a 2 semaines
013K
Matrix-3D - 昆仑万维开源的3D世界生成框架

Matrix-3D - Kunlun World Wide Open Source 3D world world generation framework (cadre de génération de mondes 3D)

Matrix-3D est un framework open source de l'équipe Skywork AI, axé sur la génération de mondes 3D panoramiques explorables. Le cadre combine la génération de vidéos panoramiques et les techniques de reconstruction 3D pour générer des mondes 3D explorables de haute qualité et omnidirectionnels à partir d'une seule image ou d'un texte...
Il y a 2 semaines
010.9K
GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - Modèle de raisonnement visuel multimodal Open Source par Smart Spectrum

GLM-4.5V est le premier modèle d'inférence visuelle open source au monde introduit par Smart Spectrum, avec 106 milliards de paramètres totaux et 12 milliards de paramètres activés. Le modèle est entraîné sur la base du modèle de texte de nouvelle génération GLM-4.5-Air, avec de puissantes capacités de compréhension visuelle et de raisonnement, capable de traiter des images, des vidéos...
il y a 3 semaines
012.6K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - Outil de création humaine numérique piloté par l'audio de Quintessence

SkyReels-A3 est un outil de création humaine numérique piloté par le son, conçu par le Kunlun World Wide Group. SkyReels-A3 est un outil de création humaine numérique piloté par l'audio, qui peut générer un contenu vidéo dynamique de haute qualité à partir d'entrées simples (par exemple, des images de portrait et la voix), donner vie à des photos statiques et remplacer les lignes des vidéos existantes par de nouvelles synchronisations labiales que les personnages feront automatiquement correspondre à...
il y a 3 semaines
09.3K
GPT-5 - OpenAI推出的最强语言模型,统一智能系统

GPT-5 - Le modèle de langage le plus fort introduit par OpenAI, le système d'intelligence unifiée

GPT-5 est le dernier modèle de langage publié par OpenAI avec plusieurs mises à jour. Il s'agit d'un système d'intelligence unifiée doté d'un routeur en temps réel intégré qui bascule automatiquement entre les modes de pensée efficace et profonde en fonction de la complexité du problème, ce qui permet une réponse rapide et des réponses précises.GPT-5 a plusieurs versions, y compris pour les pu...
il y a 3 semaines
010K
Genie 3 - 谷歌推出的通用世界模型

Genie 3 - Le modèle universel du monde de Google

Genie 3 est une nouvelle génération de modèles de monde universels de Google DeepMind qui permet de générer des mondes virtuels hautement dynamiques et cohérents en temps réel.Genie 3 simule des phénomènes physiques, des écosystèmes naturels, et prend en charge la création de scénarios fantastiques et historiques. À l'aide d'invites textuelles, les utilisateurs peuvent...
il y a 3 semaines
010.3K
LangExtract - 谷歌开源的Python库,提取结构化信息

LangExtract - Bibliothèque Python open source de Google pour l'extraction d'informations structurées

LangExtract est une bibliothèque Python Open Source de Google qui utilise de grands modèles de langage (LLM) pour extraire des informations structurées à partir de textes non structurés. Avec des commandes définies par l'utilisateur et un petit nombre d'exemples, elle peut identifier et organiser efficacement des détails clés, tels que des...
il y a 3 semaines
011.5K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Jeu de données sémantiques gaussiennes 3D par Qunar Technology

InteriorGS est un ensemble de données sémantiques gaussiennes 3D de haute qualité introduit par Qunar Technology. Ce jeu de données contient 1 000 scènes 3D couvrant plus de 80 environnements intérieurs tels que des maisons, des magasins de proximité, des salles de mariage et des musées. Le jeu de données contient plus de 554 000 instances d'objets dans 755 catégories...
Il y a 4 semaines
08.4K
ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - Outil open source de génération de captures d'écran pour le code frontal

ScreenCoder est un outil open source intelligent qui permet de convertir rapidement des captures d'écran de conception d'interface utilisateur en code HTML/CSS de haute qualité. L'outil est basé sur une architecture multi-intelligence modulaire, combinée à des techniques de compréhension visuelle, de planification de la mise en page et de synthèse du code, afin d'aider à la génération d'interfaces frontales sémantiques et de haute précision.
Il y a 4 semaines
010.1K
MindLink - 昆仑万维推出的开源推理大模型

MindLink - Grand modèle de raisonnement Open Source de KunlunWei

MindLink est un grand modèle de raisonnement open source lancé par Kunlun World Wide Web. Avec un mécanisme de raisonnement adaptatif, en fonction de la complexité de la tâche, le mode de raisonnement change de manière flexible, les tâches simples sont générées rapidement, les tâches complexes font l'objet d'un raisonnement approfondi, en tenant compte de l'efficacité et de la précision. Le paradigme de raisonnement guidé par le plan permet de supprimer l'étiquette "penser", de réduire ...
Il y a 4 semaines
08.9K
HYPIR - 中国科学院团队推出的新型图像复原大模型

HYPIR - Un nouveau grand modèle de restauration d'images introduit par une équipe de l'Académie chinoise des sciences

HYPIR est un grand modèle de restauration d'images introduit par l'équipe de Dong Chao à l'Institut des technologies avancées de Shenzhen, Académie chinoise des sciences. Le modèle combine l'a priori fractionnaire du modèle de diffusion avec un réseau génératif accusatoire pour réaliser une restauration d'image efficace et de haute qualité.HYPIR peut rapidement restaurer de vieilles photos et améliorer la résolution tout en gardant le texte clair...
Il y a 4 semaines
011.4K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - un modèle de programmation haute performance open source par Ali Tongyi

Qwen3-Coder-Flash est un modèle de programmation haute performance introduit par l'équipe d'Ali Tongyi Thousand Questions, avec d'excellentes capacités de programmation basée sur des agents et d'appel d'outils, capable de gérer des tâches de programmation complexes. Le modèle prend en charge 256K tokens de compréhension du contexte long, et peut s'étendre à 1M ...
Il y a 4 semaines
09.5K
Wide Research - Manus平台推出的多智能体协同功能

Wide Research - La collaboration multi-intelligence introduite sur la plateforme Manus

La recherche étendue est une fonction puissante de la plateforme Manus, conçue pour gérer des tâches complexes et à grande échelle. La plateforme prend en charge des centaines d'intelligences polyvalentes travaillant simultanément grâce à des mécanismes de traitement parallèle au niveau du système et à des protocoles de collaboration entre les intelligences.
Il y a 4 semaines
09.3K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

Seed Diffusion - le tout dernier modèle linguistique de diffusion de ByteHopper

Seed Diffusion est un modèle de langage de diffusion expérimental introduit par ByteHop qui gère les tâches de génération de code. Le modèle est basé sur des techniques telles que l'apprentissage par diffusion en deux étapes, l'apprentissage séquentiel contraint et le décodage parallèle efficace amélioré, ce qui améliore considérablement la vitesse d'inférence à 2 146 tokens/s, ce qui est plus rapide que...
Il y a 4 semaines
010.1K
小星绪 - 京东健康推出的AI情绪漫画生成产品

Hoshio - Lancement par Jingdong Health d'un produit de génération de mangas d'émotions par l'IA

Xiao Xingxu est un produit de génération de bandes dessinées émotionnelles par l'IA lancé par Jingdong Health, actuellement en phase de test. La fonction principale du produit est la génération de bandes dessinées émotionnelles, les utilisateurs peuvent exprimer leurs émotions ou raconter une histoire par le biais d'une entrée vocale ou textuelle, et l'IA génère des bandes dessinées à quatre panneaux et une interprétation de l'histoire sur la base de l'entrée.
Il y a 4 semaines
08.5K
1688 AI版 - 阿里旗下1688平台推出的AI生意助手

1688 AI Edition - assistant commercial IA lancé par la plateforme 1688 d'Ali

1688 AI version est une application d'assistant commercial intelligent lancée par la plateforme 1688 d'Alibaba, conçue pour les petits acheteurs et commerçants. Basée sur les données massives de la plateforme 1688, l'application offre des fonctions telles que l'encouragement des opportunités commerciales, la recommandation de produits, la génération d'idées, la recherche d'entreprises, etc.
Il y a 4 semaines
08.4K
阶跃深研 - 阶跃星辰推出的AI深入研究工具

Steps Deep Research - Outil de recherche approfondie en IA par Steps Star

Steps Deep Research est un outil de recherche IA efficace lancé par Steps Star, qui peut effectuer de manière autonome des recherches sur des questions complexes et générer des rapports professionnels en peu de temps. L'outil est conçu pour la finance, le conseil, la santé, le droit et d'autres domaines, et a excellé dans les revues de l'industrie grâce à ses capacités de recherche approfondie et d'intégration de l'information.
Il y a 4 semaines
08.5K
Runway Aleph - Runway推出的全新AI视频编辑模型

Runway Aleph - Nouveau modèle de montage vidéo IA de Runway

Runway Aleph est un modèle d'édition vidéo IA avancé lancé par Runway, qui est basé sur de simples commandes textuelles pour ajouter et supprimer rapidement du contenu vidéo, changer de style, ajuster l'environnement et optimiser les mouvements de caméra. Les utilisateurs peuvent facilement supprimer les éléments redondants, changer de scène sans opérations complexes...
Il y a 1 mois
09.8K
WebShaper - 阿里通义开源的AI训练数据合成系统

WebShaper - Système de synthèse de données d'entraînement à l'IA open source Ali Tongyi

WebShaper est un système de synthèse de données d'entraînement à l'IA lancé par le Tongyi Lab d'Alibaba, qui génère des données d'entraînement de haute qualité et évolutives basées sur des mécanismes de modélisation formelle et d'expansion de l'intelligence, aidant les intelligences IA à améliorer leurs capacités de recherche d'informations complexes. Le système introduit le concept de "projection des connaissances"...
Il y a 1 mois
09.8K
通义万相Wan2.2 - 阿里推出的开源AI视频生成模型

Tongyi Wanphase Wan 2.2 - Modèle de génération de vidéos AI open source lancé par Ali

Tongyi Wanphase Wan2.2 est un modèle avancé de génération de vidéos par l'IA mis à disposition par Alibaba, avec 27 milliards de références totales. Le modèle comprend trois modes de génération de vidéos : vidéo générée par le texte, vidéo générée par les graphes et vidéo unifiée. Il permet de générer des vidéos de haute qualité à partir de descriptions textuelles, d'images ou d'une combinaison des deux.
Il y a 1 mois
011.8K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - Smart Spectrum Open Source SOTA Model for Reasoning, Code and Intelligentsia (Modèle SOTA pour le raisonnement, le code et l'intelligence)

GLM-4.5 est un modèle SOTA open source de Smart Spectrum, conçu pour les applications de corps intelligents, incorporant des capacités de raisonnement, de génération de code et de corps intelligents. Le modèle est basé sur l'architecture Mixed Expert (MoE) et contient deux versions, GLM-4.5 avec 355 milliards de paramètres et 106 milliards...
Il y a 1 mois
010.5K
Coze Loop – 字节Coze开源的AI Agent开发与调试平台

Coze Loop - Byte Coze Open Source AI Agent Development and Debugging Platform (Plateforme de développement et de débogage d'agents d'intelligence artificielle open source)

Coze Loop est la plateforme open source de développement, d'exploitation et de gestion de l'intelligence artificielle de la plateforme Coze de ByteDance. La plateforme offre aux développeurs une gestion complète du cycle de vie depuis le développement, le débogage jusqu'à l'évaluation et la surveillance, couvrant l'ingénierie des mots-clés, l'évaluation de l'effet des agents, la surveillance et le réglage des performances...
Il y a 1 mois
010.8K
悟能 - 商汤科技最新推出的具身智能平台

Wuneng - la dernière plateforme d'intelligence corporelle de Shangtang Technology

Wuneng est une plateforme d'intelligence corporelle conçue pour les robots et les appareils intelligents. Basée sur le modèle du monde "éclairé" et la technologie des grands modèles multimodaux, Wuneng intègre des entrées multi-capteurs telles que la vision, la voix, le toucher, etc., et possède de puissantes capacités de perception, de prise de décision et d'action.
Il y a 1 mois
09.7K
Intern-S1 - 上海AI Lab开源的科学多模态大模型

Intern-S1 - Macromodèles scientifiques multimodaux open source du Shanghai AI Lab

Intern-S1 est un grand modèle scientifique multimodal lancé par le laboratoire d'intelligence artificielle de Shanghai. Le modèle intègre profondément les capacités linguistiques et multimodales, avec des fonctions puissantes telles que l'analyse scientifique multimodale, la fusion linguistique et visuelle, le traitement des données scientifiques, la réponse aux questions scientifiques, la conception et l'optimisation d'expériences.
Il y a 1 mois
010K
混元3D世界模型 1.0 - 腾讯推出的开源3D世界生成模型

Hybrid 3D World Model 1.0 - Modèle de génération de monde 3D open source de Tencent

Hunyuan 3D world model 1.0 (Hunyuan World 1.0) est le premier modèle de génération de monde immersif, interactif et de simulation de l'industrie open source de Tencent. Le modèle intègre la génération visuelle panoramique et la technologie de reconstruction 3D hiérarchique pour prendre en charge la saisie de texte ou d'image afin de générer rapidement 36...
Il y a 1 mois
09.3K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - Un grand modèle pour le raisonnement en finance par Anthem Digital

Agentar-Fin-R1 est un modèle de grand langage de pointe pour le domaine financier introduit par Anthem. Développé sur la base de la puissante architecture Qwen3, le modèle fournit deux versions d'échelle de paramètres, 8B et 32B, et peut traiter avec précision des tâches complexes de raisonnement financier, y compris l'analyse multi-étapes, l'évaluation du risque et la guerre....
Il y a 1 mois
08.9K
Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型

Seed LiveInterpret 2.0 - Un modèle d'interprétation simultanée de ByteHop !

Seed LiveInterpret 2.0 est un modèle d'interprétation simultanée de pointe lancé par l'équipe Seed de ByteDance, qui prend en charge la traduction bidirectionnelle entre le chinois et l'anglais. Le modèle offre une précision de traduction proche de la réalité et une latence extrêmement faible, avec un délai moyen de parole à parole de seulement 2 à 3 secondes, ce qui est bien inférieur à...
Il y a 1 mois
07.9K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

Seed GR-3 - Modèle robotique universel de l'équipe Wordpress Seed

Seed GR-3 est un modèle robotique polyvalent introduit par ByteDance, doté de fortes capacités de généralisation pour s'adapter à de nouveaux environnements et à des commandes complexes. Le modèle fusionne les informations visuelles, verbales et de mouvement, et est basé sur une méthode d'entraînement trois-en-un des données du robot, des données de trajectoire humaine VR et des données graphiques publiques afin d'améliorer la capacité à répondre à de nouveaux objets...
Il y a 1 mois
09.1K
Seed-X - 字节跳动推出的开源多语言翻译模型

Seed-X - Un modèle de traduction multilingue open source à partir de Wordpress

Seed-X est un modèle de traduction multilingue lancé par l'équipe Seed de ByteDance, avec 7 milliards de paramètres, prenant en charge la traduction bidirectionnelle dans 28 langues. Le modèle combine des techniques de pré-entraînement de données multilingues, de réglage fin des commandes et d'apprentissage par renforcement pour traiter efficacement des modèles linguistiques complexes et améliorer la qualité de la traduction...
Il y a 1 mois
011.6K