Cercle de partage de l'IA

Partage quotidien des derniers produits, projets, cadres, interprétations de documents, etc.~ en matière d'IA
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

méso (chimie)Meeseeks - Ensemble d'évaluation open-source Meeseeks pour évaluer la capacité à suivre les instructions d'un modèle

Meeseeks est un ensemble d'évaluation de grands modèles open source utilisé par l'équipe M17 de Meituan pour évaluer la capacité d'un modèle à suivre les instructions. Meeseeks utilise un cadre d'évaluation à trois niveaux pour mesurer de manière exhaustive si un modèle est capable de générer des réponses en stricte conformité avec les instructions de l'utilisateur, du niveau macro au niveau micro, et n'évalue pas la connaissance du contenu de la réponse comme un élément positif....
Il y a 14 heures
01.3K
gpt-realtime - OpenAI最新推出的AI语音模型

méso (chimie)gpt-realtime - Le dernier modèle vocal d'IA de l'OpenAI

gpt-realtime est un modèle vocal avancé d'OpenAI qui prend en charge le traitement audio direct pour générer une parole naturelle et fluide. Le modèle prend en charge plusieurs langues et styles, comprend les signaux non verbaux tels que le rire et peut passer d'une langue à l'autre.
Il y a 17 heures
01.4K
Youtu-agent - 腾讯开源的高效智能体框架

méso (chimie)Youtu-agent - Tencent open source efficient intelligent body framework

Youtu-agent est un framework open source pour la construction et l'exécution d'intelligences autonomes de Tencent Youtu Labs. Le framework est performant dans les benchmarks WebWalkerQA et GAIA, avec une précision de 71,47% et 72,8% respectivement....
il y a 1 jour
03.4K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

méso (chimie)HunyuanVideo-Foley - Modèle de génération de sons vidéo open source de Tencent

HunyuanVideo-Foley est un modèle open source de génération de sons vidéo conçu par l'équipe de Tencent Mixed Yuan, qui permet d'ajouter des effets sonores adaptés à des vidéos muettes. Le modèle est basé sur l'entraînement d'un ensemble de données à grande échelle, avec une architecture de convertisseur de diffusion multimodale, combinée à la représentation de la fonction de perte d'alignement et aux techniques d'optimisation de la VAE audio ...
Il y a 2 jours
02.7K
PixVerse V5 - 爱诗科技推出的自研AI视频模型

méso (chimie)PixVerse V5 - Modèle vidéo IA auto-développé lancé par Aishi Technologies

PixVerse V5 est un grand modèle de génération vidéo par IA lancé par Aishi Technology. Le modèle peut générer un contenu vidéo de haute qualité sur la base de descriptions textuelles ou d'images saisies par l'utilisateur, et prend en charge une variété de styles, tels que l'anime, la science-fiction et le style national.
Il y a 2 jours
03.3K
问小白5 - 问小白推出的全能AI模型

méso (chimie)Ask White 5 - Modèle d'IA tout-en-un de Ask White

Ask White 5 est le modèle phare "Tout en un" avec un niveau d'intelligence très élevé. Ce modèle obtient de bons résultats dans de nombreuses évaluations, comme le score composite de 64,7 de l'indice AA et le score de 86 de l'évaluation des capacités STEM, qui est proche du GPT-5, le meilleur au monde.
Il y a 2 jours
03.7K
Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image - Le modèle de génération et d'édition d'images le plus puissant de Google

Gemini 2.5 Flash Image (nom de code nano banana) est un modèle de génération et d'édition d'images de pointe de Google qui maintient la cohérence des personnages d'une scène à l'autre et prend en charge l'édition précise d'images par le biais du langage naturel, par exemple en rendant les arrière-plans flous et en supprimant les taches.
il y a 3 jours
05.6K
Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - Modèle open source de génération vidéo pilotée par l'audio d'Ali Tongyi

Wan2.2-S2V est un modèle de génération vidéo multimodale open source d'Ali Tongyi. Il suffit d'une image statique et d'un morceau d'audio pour générer une vidéo humaine numérique de haute qualité et prendre en charge une variété de types d'images et de cadres.
il y a 3 jours
05.7K
吴恩达面向开发者的ChatGPT提示工程免费课程

Cours gratuit sur ChatGPT Tip Engineering for Developers par Ernest Ng

ChatGPT Tip Engineering for Developers est un cours conjoint de DeepLearning.AI et OpenAI conçu pour les développeurs, avec Isa Fulford, Andrew Ng pour enseigner comment utiliser les grands modèles de langage (LLM)....
il y a 3 jours
05.4K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - Un modèle de réflexion parallèle introduit par Ask o4 qui ouvre 8 pistes de réflexion en même temps.

Ask White o4 est un modèle innovant de réflexion parallèle qui ouvre 8 voies de réflexion en même temps, analyse le problème sous plusieurs angles et filtre automatiquement la solution optimale. Le modèle incorpore des techniques avancées d'apprentissage par renforcement Long-CoT et d'apprentissage par récompense de processus, possède de puissantes capacités de raisonnement profond et donne de bons résultats dans les tâches complexes.
Il y a 4 jours
07.2K