Volcano Ark lance le Big Model Application Lab : des modèles d'applications industrielles open source pour accélérer le lancement de l'IA en entreprise.
Aujourd'hui, les performances des grands modèles nationaux et étrangers tels que DeepSeek deviennent de plus en plus puissantes, et l'industrie estime généralement que les applications de l'IA connaîtront une croissance explosive en 2025. Cependant, les entreprises, même si elles disposent de grands modèles puissants, sont toujours confrontées aux problèmes des scènes d'application peu claires et des formulaires d'application incertains. L'année dernière, l'industrie s'est concentrée sur la manière de mettre en œuvre concrètement la technologie des grands modèles dans les applications industrielles et de développer des produits d'IA réellement utiles ; il s'agit également d'un problème que de nombreuses entreprises continuent d'explorer.
Sur la base de notre longue expérience de l'utilisation du service de modélisation des sacs de haricots, nous constatons quearche volcaniqueElle a récemment lancé le "Big Model Application Lab", dont les principales caractéristiques sont "facile à intégrer, facile à mettre en place, plus ouvert". En d'autres termes, Volcano Ark fournit une série de scénarios d'application sélectionnés pour les entreprises et développe des applications d'IA de haute qualité en tant que modèles industriels, qui sont fournis sous la forme d'une source ouverte pour les entreprises qui en ont besoin.

Générateur de vidéos bilingues interactives : un nouveau paradigme pour l'animation éducative basée sur l'IA
En tant que développeurs d'agents, notre équipe s'est intéressée à une application appelée "Interactive Bilingual Video Generator" dans Volcano Ark et a décidé de la déployer et de la tester. Nous espérons profiter de cette occasion pour explorer le potentiel de l'animation par l'IA dans le domaine de l'éducation.
Guide de déploiement rapide
Les étapes clés sont expliquées en détail ci-dessous pour faciliter la compréhension et l'utilisation.
Tout d'abord, le dépôt de code spécifique doit être cloné :
# 仓库下载
git clone https://github.com/volcengine/ai-app-lab.git
# 进入对应具体目录
cd demohouse/chat2cartoon
Ensuite, ouvrez le .env
pour configurer les variables d'environnement. Vous devez configurer les paramètres relatifs aux modèles de graphiques générés par le texte, à la synthèse vocale, à la génération de vidéos et à la compréhension de vidéos.
# 大模型接入点ID,用于脚本创作、分镜、角色 https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenTokenDrawer=false
LLM_ENDPOINT_ID='ep-xxx'
# 视觉理解大模型接入点ID,用于最终视频影片交互
VLM_ENDPOINT_ID='ep-2025xxx'
# 火山引擎TOS储存桶名,用于存储模型产物 https://console.volcengine.com/tos/bucket/
TOS_BUCKET='chat2'
# 语音技术API Access Key https://console.volcengine.com/speech/service/
TTS_ACCESS_KEY='7naxxx'
# 语音技术API Resource ID https://console.volcengine.com/speech/service/
TTS_API_RESOURCE_ID='volc.service_type.10029'
# 语音技术App Key https://console.volcengine.com/speech/service/
TTS_APP_KEY='113xxx'
# 生视频大模型接入点ID(暂时只支持Doubao-视频生成模型)
CGT_ENDPOINT_ID='ep-20250306153842-pg2b4'
# 火山方舟API Key,用于方舟模型接入点推理时做鉴权 https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey
ARK_API_KEY='99831b24-55xxxx'
# 火山引擎账号Access Key,用于访问TOS API,上传模型产物 https://console.volcengine.com/iam/keymanage/
VOLC_ACCESSKEY='AKLTYxxxx'
# 火山引擎账号Secret Key,用于访问TOS API,上传模型产物 https://console.volcengine.com/iam/keymanage/
VOLC_SECRETKEY='Tmprexxxx'
Ouverture et configuration du service Volcano Ark
Tout d'abord, vous devez ouvrir les services pertinents de Volcano Ark (tous les types de modèles d'IA sont fournis sur cette plateforme). Après vous être connecté à Volcano Ark, recherchez et cliquez sur "Open Management" dans le coin inférieur gauche de la page, et ouvrez respectivement le service du grand modèle linguistique et du grand modèle visuel.


Après avoir ouvert le service de modèle, vous devez créer le point d'accès, qui est le modèle réel à utiliser. Cliquez sur "Online Reasoning" sur le côté gauche, puis sur "Custom Reasoning Access Point" pour créer un point d'accès d'inférence.

Remplissez les informations conformément aux invites de la page, ajoutez le modèle spécifique requis, puis confirmez l'accès.

Une fois la création réussie, copiez l'ID du point d'accès.

Les choix de modèles spécifiques peuvent être ajustés en fonction des besoins et des préférences réels. Dans ce test, nous avons choisi les modèles suivants :
LLM_ENDPOINT_ID
optionDoubao-1.5-pro-32k
VLM_ENDPOINT_ID
optionDoubao-vision-pro-32k
CGT_ENDPOINT_ID
optionDoubao-视频生成-Seaweed
Pour obtenir la clé API de ces modèles (c'est-à-dire ARK_API_KEY
Si vous souhaitez créer une nouvelle clé API, vous pouvez la gérer dans le coin inférieur gauche de la page. Si vous souhaitez créer une nouvelle clé API, vous pouvez la gérer dans le coin inférieur gauche de la page.


Configuration des bacs de stockage TOS
Cliquez sur l'espace de stockage TOS créé pour configurer l'accès interdomaine.

Veuillez ajuster les paramètres spécifiques en fonction des scénarios d'application réels. Les configurations de paramètres fournies dans cet article ne sont que des exemples à titre de référence (veuillez faire attention lors de la configuration de l'environnement de production).

Contrôle d'accès au moteur du volcan
Ensuite, allez sur la page de contrôle d'accès du moteur volcanique :
https://console.volcengine.com/iam/keymanage/
Obtient la clé d'accès et la clé secrète du moteur Volcano pour accéder à l'API TOS.
correspondant à .env
dans le fichier VOLC_ACCESSKEY
répondre en chantant VOLC_SECRETKEY
Paramètres.
Configuration du stockage d'objets
L'API TOS est utilisée pour télécharger les fichiers générés par le modèle. Accédez à la page Stockage d'objets :
https://console.volcengine.com/tos
Cliquez sur "Bucket List", puis sur "Create Bucket", remplissez les informations nécessaires à la création d'un godet de stockage. Dans cet exemple, le nom de l'unité créée est chat2
Par conséquent, le .env
Papiers TOS_BUCKET
Le paramètre doit être réglé sur chat2
.

Configuration de la technologie vocale
Enfin, la section de la technologie vocale est configurée. Visitez la plateforme de technologie vocale Volcano Engine :
https://console.volcengine.com/speech/app
Créez une application et sélectionnez les services "Synthèse vocale grand modèle" et "Reconnaissance vocale en continu grand modèle".

Une fois créé, cliquez sur n'importe quel menu à gauche pour trouver l'identifiant APP et le jeton d'accès ci-dessous.
Selon la documentation officielle de Volcano Engine.
TTS_ACCESS_KEY
correspondant au jeton d'accès.
TTS_APP_KEY
Correspond à l'ID APP.

https://www.volcengine.com/docs/6561/1329505
Jusqu'à présent..env
La configuration des fichiers est terminée. Ensuite, vous devez installer les dépendances du projet et exécuter le programme.
fonctionnement en arrière-plan
# 进入后端
cd backend
# 安装 poetry
pip install poetry==1.6.1
# 用 poetry 安装依赖库
poetry install
# 后端启动!
poetry run python index.py
Si l'exécution est réussie, le terminal affichera une sortie similaire au message suivant.

opération frontale
# 进入前端
cd frontend
# 安装 pnpm
npm install -g pnpm@8
# 利用 pnpm 安装依赖包
pnpm install
# 复制环境变量 .env 文件
cp ../.env ./
# 前端启动!
pnpm dev
Si l'exécution est réussie, le terminal affichera une sortie similaire au message suivant.

Une fois que vous avez terminé les étapes ci-dessus, vous pouvez visiter dans votre navigateur http://localhost:8080/
Commencez à utiliser le générateur de vidéos bilingues interactives.
Architecture du projet et résultats des tests
L'architecture générale du processus du projet est présentée ci-dessous :

Les résultats des tests montrent que "Interactive Bilingual Video Generator" permet aux utilisateurs de générer des vidéos d'une minute en un seul clic, ce qui est extrêmement facile et efficace. Les utilisateurs n'ont pas besoin de régler des paramètres compliqués, ils n'ont qu'à entrer les exigences de la vidéo et peuvent rapidement générer de longues vidéos qui répondent aux exigences, ce qui améliore grandement l'efficacité de la création.
Les vidéos générées sont de haute qualité, avec des graphiques clairs et fluides et un scénario cohérent et naturel. En outre, l'application prend en charge les questions-réponses interactives avec les utilisateurs sur le contenu vidéo.
L'application de l'open source : une étape clé pour faire décoller les grands modèles
à travers (une brèche) Coze L'application modélisée de la plateforme au lancement du Volcano Ark AI Application Open Source Lab représente non seulement l'extension de la solution du low-code au high-code, mais marque également l'évolution du scénario d'application de la généralité à la personnalisation approfondie.
Dans la vague d'application de la technologie des grands modèles, l'importance stratégique de l'application open source va même au-delà du modèle open source lui-même. Il est vrai qu'un modèle puissant est le moteur de l'application de l'IA, mais la manière d'intégrer efficacement la capacité du modèle dans les scénarios commerciaux réels est la clé pour promouvoir l'atterrissage de l'application de l'IA et, en fin de compte, améliorer la capacité commerciale.
Volcano Engine Open Source AI Lab fournit des SDK et des prototypes d'applications d'IA en code source ouvert, qui comblent précisément le "dernier kilomètre" pour l'atterrissage des applications d'IA. Les applications d'IA à code source ouvert constituent une solution de démarrage rapide pour les entreprises.
Bien que de nombreuses entreprises reconnaissent l'énorme potentiel des grands modèles et comprennent comment les appliquer à leurs scénarios commerciaux d'un point de vue théorique, elles se heurtent encore à de nombreux obstacles dans la pratique. L'émergence d'applications prototypes d'IA à code source ouvert permet aux développeurs d'entreprises d'apprendre rapidement et de créer et développer des applications d'IA qui répondent à leurs besoins commerciaux sans avoir à partir de zéro pour comprendre le processus complexe d'ancrage du modèle et de développement de l'application, réduisant ainsi considérablement les coûts d'essais et d'erreurs, les coûts de temps et les coûts de main-d'œuvre.
Pour la majorité des passionnés et des développeurs de technologies d'IA, lorsqu'ils s'engagent pour la première fois dans le domaine du développement d'applications d'IA, ils entrent souvent en contact avec des cadres hautement encapsulés avec un haut degré d'abstraction, tels que LangChain. Le cadre LangChain, s'il est bien maîtrisé, peut en effet améliorer de manière significative l'efficacité du développement, mais son grand nombre de sucres syntaxiques et de concepts abstraits, mais aussi le débutant, apportent un seuil d'apprentissage plus élevé. En revanche, Arkitect, le SDK Python fourni par Volcano Engine, est plus facile à démarrer, et sa chaîne d'outils et son processus de développement sont plus intuitifs. En outre, la démo officielle fournit également un diagramme d'architecture technique détaillé et des détails de mise en œuvre, ce qui permet aux développeurs de comprendre en profondeur.
Le lancement du laboratoire d'applications d'IA de l'Arche du Volcan constitue sans aucun doute une puissante plateforme de développement d'applications d'IA pour les entreprises et les développeurs. Il est particulièrement louable que sa stratégie d'open source ait abaissé le seuil de développement d'applications d'IA et accéléré le processus d'atterrissage de la technologie des grands modèles dans diverses industries. Avec l'émergence d'un plus grand nombre d'applications open source, nous avons des raisons de croire que la technologie de l'IA sera véritablement intégrée dans des milliers d'industries et qu'elle libérera un plus grand potentiel.
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...