볼케이노 아크, 빅 모델 애플리케이션 랩 출시: 엔터프라이즈 AI 연착륙을 가속화하는 오픈 소스 산업 애플리케이션 템플릿
현재 딥서치와 같은 국내외 빅모델의 성능은 점점 더 강력해지고 있으며, 업계에서는 2025년에 AI 애플리케이션이 폭발적인 성장을 이룰 것으로 예상하고 있습니다. 그러나 기업 입장에서는 강력한 빅 모델을 보유하고도 여전히 불명확한 적용 장면과 불확실한 적용 형태라는 문제에 직면해 있습니다. 빅 모델 기술을 산업 애플리케이션에 실질적으로 구현하고 진정으로 가치 있는 AI 제품을 개발하는 방법은 지난 한 해 동안 업계의 초점이었으며, 많은 기업이 계속해서 탐구하고 있는 문제이기도 합니다.
빈백 모델링 서비스를 오랫동안 사용해 온 경험을 바탕으로 다음과 같은 점에 주목합니다.화산 방주최근 "통합하기 쉽고, 착륙하기 쉽고, 더 개방적"이라는 핵심 기능을 갖춘 "빅 모델 애플리케이션 랩"을 출시했습니다. 간단히 말해, 볼케이노 아크는 기업을 위해 엄선된 일련의 애플리케이션 시나리오를 제공하고 고품질의 AI 애플리케이션을 산업 템플릿으로 개발하여 필요한 기업이 오픈 소스 형태로 이용할 수 있도록 제공합니다.

인터랙티브 이중 언어 비디오 생성기: AI 기반 교육용 애니메이션의 새로운 패러다임
에이전트 개발자로서 저희 팀은 볼케이노 아크의 "대화형 이중 언어 비디오 생성기"라는 애플리케이션에 관심을 갖게 되었고, 이를 배포하고 테스트하기로 결정했습니다. 이번 기회를 통해 교육 분야에서 AI 애니메이션의 잠재력을 탐구할 수 있기를 바랍니다.
신속한 배포 가이드
주요 단계를 쉽게 이해하고 조작할 수 있도록 아래에 자세히 설명되어 있습니다.
먼저 특정 코드 리포지토리를 복제해야 합니다:
# 仓库下载
git clone https://github.com/volcengine/ai-app-lab.git
# 进入对应具体目录
cd demohouse/chat2cartoon
그런 다음 .env
파일을 사용하여 환경 변수를 구성합니다. 텍스트 생성 그래프, 음성 합성, 비디오 생성 및 비디오 이해 모델과 관련된 매개 변수를 구성해야 합니다.
# 大模型接入点ID,用于脚本创作、分镜、角色 https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenTokenDrawer=false
LLM_ENDPOINT_ID='ep-xxx'
# 视觉理解大模型接入点ID,用于最终视频影片交互
VLM_ENDPOINT_ID='ep-2025xxx'
# 火山引擎TOS储存桶名,用于存储模型产物 https://console.volcengine.com/tos/bucket/
TOS_BUCKET='chat2'
# 语音技术API Access Key https://console.volcengine.com/speech/service/
TTS_ACCESS_KEY='7naxxx'
# 语音技术API Resource ID https://console.volcengine.com/speech/service/
TTS_API_RESOURCE_ID='volc.service_type.10029'
# 语音技术App Key https://console.volcengine.com/speech/service/
TTS_APP_KEY='113xxx'
# 生视频大模型接入点ID(暂时只支持Doubao-视频生成模型)
CGT_ENDPOINT_ID='ep-20250306153842-pg2b4'
# 火山方舟API Key,用于方舟模型接入点推理时做鉴权 https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey
ARK_API_KEY='99831b24-55xxxx'
# 火山引擎账号Access Key,用于访问TOS API,上传模型产物 https://console.volcengine.com/iam/keymanage/
VOLC_ACCESSKEY='AKLTYxxxx'
# 火山引擎账号Secret Key,用于访问TOS API,上传模型产物 https://console.volcengine.com/iam/keymanage/
VOLC_SECRETKEY='Tmprexxxx'
볼케이노 아크 서비스 열기 및 설정
먼저 볼케이노 아크의 관련 서비스를 열어야 합니다(모든 종류의 AI 모델이 이 플랫폼에서 제공됨). 볼케이노 아크에 로그인한 후 페이지 왼쪽 하단에서 '관리 열기'를 찾아 클릭하고 각각 빅 언어 모델과 비주얼 빅 모델 서비스를 엽니다.


모델 서비스를 연 후에는 실제 사용할 모델인 액세스 포인트를 만들어야 합니다. 왼쪽의 '온라인 추론'을 클릭한 다음 '사용자 지정 추론 액세스 포인트'를 클릭하여 추론 액세스 포인트를 생성합니다.

페이지의 안내에 따라 정보를 입력하고 필요한 특정 모델을 추가한 다음 액세스를 확인합니다.

생성에 성공하면 액세스 포인트 ID를 복사합니다.

구체적인 모델 선택은 실제 필요와 선호도에 따라 조정할 수 있습니다. 이 테스트에서는 다음 모델을 선택했습니다:
LLM_ENDPOINT_ID
옵션Doubao-1.5-pro-32k
VLM_ENDPOINT_ID
옵션Doubao-vision-pro-32k
CGT_ENDPOINT_ID
옵션Doubao-视频生成-Seaweed
이러한 모델에 대한 API 키를 얻으려면(예 ARK_API_KEY
새 API 키를 생성하려면 페이지 왼쪽 하단에서 관리할 수 있습니다. 새 API 키를 생성해야 하는 경우 페이지 왼쪽 하단에서 관리할 수 있습니다.


TOS 스토리지 버킷 구성
생성된 TOS 스토리지 버킷을 클릭하여 도메인 간 액세스를 구성합니다.

구체적인 매개변수는 실제 애플리케이션 시나리오에 따라 조정하시기 바랍니다. 이 문서에 제공된 매개변수 구성은 참고용 예시일 뿐입니다(프로덕션 환경을 구성할 때는 주의하세요).

볼케이노 엔진 액세스 제어
다음으로 볼케이노 엔진의 액세스 제어 페이지로 이동합니다:
https://console.volcengine.com/iam/keymanage/
TOS API에 액세스하기 위한 볼케이노 엔진의 액세스 키와 비밀 키를 가져옵니다.
에 해당하는 .env
파일에 VOLC_ACCESSKEY
노래로 응답 VOLC_SECRETKEY
매개변수.
오브젝트 스토리지 구성
TOS API는 모델 생성 파일을 업로드하는 데 사용됩니다. 객체 저장소 페이지로 이동합니다:
https://console.volcengine.com/tos
"버킷 목록"을 클릭한 다음 "버킷 만들기"를 클릭하고 관련 정보를 입력하여 스토리지 버킷을 만듭니다. 이 예에서 생성된 버킷의 이름은 다음과 같습니다. chat2
따라서 .env
논문 TOS_BUCKET
매개 변수를 다음과 같이 설정해야 합니다. chat2
.

음성 기술 구성
마지막으로 음성 기술 섹션이 구성됩니다. 볼케이노 엔진 음성 기술 플랫폼을 방문하세요:
https://console.volcengine.com/speech/app
애플리케이션을 만들고 '대형 모델 음성 합성' 및 '스트리밍 음성 인식 대형 모델' 서비스를 선택합니다.

생성한 후 왼쪽의 메뉴를 클릭하여 아래에서 앱 ID와 액세스 토큰을 찾습니다.
볼케이노 엔진 공식 문서에 따르면.
TTS_ACCESS_KEY
액세스 토큰에 해당합니다.
TTS_APP_KEY
앱 ID에 해당합니다.

https://www.volcengine.com/docs/6561/1329505
여기까지입니다..env
파일 구성이 완료되었습니다. 다음으로 프로젝트 종속 요소를 설치하고 프로그램을 실행해야 합니다.
백엔드 작업
# 进入后端
cd backend
# 安装 poetry
pip install poetry==1.6.1
# 用 poetry 安装依赖库
poetry install
# 后端启动!
poetry run python index.py
실행에 성공하면 터미널에 다음 메시지와 유사한 출력이 표시됩니다.

프런트엔드 운영
# 进入前端
cd frontend
# 安装 pnpm
npm install -g pnpm@8
# 利用 pnpm 安装依赖包
pnpm install
# 复制环境变量 .env 文件
cp ../.env ./
# 前端启动!
pnpm dev
실행에 성공하면 터미널에 다음 메시지와 유사한 출력이 표시됩니다.

위 단계를 완료하면 브라우저에서 방문하실 수 있습니다. http://localhost:8080/
대화형 이중 언어 동영상 생성기 사용을 시작하세요.
프로젝트 아키텍처 및 테스트 결과
프로젝트의 전체 프로세스 아키텍처는 아래와 같습니다:

테스트 결과, '인터랙티브 이중 언어 동영상 생성기'는 사용자가 클릭 한 번으로 1분 길이의 동영상을 생성할 수 있어 조작이 매우 쉽고 효율적인 것으로 나타났습니다. 사용자는 복잡한 매개 변수 설정을 할 필요 없이 동영상 요구 사항을 입력하기만 하면 요구 사항을 충족하는 긴 동영상 작품을 빠르게 생성할 수 있어 제작 효율성이 크게 향상됩니다.
생성된 동영상은 선명하고 부드러운 그래픽과 일관되고 자연스러운 스토리라인을 갖춘 고품질의 동영상입니다. 또한 이 앱은 동영상 콘텐츠에 대한 사용자와의 대화형 Q&A를 지원합니다.
오픈 소스 적용: 대형 모델을 출시하기 위한 핵심 단계
통해 (틈새) Coze 볼케이노 아크 AI 애플리케이션 오픈 소스 랩의 출범을 위한 플랫폼의 템플릿 적용은 로우 코드에서 하이 코드로의 솔루션 확장을 의미할 뿐만 아니라, 애플리케이션 시나리오가 일반성에서 심층 맞춤화로 진화했음을 의미합니다.
빅 모델 기술 적용의 물결 속에서 애플리케이션 오픈소스의 전략적 중요성은 모델 오픈소스 자체를 넘어선다. 강력한 모델이 AI 애플리케이션의 엔진인 것은 사실이지만, 모델 기능을 실제 비즈니스 시나리오에 어떻게 효율적으로 통합하느냐가 AI 애플리케이션의 연착륙을 촉진하고 궁극적으로 비즈니스 역량을 향상시키는 열쇠가 되기 때문입니다.
볼케이노 엔진 오픈 소스 AI 랩은 오픈 소스, 하이코드 SDK 및 프로토타입 AI 애플리케이션을 제공하여 AI 애플리케이션의 '마지막 1킬로미터'를 정확하게 채워줍니다. 오픈 소스 AI 애플리케이션은 기업을 위한 빠른 시작 솔루션을 제공합니다.
많은 기업이 빅 모델의 엄청난 잠재력을 인식하고 이론적 수준에서 비즈니스 시나리오에 적용하는 방법을 이해하고 있지만, 실제 운영에서는 여전히 많은 장애물에 직면해 있습니다. 오픈 소스 AI 프로토타입 애플리케이션의 등장으로 기업 개발자는 복잡한 모델 도킹 및 애플리케이션 개발 프로세스를 파악하기 위해 처음부터 시작할 필요 없이 비즈니스 요구 사항을 충족하는 AI 애플리케이션을 빠르게 학습하고 구축 및 확장할 수 있어 시행착오 비용, 시간 비용, 인건비를 크게 절감할 수 있습니다.
대부분의 AI 기술 애호가와 개발자들은 처음 AI 애플리케이션 개발 분야에 참여하게 될 때 LangChain과 같이 고도로 추상화된 고도로 캡슐화된 프레임워크를 접하게 됩니다. 숙련된 숙달자의 경우 LangChain 프레임워크는 실제로 개발 효율성을 크게 향상시킬 수 있지만, 많은 구문 설탕과 추상적인 개념으로 인해 초보자에게는 학습 문턱이 높을 수 있습니다. 이에 반해 Volcano Engine에서 제공하는 Python SDK인 Arkitect는 시작하기가 더 쉽고 도구 체인과 개발 프로세스가 더 직관적입니다. 또한 공식 데모에서는 상세한 기술 아키텍처 다이어그램과 구현 세부 사항도 제공하므로 개발자가 깊이 있게 이해하기에 편리합니다.
볼케이노 아크 AI 애플리케이션 랩의 출시는 의심할 여지없이 기업과 개발자에게 강력한 AI 애플리케이션 개발 플랫폼을 제공합니다. 특히 오픈 소스 전략을 통해 AI 애플리케이션 개발의 문턱을 낮추고 다양한 산업 분야에서 빅 모델 기술의 연착륙 과정을 가속화했다는 점은 높이 평가할 만합니다. 더 많은 오픈 소스 애플리케이션이 등장함에 따라 AI 기술이 수천 개의 산업에 진정으로 통합되고 더 큰 잠재력을 발휘할 것이라고 믿습니다.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...