Ling-1T - 수조 개의 파라미터를 위한 Ant Group의 오픈 소스 범용 언어 모델

최신 AI 리소스1 일 전에 게시 됨 AI 공유 서클
4.2K 00
堆友AI

Ling-1T란 무엇인가요?

Ling-1T는 Ant Group에서 오픈소스화한 1조 개 매개변수 범용 언어 모델로, Bering의 대형 모델인 Ling 2.0 시리즈의 플래그십 제품에 속합니다. 이 모델은 고효율 MoE 아키텍처를 채택하고 128K 컨텍스트 윈도우를 지원하며 코드 생성, 수학적 추론, 논리 테스트 등 7개 벤치마크에서 GPT-5와 같은 주류 모델보다 뛰어난 성능을 발휘하며 특히 AIME 대회 수학 테스트에서 70.42% 정확도로 오픈 소스 모델 중 1위를 차지했습니다. FP8 혼합 정확도 훈련과 진화적 사고 체인 전략을 통해 추론 정확도와 효율성 사이의 파레토 최적화를 달성하여 최초로 1조 개 모델의 경량 추론 배포를 실현한 것이 혁신적입니다.

Ling-1T - 蚂蚁集团开源的万亿参数通用语言模型

Ling-1T 기능적 특징

  • 강력한 추론경쟁 수학 목록 AIME 25 테스트에서 Gemini-2.5-Pro보다 적은 토큰 소비로 70.42%의 정확도를 달성하여 Gemini-2.5-Pro를 능가하는 등 여러 복잡한 추론 벤치마크에서 SOTA 성능 달성; 종합 테스트인 Omni-Math와 UGMathBench에서 모두 74점을 돌파하고 87.45점을 달성했습니다. FinanceReasoning은 87.45점을 기록하여 강력한 논리적 일관성과 여러 영역을 넘나드는 추론 능력을 보여주었습니다.
  • 뛰어난 코드 생성 및 최적화 기술프로그래밍 대회 과제인 LiveCodeBench에서 딥시크보다 훨씬 높은 최고 점수, CodeForces 테스트에서 94.69점으로 GPT-5를 뛰어넘어 멀티엔드 환경에서 호환성이 높은 프론트엔드 코드를 생성할 수 있습니다.
  • 뛰어난 지적 이해력C-Eval, MMLU-Redux, MMLU-Pro, MMLU-Pro-STEM, OlympiadBench 등 여러 주요 데이터 세트에서 선두 또는 동률을 기록했으며, 전반적으로 DeepSeek, Kimi, GPT-5 백본 모델보다 1~3% 포인트 더 우수하며 일부 메트릭은 Gemini의 -2.5-Pro 상한에 근접하기도 합니다.
  • 효율적인 다자간 대화 기능에이전트 추론 및 다원 대화 시나리오에서 우수한 성능을 발휘하며, 특히 BFCL-v3 및 창의적 글쓰기와 같은 개방형 기능이 있는 작업에서 자연어 표현과 일관된 사고 사이의 균형을 보여줍니다.
  • 높은 효율성과 낮은 비용의 이유'대규모 매개변수 보유 + 소규모 매개변수 활성화'라는 패러다임을 채택하여 수조 개의 매개변수를 보유하지만 각 호출에 100억 개의 컴퓨팅 리소스만 필요하며, 에너지 효율이 크게 향상되고 엔드투엔드 추론 지연 시간이 200ms 미만으로 안정화되며 에너지 소비량은 유사한 비공개 소스 모델의 38%에 불과하여 기업 배포 비용이 크게 절감됩니다.
  • 긴 문맥 이해특히 법률, 금융, 과학 연구 및 기타 긴 문서 업무에서 단서를 놓치지 않고 한 번에 책 수준의 콘텐츠를 볼 수 있는 '긴 메모리' 경험에 가까운 최대 128K 컨텍스트 창을 지원하는 것은 매우 중요합니다.
  • 오픈 소스 협업 및 커뮤니티 지원코드와 가중치는 완전히 오픈 소스로 공개되어 있으며, 커뮤니티의 탐색과 피드백을 촉진하고 모델의 반복적인 개선을 가속화할 수 있도록 Hugging Face 및 기타 주요 오픈 소스 플랫폼에 게시되어 있습니다.

Ling-1T의 핵심 이점

  • 높은 추론 정확도경쟁 수학 및 전문 수학 등의 영역에서 여러 복잡한 추론 벤치마크 테스트에서 우수한 성적을 거두며 정확성에서 앞서고 강력한 논리적 추론 능력을 보여줍니다.
  • 강력한 일반화 기능뛰어난 추론 마이그레이션 및 일반화 기능으로 지능형 신체 도구 호출과 같은 교차 도메인 작업에서 적은 양의 명령어 미세 조정만으로 높은 정확도를 달성할 수 있습니다.
  • 강력한 의무 이행 역량복잡한 자연어 명령을 정확하게 이해하고 코드 생성 및 카피라이팅과 같은 포괄적인 작업을 자율적으로 완료하여 다양한 요구 사항을 충족할 수 있습니다.
  • 매우 효율적인 추론'대규모 파라미터 예약 + 소규모 파라미터 활성화'라는 패러다임을 채택하여 엔드투엔드 추론 지연 시간을 200ms 미만으로 안정화하고 에너지 소비를 낮춰 기업 배포 비용을 크게 절감합니다.

Ling-1T의 공식 웹사이트는 무엇인가요?

  • 스피리투스 전공 모델:: https://ling.tbox.cn/chat
  • 허깅페이스 모델 라이브러리:: https://huggingface.co/inclusionAI/Ling-1T

Ling-1T가 필요한 사람

  • 소프트웨어 개발자Ling-1T의 강력한 코드 생성 및 최적화 기능을 사용하여 고품질 코드 스니펫을 빠르게 생성하고 개발 효율성을 개선하며 반복적인 작업을 줄일 수 있습니다.
  • (과학) 연구원복잡한 과학 데이터 작업, 학술 논문 작성, 학제 간 연구 수행 시 Ling-1T의 긴 맥락 이해와 추론 능력은 강력한 지원을 제공할 수 있습니다.
  • 금융 전문가금융 데이터 분석, 위험 평가 및 투자 의사 결정과 같은 영역에서 Ling-1T의 효율적인 추론 및 지식 이해 기능은 대량의 금융 정보를 신속하게 처리하고 정확한 분석 및 권장 사항을 제공하는 데 도움이 됩니다.
  • 교육자콘텐츠 생성, 커리큘럼 설계 및 학생 학습 경로 계획에 사용하여 교사가 보다 효율적으로 가르칠 수 있도록 도와줍니다.
  • 콘텐츠 크리에이터카피라이팅, 크리에이티브 글쓰기, 비디오 스크립팅 등을 포함하여 Ling-1T는 필요에 따라 창의력을 자극하는 고품질 콘텐츠를 생성합니다.
  • 기업 의사 결정권자비즈니스 전략, 시장 분석 및 전략 계획을 개발할 때 Ling-1T는 데이터 기반 인사이트와 권장 사항을 제공하여 의사 결정 프로세스를 지원할 수 있습니다.
© 저작권 정책

관련 게시물

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...