Ling-1T - универсальная модель языка с открытым исходным кодом от Ant Group с триллионами параметров

堆友AI

Что такое Ling-1T?

Ling-1T - это универсальная языковая модель с триллионом параметров, открытая компанией Ant Group и являющаяся флагманским продуктом серии Ling 2.0 больших моделей Bering. Модель использует высокоэффективную архитектуру MoE, поддерживает 128K контекстных окон и превосходит основные модели, такие как GPT-5, в 7 бенчмарках, включая генерацию кода, математические рассуждения и логические тесты, особенно в математическом тесте конкурса AIME с показателем точности 70.42%, возглавляя список моделей с открытым исходным кодом. Его инновации заключаются в достижении оптимального по Парето соотношения между точностью и эффективностью рассуждений благодаря смешанному обучению FP8 и стратегии эволюционной мыслительной цепочки, что впервые позволило добиться облегченного развертывания триллионных моделей рассуждений.

Ling-1T - 蚂蚁集团开源的万亿参数通用语言模型

Функциональные особенности Ling-1T

  • Сильные рассуждения: Достигнуты результаты SOTA в ряде сложных эталонов рассуждений, например, показатель точности 70,42% при меньшем потреблении токенов, чем у Gemini-2.5-Pro, в тесте Competition Maths List AIME 25, превосходящем Gemini-2.5-Pro; преодолен рубеж в 74 балла в комплексных тестах Omni-Math и UGMathBench и получен балл 87,45 в FinanceReasoning достиг 87,45 балла, продемонстрировав сильную логическую последовательность и способность к межпредметным рассуждениям.
  • Отличные навыки создания и оптимизации кода: Наивысший результат в LiveCodeBench, соревновательной задаче по программированию, значительно выше, чем у DeepSeek; 94,69 балла в тесте CodeForces, превышающий GPT-5, способность генерировать высокосовместимый внешний код для мультиэндовых сред.
  • Отличное интеллектуальное понимание: Лидирует или имеет преимущество в нескольких ключевых наборах данных, включая C-Eval, MMLU-Redux, MMLU-Pro, MMLU-Pro-STEM, OlympiadBench и т.д., и в целом на 1-3 процентных пункта превосходит базовые модели DeepSeek, Kimi и GPT-5, а некоторые метрики даже приближаются к верхней границе Gemini -2.5-Pro.
  • Возможность эффективного многораундового диалога: Он демонстрирует хорошие результаты в сценариях агентного рассуждения и многораундового диалога, особенно в заданиях с открытыми возможностями, таких как BFCL-v3 и Creative-Writing, показывая баланс между естественным языковым выражением и последовательным мышлением.
  • Обоснование высокой эффективности и низкой стоимостиОна использует парадигму "большой запас параметров + малая активация параметров", храня триллионы параметров, но требуя всего 10 миллиардов вычислительных ресурсов для каждого вызова, со значительным увеличением энергоэффективности, задержкой при сквозном рассуждении, стабилизированной на уровне менее 200 мс, и энергопотреблением всего 38% по сравнению с аналогичными моделями с закрытым исходным кодом, что значительно снижает стоимость развертывания на предприятии.
  • длительное контекстуальное пониманиеПоддержка до 128K контекстных окон, близких к опыту "долгой памяти", содержание уровня книги на одном дыхании, без потери подсказок, особенно для юридических, финансовых, научных исследований и других длинных документов бизнеса, имеет решающее значение.
  • Сотрудничество с открытым исходным кодом и поддержка сообществаКод и весовые коэффициенты полностью открыты и опубликованы на Hugging Face и других основных платформах с открытым исходным кодом, что облегчает изучение и обратную связь с сообществом, а также ускоряет итеративное совершенствование модели.

Основные преимущества Ling-1T

  • Высокая точность выводов: Превосходно справляется с рядом сложных эталонных тестов на логику в таких областях, как конкурсная математика и профессиональная математика, демонстрируя точность и сильное логическое мышление.
  • Сильные способности к обобщению: Достижение высокой точности при небольшом объеме тонкой настройки инструкций в междоменных задачах, таких как вызов инструментов интеллектуального тела, с отличными возможностями переноса выводов и обобщения.
  • Сильный потенциал для выполнения мандатовОн может точно понимать сложные команды на естественном языке и автономно выполнять комплексные задачи, такие как генерация кода и копирайтинг, для удовлетворения различных потребностей.
  • Высокоэффективные рассужденияОна использует парадигму "резервирование по большим параметрам + активация по малым параметрам", при этом задержка при передаче данных из конца в конец стабилизирована на уровне менее 200 миллисекунд, а энергопотребление низкое, что значительно снижает стоимость развертывания предприятия.

Каков официальный сайт Ling-1T?

  • Основная модель Spiritus:: https://ling.tbox.cn/chat
  • Библиотека моделей HuggingFace:: https://huggingface.co/inclusionAI/Ling-1T

Люди, которым показан Ling-1T

  • разработчик программного обеспечения: Вы можете использовать мощные возможности Ling-1T по генерации и оптимизации кода для быстрой генерации высококачественных фрагментов кода, повышения эффективности разработки и сокращения объема повторяющейся работы.
  • (научный) исследовательСпособность Ling-1T понимать контекст и рассуждать может оказать серьезную поддержку при работе со сложными научными данными, написании научных статей и проведении междисциплинарных исследований.
  • практикующий финансист: В таких областях, как анализ финансовых данных, оценка рисков и принятие инвестиционных решений, эффективные рассуждения и способности Ling-1T к восприятию знаний помогают быстро обрабатывать большие объемы финансовой информации и предоставлять точные аналитические выкладки и рекомендации.
  • педагог: Его можно использовать для создания контента, разработки учебных программ и планирования учебного процесса, чтобы помочь учителям преподавать более эффективно.
  • создатель контента: Включая копирайтинг, креативное письмо, написание видеосценариев и многое другое, Ling-1T создает высококачественный контент, который вдохновляет на творчество по требованию.
  • Лица, принимающие корпоративные решенияПри разработке бизнес-стратегий, анализе рынка и стратегическом планировании Ling-1T может предоставить данные и рекомендации, которые помогут в процессе принятия решений.
© заявление об авторских правах

Похожие посты

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...