Ling-1T - универсальная модель языка с открытым исходным кодом от Ant Group с триллионами параметров

Последние ресурсы по искусственному интеллектуОпубликовано 6 месяцев назад Круг обмена ИИ

56.4K 00

Что такое Ling-1T?

Ling-1T - это универсальная языковая модель с триллионом параметров, открытая компанией Ant Group и являющаяся флагманским продуктом серии Ling 2.0 больших моделей Bering. Модель использует высокоэффективную архитектуру MoE, поддерживает 128K контекстных окон и превосходит основные модели, такие как GPT-5, в 7 бенчмарках, включая генерацию кода, математические рассуждения и логические тесты, особенно в математическом тесте конкурса AIME с показателем точности 70.42%, возглавляя список моделей с открытым исходным кодом. Его инновации заключаются в достижении оптимального по Парето соотношения между точностью и эффективностью рассуждений благодаря смешанному обучению FP8 и стратегии эволюционной мыслительной цепочки, что впервые позволило добиться облегченного развертывания триллионных моделей рассуждений.

Функциональные особенности Ling-1T

Сильные рассуждения: Достигнуты результаты SOTA в ряде сложных эталонов рассуждений, например, показатель точности 70,42% при меньшем потреблении токенов, чем у Gemini-2.5-Pro, в тесте Competition Maths List AIME 25, превосходящем Gemini-2.5-Pro; преодолен рубеж в 74 балла в комплексных тестах Omni-Math и UGMathBench и получен балл 87,45 в FinanceReasoning достиг 87,45 балла, продемонстрировав сильную логическую последовательность и способность к межпредметным рассуждениям.
Отличные навыки создания и оптимизации кода: Наивысший результат в LiveCodeBench, соревновательной задаче по программированию, значительно выше, чем у DeepSeek; 94,69 балла в тесте CodeForces, превышающий GPT-5, способность генерировать высокосовместимый внешний код для мультиэндовых сред.
Отличное интеллектуальное понимание: Лидирует или имеет преимущество в нескольких ключевых наборах данных, включая C-Eval, MMLU-Redux, MMLU-Pro, MMLU-Pro-STEM, OlympiadBench и т.д., и в целом на 1-3 процентных пункта превосходит базовые модели DeepSeek, Kimi и GPT-5, а некоторые метрики даже приближаются к верхней границе Gemini -2.5-Pro.
Возможность эффективного многораундового диалога: Он демонстрирует хорошие результаты в сценариях агентного рассуждения и многораундового диалога, особенно в заданиях с открытыми возможностями, таких как BFCL-v3 и Creative-Writing, показывая баланс между естественным языковым выражением и последовательным мышлением.
Обоснование высокой эффективности и низкой стоимостиОна использует парадигму "большой запас параметров + малая активация параметров", храня триллионы параметров, но требуя всего 10 миллиардов вычислительных ресурсов для каждого вызова, со значительным увеличением энергоэффективности, задержкой при сквозном рассуждении, стабилизированной на уровне менее 200 мс, и энергопотреблением всего 38% по сравнению с аналогичными моделями с закрытым исходным кодом, что значительно снижает стоимость развертывания на предприятии.
длительное контекстуальное пониманиеПоддержка до 128K контекстных окон, близких к опыту "долгой памяти", содержание уровня книги на одном дыхании, без потери подсказок, особенно для юридических, финансовых, научных исследований и других длинных документов бизнеса, имеет решающее значение.
Сотрудничество с открытым исходным кодом и поддержка сообществаКод и весовые коэффициенты полностью открыты и опубликованы на Hugging Face и других основных платформах с открытым исходным кодом, что облегчает изучение и обратную связь с сообществом, а также ускоряет итеративное совершенствование модели.

Основные преимущества Ling-1T

Высокая точность выводов: Превосходно справляется с рядом сложных эталонных тестов на логику в таких областях, как конкурсная математика и профессиональная математика, демонстрируя точность и сильное логическое мышление.
Сильные способности к обобщению: Достижение высокой точности при небольшом объеме тонкой настройки инструкций в междоменных задачах, таких как вызов инструментов интеллектуального тела, с отличными возможностями переноса выводов и обобщения.
Сильный потенциал для выполнения мандатовОн может точно понимать сложные команды на естественном языке и автономно выполнять комплексные задачи, такие как генерация кода и копирайтинг, для удовлетворения различных потребностей.
Высокоэффективные рассужденияОна использует парадигму "резервирование по большим параметрам + активация по малым параметрам", при этом задержка при передаче данных из конца в конец стабилизирована на уровне менее 200 миллисекунд, а энергопотребление низкое, что значительно снижает стоимость развертывания предприятия.

Каков официальный сайт Ling-1T?

Основная модель Spiritus:: https://ling.tbox.cn/chat
Библиотека моделей HuggingFace:: https://huggingface.co/inclusionAI/Ling-1T

Люди, которым показан Ling-1T

разработчик программного обеспечения: Вы можете использовать мощные возможности Ling-1T по генерации и оптимизации кода для быстрой генерации высококачественных фрагментов кода, повышения эффективности разработки и сокращения объема повторяющейся работы.
(научный) исследовательСпособность Ling-1T понимать контекст и рассуждать может оказать серьезную поддержку при работе со сложными научными данными, написании научных статей и проведении междисциплинарных исследований.
практикующий финансист: В таких областях, как анализ финансовых данных, оценка рисков и принятие инвестиционных решений, эффективные рассуждения и способности Ling-1T к восприятию знаний помогают быстро обрабатывать большие объемы финансовой информации и предоставлять точные аналитические выкладки и рекомендации.
педагог: Его можно использовать для создания контента, разработки учебных программ и планирования учебного процесса, чтобы помочь учителям преподавать более эффективно.
создатель контента: Включая копирайтинг, креативное письмо, написание видеосценариев и многое другое, Ling-1T создает высококачественный контент, который вдохновляет на творчество по требованию.
Лица, принимающие корпоративные решенияПри разработке бизнес-стратегий, анализе рынка и стратегическом планировании Ling-1T может предоставить данные и рекомендации, которые помогут в процессе принятия решений.

Последние ресурсы по искусственному интеллекту

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Вулкан Ковчег: обучение большим моделям и сервис облачных вычислений, подпишитесь на $150 эквивалентной арифметики

Последние ресурсы по искусственному интеллекту # AI Open Services

1 год назад

063.6K

Groq: поставщик решений для ускорения вывода больших моделей ИИ, высокоскоростной бесплатный интерфейс больших моделей

Последние ресурсы по искусственному интеллекту # AI Open Services Интегрированная многомодельная диалоговая платформа # AI # Бесплатная большая модель API

2 года назад

078.8K

EditorJumper：Cursor/Trae/Windsurf和JetBrains无缝切换工具

EditorJumper: инструмент бесшовного переключения для Cursor/Trae/Windsurf и JetBrains

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct

1 год назад

062.8K

OpenAI.fm: интерактивный демонстрационный инструмент, демонстрирующий речевые API OpenAI

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct

12 месяцев назад

0115.3K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Ling-1T - универсальная модель языка с открытым исходным кодом от Ant Group с триллионами параметров

Что такое Ling-1T?

Функциональные особенности Ling-1T

Основные преимущества Ling-1T

Каков официальный сайт Ling-1T?

Люди, которым показан Ling-1T

EchoCare - Гонконгская академия наук с открытым исходным кодом Большая модель ультразвуковой базы

Androidify - бесплатные ресурсы Google по созданию приложений с искусственным интеллектом на Android

Похожие статьи

Вулкан Ковчег: обучение большим моделям и сервис облачных вычислений, подпишитесь на $150 эквивалентной арифметики

Groq: поставщик решений для ускорения вывода больших моделей ИИ, высокоскоростной бесплатный интерфейс больших моделей

EditorJumper: инструмент бесшовного переключения для Cursor/Trae/Windsurf и JetBrains

OpenAI.fm: интерактивный демонстрационный инструмент, демонстрирующий речевые API OpenAI

Нет комментариев

Последние коллекции

Последние статьи

Ling-1T - универсальная модель языка с открытым исходным кодом от Ant Group с триллионами параметров

Что такое Ling-1T?

Функциональные особенности Ling-1T

Основные преимущества Ling-1T

Каков официальный сайт Ling-1T?

Люди, которым показан Ling-1T

EchoCare - Гонконгская академия наук с открытым исходным кодом Большая модель ультразвуковой базы

Androidify - бесплатные ресурсы Google по созданию приложений с искусственным интеллектом на Android

Похожие статьи

Вулкан Ковчег: обучение большим моделям и сервис облачных вычислений, подпишитесь на $150 эквивалентной арифметики

Groq: поставщик решений для ускорения вывода больших моделей ИИ, высокоскоростной бесплатный интерфейс больших моделей

EditorJumper: инструмент бесшовного переключения для Cursor/Trae/Windsurf и JetBrains

OpenAI.fm: интерактивный демонстрационный инструмент, демонстрирующий речевые API OpenAI

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи