최초의 금융 산업 추론 빅 모델 Regulus-FinX1 오픈 소스! 금융 복합 분석 및 의사 결정에 중점을 둔 두 샤오만 무거운 생산

41.9K 00

세계 최초의 대규모 금융 산업 추론 모델인 Regulus-FinX1을 오픈소스화합니다!

이 모델은 금융 분야 최초의 GPT-O1 유사 추론 매크로 모델로, 혁신적인"생각의 사슬 + 프로세스 보상 + 강화 학습"이 훈련 패러다임은 논리적 추론을 크게 향상시키고 O1 모델에서 공개하지 않은 완전한 사고 과정을 보여줄 수 있어 재무 의사결정에 대한 더 깊은 통찰력을 제공합니다. Regulus-FinX1의 목표재무 시나리오의 분석, 의사 결정 및 데이터 처리 작업심층 최적화가 수행되었습니다.

Xuan Yuan-FinX1은 Du Xiaoman AI-Lab에서 개발했으며, 이번 릴리스는 현재 오픈 소스 커뮤니티에서 공개 된 프리뷰 버전입니다.무료 다운로드. 이후 최적화된 버전도 계속 오픈소스로 제공되어 다운로드하여 사용할 수 있습니다.

깃허브 주소: https://github.com/Duxiaoman-DI/XuanYuan

벤치마킹 결과

1세대 Regulus-FinX1은 금융 벤치마크인 FinanceIQ에서 우수한 성능을 보여주었습니다. 금융 벤치마크인공인회계사, 은행 자격증권 자격증 등 10가지 유형의 금융 자격증을 취득할 수 있습니다.보험계리사 부문에서는 기존의 모든 대형 모델들의 점수가 전반적으로 낮은 반면, XuanYuan-FinX1은 37.5점에서 65.7점으로 크게 향상되어 금융 논리적 추론과 수학적 추론에 사용할 수 있음을 보여주며, 금융 논리적 추론과 수학적 추론에 사용할 수 있습니다. 특히 보험계리사 부문에서는 기존의 모든 대형 모델이 대체로 낮은 점수를 받은 반면, XuanYuan-FinX1은 37.5점에서 65.7점으로 점수가 향상되어 금융 논리적 추론과 수학적 계산에서 큰 강점이 있음을 보여주었습니다. 首个金融行业推理大模型轩辕-FinX1开源！度小满重磅出品，专注金融复杂分析决策

1세대 Regulus-FinX1은 금융 분야 외에도 뛰어난 범용 기능도 입증했습니다. 여러 권위 있는 평가 세트에 대한 테스트 결과에 따르면 Regulus-FinX1은 금융 분야뿐만 아니라GPQA(과학적 추론)및MATH-500(수학)노래로 응답AIME2024(수학 경시대회)또한 GPT-4o를 능가하여 중국에서 새로 출시된 추론 버전인 O1과 함께 상위권에 랭크되어 강력한 기본 추론 능력을 입증했습니다.

首个金融行业推理大模型轩辕-FinX1开源！度小满重磅出品，专注金融复杂分析决策

'블랙박스' 깨기: 전체 사고의 사슬을 제시하기

Regulus FinX1의 특징 중 하나는 답을 생성하기 전에 완전한 사고 과정을 제시하여 문제 분해에서 최종 결론에 이르기까지 완전히 투명한 사고 체인을 구축할 수 있다는 것입니다. 이러한 메커니즘을 통해 Regulus FinX1은 추론의 해석 가능성을 향상시킬 뿐만 아니라 기존 대형 모델의 '블랙박스' 문제를 해결하여 금융 기관에 보다 신뢰할 수 있는 의사 결정 지원 도구를 제공합니다.

FinX1을 위한 사고 체인 생성 예시 레귤러스

재무 복잡성 및 분석적 의사 결정에 집중하세요.

OpenAI의 GPT-O1이 뛰어난 '사고력'으로 업계의 주목을 받았을 때, 한 가지 중요한 제안이 떠올랐습니다:이러한 심층 추론 능력이 금융 전문가 시나리오에서 어떻게 실질적인 가치를 창출할 수 있을까요?혁신적인 해답을 제공하는 두 샤오만 레귤러스 핀엑스1 - -.처음으로 빅 모델의 심층 추론 기능이 금융 영역에 도입되어 빅 모델의 적용이 촉진되었습니다.일반적인 시나리오에서 위험 관리 결정과 같은 핵심 비즈니스 수준까지 심층적으로 분석하는 데 사용합니다.

금융 부문에서 디지털 인텔리전스 혁신의 물결 속에서"의사 결정 및 위험 관리 기능", "연구 및 분석 기능", "데이터 인텔리전스 기능"는 비즈니스 혁신과 가치 향상을 주도하는 핵심 요소로 구성됩니다. 이러한 기능은 각각 정확한 리스크 식별 및 제어, 심도 있는 시장 조사 및 가치 발견, 효율적인 데이터 모델링 및 분석을 통해 기관에 지속적인 가치 성장을 가져다줍니다.

Regulus FinX1은 혁신적인 교육 패러다임을 통해 심층 추론 기능과 금융 전문성을 심층적으로 통합하여 특정 시나리오에서 이 세 가지 기능을 완전히 발휘하고 금융 산업에 새로운 지능형 솔루션을 제공합니다.

01 의사 결정 및 리스크 관리 역량

의사 결정 및 리스크 관리 능력은 금융 기관의 건전한 운영 및 지속 가능한 발전과 관련된 금융 기관의 생명선입니다. 위험 식별 및 예측, 위험 관리 모델 구축 및 전략 수립의 핵심 업무에서 Regulus FinX1은 강력한 추론 능력과 완벽한 연쇄 메커니즘으로 위험 요소 간의 상관 관계와 전도 경로를 체계적으로 분석하여 기관에 포괄적이고 심층적인 위험 통찰력을 제공할 수 있습니다. 예를 들어, 사용자의 승인에 의해 업로드된 은행 물을 기반으로 Regulus FinX1은 수천 건의 거래 기록에서 고빈도 복권 소비, 게임 소비 등과 같은 위험 신호를 정확하게 식별하고 소득 수준 및 부채 부담과 함께 사용자의 상환 능력과 신용 위험을 과학적으로 평가할 수 있습니다.

레귤러스 핀엑스1 클립에 댓글을 달았습니다.

02 연구 및 분석 역량

연구 및 분석 기능은 거시, 산업 및 기업 수준에 대한 심층적인 통찰력을 통해 자본 배분의 과학성을 향상시키는 재무 의사결정을 위한 기본 지원입니다. Regulus FinX1은 거시 경제 데이터, 시장 심리, 정책 영향 등에 대한 다차원 분석을 수행하고 명확한 논리 체인을 통해 복잡한 문제를 점진적으로 해체할 수 있습니다. 예를 들어, 경제 데이터를 기반으로 2025년 연준의 금리 인하를 예측할 때 이 모델은 다양한 경제 요인을 분석하고 다양한 가상 시나리오를 기반으로 광범위한 가능성을 탐색하여 현재 여러 기관의 예측 분석 견해와 일치하는 2025년 연준의 금리 인하 전망을 종합적이고 객관적으로 보여줍니다. 首个金融行业推理大模型轩辕-FinX1开源！度小满重磅出品，专注金融复杂分析决策
03 데이터 인텔리전스 기능

데이터 인텔리전스 기능은 금융 기관이 정확한 의사 결정을 내리는 데 중요한 지원이며, 그 핵심은 효율적인 데이터 처리 능력과 심층 분석 능력입니다. Regulus FinX1은 금융 기관이 데이터 이면의 비즈니스 로직과 가치를 신속하게 탐색할 수 있도록 지원합니다. 예를 들어, 기업의 분기별 재무 데이터를 Regulus FinX1에 입력하면 모델은 핵심 정보를 정확하게 추출하고 자산 품질, 유동성 및 비즈니스 역학을 시각적으로 표시할 수 있습니다. '유동성 압력' 및 '자산 확장 추진'과 같은 주요 지표를 분석함으로써 Regulus FinX1은 정량적 비교를 기반으로 정성적 설명을 추가하여 재무 데이터 이면의 잠재적 위험과 성장 기회를 밝혀내고 기업이 의사 결정을 최적화할 수 있도록 지원합니다. 首个金融行业推理大模型轩辕-FinX1开源！度小满重磅出品，专注金融复杂分析决策

Regulus-FinX1의 기술적 구현

특히 금융 분야의 복잡한 의사 결정 분석 시나리오에서 O1과 같은 추론 기능을 갖춘 대규모 모델을 구현하기 위해 광범위한 탐색과 검증을 거쳐 세 가지 핵심 단계를 포함하는 기술 솔루션을 제안합니다:안정적인 사고 체인 생성 모델, 재무 의사 결정 향상을 위한 이중 보상 모델, PRM과 ORM의 이중 안내에 따른 강화 학습의 미세 조정을 위해 노력합니다.

01 생각의 사슬의 안정적인 생성 모델의 초기 구축

금융 영역의 복잡한 의사결정 분석 시나리오를 위해 안정적인 사고사슬 생성 기능을 갖춘 기본 모델을 구축했습니다. 첫 번째는 질문을 기반으로 사고 과정을 먼저 생성한 후 질문과 사고 과정을 기반으로 최종 답변을 생성하는 고품질의 COT/Answer 데이터 합성입니다. 이 전략을 통해 모델은 작업의 각 단계에 집중하고 보다 일관된 추론 사슬과 답변을 생성할 수 있습니다.

다른 도메인 (예 : 수학, 논리적 추론, 재무 분석 등)에 대해 특수 데이터 합성 방법을 설계했습니다. 예를 들어 재무 분석 작업의 경우 분석 프로세스의 포괄 성을 보장하기 위해 반복적 인 합성 방법을 설계 한 다음 명령 미세 조정을 사용하고 통일 된 사고 프로세스를 사용하여 XuanYuan 3.0 모델을 기반으로 모델을 학습했습니다. 사고> 출력 형식 (이번에는 거친 사고 노드도 공개 할 예정입니다)을 사용하는 동시에 더 많은 수의 긴 텍스트 데이터를 구성하는 데 집중하여 모델의 긴 문맥 처리 능력을 향상시켜 "답변을 생성하기 전에 자세한 사고 과정을 생성"할 수 있도록합니다. 이는 후속 프로세스 지도 학습 및 강화 학습 최적화를 위한 견고한 토대를 마련합니다.

02 재무 의사 결정 향상을 위한 이중 보상 모델

재무 의사 결정 시나리오에서 모델의 성능을 평가하기 위해 다음과 같이 설계했습니다.상호 보완적인 두 가지 보상 모델, 결과 중심(ORM)과 프로세스 수준(PRM). 그 중 ORM은 대조 학습과 역강화 학습으로 훈련된 XuanYuan 3.0의 기술 솔루션을 이어가고 있으며, PRM은 개방형 재무 문제(예: 시장 분석, 투자 결정 등)를 평가하는 데 어려움을 해결하는 데 초점을 맞춘 추론 프로세스를 위한 혁신입니다.

PRM의 학습 데이터 구축은 시나리오에 따라 다른 전략을 채택하는데, 위험 등급과 같이 정답이 명확한 질문은 MCTS 기반의 역검증 방법을 사용하고, 개방형 재무 분석 질문은 여러 대형 모델을 통해 정확성, 필요성, 논리성 등의 차원으로 주석을 달고, 다운샘플링과 능동 학습을 통해 데이터 불균형 문제를 해결합니다. 학습 과정에서 PRM은 각 사고 단계에 점수를 매겨 모델을 최적화하는 지도 미세 조정(supervised fine-tuning)을 사용합니다.03 강화학습 미세 조정, PRM과 ORM의 이중 가이드를 통한 강화학습 강화학습 단계에서는 모델 최적화를 위해 PRM과 ORM을 보상 신호로 사용하는 PPO 알고리즘을 사용합니다. 와 사이의 사고 과정에서는 사고 경로의 오류를 적시에 감지하고 수정할 수 있도록 각 사고 단계에 점수를 매기는 데 PRM을 사용하고, 답변 부분에서는 질문 유형에 따라 다른 평가 전략을 사용하는데, 정답이 명확한 재무 질문(예: 위험 수준 평가)에는 규칙 매칭을 사용하고, 개방형 질문에는 규칙 매칭을 사용하여 보상을 계산합니다( 예: 시장 분석)은 ORM을 사용하여 총체적으로 점수를 매깁니다. 학습 과정을 안정화하기 위해 동적 KL 계수 및 지배 함수 정규화와 같은 기법이 동시에 도입됩니다. 이이중 보상에 기반한 훈련 메커니즘는 단일 보상 모델의 한계를 극복할 뿐만 아니라 안정적인 강화 학습 훈련을 통해 재무 의사 결정 시나리오에서 모델의 추론 능력을 크게 향상시킵니다.

위 경로의 핵심은 수학이나 논리와는 다른 재무 분석의 개방형 문제에 대한 사고사슬 데이터 구축과 보상 모델 평가이며, 지금도 여전히 최적화 및 반복 작업을 진행 중이며 더 효과적인 기술적 경로를 계속 모색할 것입니다.