Intern-S1 - Macromodelos científicos multimodales de código abierto del Shanghai AI Lab

Últimos recursos sobre IAPublicado hace 8 meses Círculo de intercambio de inteligencia artificial

50.3K 00

¿Qué es Intern-S1?

Intern-S1 es un gran modelo científico multimodal lanzado por el Laboratorio de Inteligencia Artificial de Shanghai. El modelo integra en profundidad capacidades lingüísticas y multimodales, y está equipado con potentes funciones como análisis científico multimodal, fusión lingüística y visual, procesamiento de datos científicos, respuesta a preguntas científicas, diseño y optimización de experimentos, etc. Intern-S1 es el primer "motor de análisis científico multimodal" capaz de interpretar con precisión datos modales científicos complejos, como fórmulas químicas moleculares, secuencias de proteínas, señales sísmicas, etc., y supera a los mejores modelos de código cerrado en tareas profesionales multidisciplinares. Intern-S1 se basa en el Tokenizador Dinámico y el Codificador de Señales de Series Temporales para lograr una fusión profunda de múltiples modalidades científicas, con una potente capacidad de razonamiento general y una capacidad profesional superior mediante el uso de un método de síntesis de fusión de datos científicos de propósito general y especializado, que se utiliza ampliamente en la integración de herramientas de investigación científica, la fusión de imágenes y textos, y el procesamiento de datos modales científicos complejos y otros escenarios.

Principales funciones de Intern-S1

Análisis científico intermodalLos siguientes son algunos ejemplos de cómo podemos interpretar con precisión datos modales científicos complejos, como la predicción de vías de síntesis de compuestos y la determinación de la viabilidad de reacciones químicas en química; la asistencia en el análisis de secuencias de proteínas y el descubrimiento de dianas farmacológicas en biomedicina; y la identificación de señales sísmicas y el análisis de fenómenos sísmicos en el campo de las ciencias de la tierra.
Integración verbal y visualCombinación de información verbal y visual para tareas multimodales complejas.
Tratamiento de datos científicos: Soporta una variedad de entradas de datos modales científicos complejos, como curvas de variación de luz en ciencia de materiales y señales de ondas gravitacionales en astronomía, etc., para lograr una fusión profunda y un procesamiento eficiente de los datos.
Respuestas a preguntas científicas: Proporciona a los usuarios respuestas precisas a preguntas científicas a partir de una potente base de conocimientos y capacidades de razonamiento.
Diseño experimental y optimizaciónFunciones: Ayudar a los investigadores a diseñar protocolos experimentales, optimizar los procesos experimentales y mejorar la eficacia de la investigación.
trabajo en equipo multiinteligencia: Soporta sistemas corporales multiinteligentes que trabajan en concierto con otras inteligencias para llevar a cabo tareas científicas complejas.
Aprendizaje autónomo y evoluciónLa inteligencia artificial: tiene la capacidad de aprender por sí misma y optimizar su rendimiento en función de su interacción con el entorno.
Tratamiento y análisis de datos: Proporciona herramientas de procesamiento y análisis de datos para ayudar a los investigadores a procesar y analizar rápidamente los datos científicos.
Despliegue y aplicación de modelos: Admite la implantación local y los servicios en la nube para facilitar su uso en diferentes escenarios.

Dirección del sitio web oficial de Intern-S1

Página web del proyecto:: https://intern-ai.org.cn/
Repositorio Github:: https://github.com/InternLM/Intern-S1
Biblioteca de modelos HuggingFace:: https://huggingface.co/internlm/Intern-S1-FP8

Cómo utilizar Intern-S1

Plataforma de experiencia en línea
- Plataformas de acceso: Abra su navegador y visite el sitio web oficial del proyecto para experimentar el modelo Intern-S1.
- Iniciar el diálogoIntroduzca una pregunta o solicitud en el cuadro de entrada y envíelo para obtener una respuesta de Intern-S1.
- Uso de funciones especiales: Siga las instrucciones de la plataforma según la función que le interese, por ejemplo, química orgánica.
Repositorio GitHub
- almacén de clonesClone el repositorio introduciendo el siguiente comando en la línea de comandos:

git clone https://github.com/InternLM/Intern-S1.git

- Instalación de dependenciasVaya al directorio del repositorio e instale las dependencias de Python:

cd Intern-S1
pip install -r requirements.txt

- modelo operativoEjecute el modelo basándose en el archivo README del repositorio o en el código de ejemplo. Normalmente, puede utilizar scripts de Python:

python script_name.py

Los nombres y parámetros específicos de los scripts deben ajustarse según las instrucciones del repositorio.

Biblioteca de modelos de caras abrazadas
- Modelos de carga: Utiliza el siguiente código en el entorno Python para cargar el modelo y el desambiguador:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "internlm/Intern-S1-FP8"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

- Generar texto: Utiliza el modelo para generar texto o realizar otras tareas:

inputs = tokenizer("Tell me about an interesting physical phenomenon.", return_tensors="pt")
output = model.generate(**inputs, max_length=100)
print(tokenizer.decode(output[0], skip_special_tokens=True))

- Uso de la API de modelosSi Hugging Face proporciona un servicio API, llame al modelo directamente a través de la API:

import requests

url = "https://api-inference.huggingface.co/models/internlm/Intern-S1-FP8"
headers = {"Authorization": "Bearer YOUR_HUGGINGFACE_API_TOKEN"}
data = {"inputs": "Tell me about an interesting physical phenomenon."}

response = requests.post(url, headers=headers, json=data)
print(response.json()["generated_text"])

Principales ventajas de Intern-S1

capacidad multimodalEl sistema de procesamiento de datos de la Comisión Europea (CEI): Combina potentes capacidades de comprensión lingüística y procesamiento visual, y es capaz de procesar y comprender texto, imágenes y muchos otros tipos de datos.
Optimización de misiones científicasLos modelos destacan en tareas científicas como descifrar estructuras químicas, comprender secuencias de proteínas y planificar rutas de síntesis de compuestos.
Formación previa a gran escalaConstruido sobre un modelo lingüístico MoE (Mixture of Experts) de 235.000 millones de parámetros y un codificador visual de 6.000 millones de parámetros, preentrenados en 5 billones de tokens de datos multimodales, de los cuales más de 2,5 billones proceden del ámbito científico.
Tokenizador dinámicoEl modelo se basa en un tokenizador dinámico que permite la comprensión nativa de datos especializados como fórmulas moleculares, secuencias de proteínas y señales sísmicas.
Motor de análisis científico multimodalEl motor pionero de análisis sintáctico científico intermodal del Intern-S1 es capaz de interpretar con precisión una amplia gama de datos modales científicos complejos, demostrando un razonamiento y una comprensión científicos excelentes.
Razonamiento general y competencia profesionalEl Interno-S1, basado en el método de síntesis de datos científicos de fusión de propósito general, está dotado de una potente capacidad de razonamiento general y posee una serie de capacidades profesionales de primer orden.
Aprendizaje autónomo y evoluciónEl modelo tiene la capacidad de aprender por sí mismo y optimizar su rendimiento interactuando con el entorno.
trabajo en equipo multiinteligencia: Apoya sistemas corporales multiinteligentes que pueden trabajar en concierto con otras inteligencias para llevar a cabo tareas científicas complejas.
Tratamiento y análisis de datos: Proporciona herramientas de procesamiento y análisis de datos para ayudar a los investigadores a procesar y analizar rápidamente los datos científicos.

Personas a las que va dirigido Intern-S1

investigador (científico)Investigadores que realizan complejos análisis de datos y diseños experimentales en los campos de la química, la biología, la física y las ciencias de la tierra.
Analista de datos: Profesionales que extraen información valiosa de grandes cantidades de datos científicos para apoyar la toma de decisiones.
desarrollador de software: Ingenieros de software que integran funciones avanzadas de análisis multimodal en sus aplicaciones.
Educadores y estudiantes: Profesores y estudiantes que utilizan modelos para apoyar la enseñanza o realizar investigaciones científicas en un entorno académico.
Responsables de las empresasLíderes empresariales que toman decisiones críticas basadas en el análisis de datos.