DeepSeek-R1 WebGPU: ¡ejecuta DeepSeek R1 1.5B localmente en tu navegador!

Introducción general

DeepSeek-R1 WebGPU es un modelo de inferencia de IA de vanguardia proporcionado por webml-community en la plataforma Hugging Face Spaces, que utiliza la tecnología WebGPU para permitir a los usuarios ejecutar modelos de IA complejos directamente en el navegador. El modelo se basa en DeepSeek-R1 y está diseñado para tareas de inferencia, proporcionando capacidades de procesamiento de IA eficientes y localizadas. Los usuarios no tienen que instalar software adicional, sino que solo necesitan soporte WebGPU en su navegador para experimentar funciones avanzadas de IA como el razonamiento matemático, la generación de código y la respuesta a preguntas, por lo que es ideal para la educación, la investigación y los desarrolladores.

Bienestar:Implantación en línea del modelo de código abierto DeepSeek-R1 con potencia de GPU gratuita(API)

DeepSeek-R1 WebGPU:在浏览器本地运行DeepSeek R1 1.5B

 

Lista de funciones

  • Ejecución de modelos de IA en el navegador: No requiere descarga, sólo un navegador moderno.
  • Compatible con aceleración WebGPUUtiliza las GPU para realizar cálculos eficientes y mejorar el rendimiento.
  • Razonamiento AI multitarea: Incluye tareas matemáticas, de generación de código y de comprensión de textos complejos.
  • Interfaz de chat interactivaEl usuario puede interactuar con el modelo directamente desde la interfaz.
  • No es necesario registrarseExperiencia de usuario simplificada y lista para usar.

 

Utilizar la ayuda

Cómo utilizar la WebGPU DeepSeek-R1

Comprobación y preparación de la compatibilidad:
En primer lugar, asegúrate de que tu navegador admite WebGPU. Actualmente, Google Chrome (versión 88 y superiores) es el navegador más utilizado que admite WebGPU. Puedes confirmarlo visitando la función experimental de Chrome (chrome://flags/) y activando WebGPU.

Visite el sitio web:

  1. Abra su navegador y vaya aEspacios para abrazar la cara.
  2. Una vez que se carga la página, se le presenta una interfaz de usuario limpia que contiene un cuadro de entrada y un área de salida.

Razonamiento con modelos:

  • Introduzca una pregunta o tareaIntroduzca el problema o tarea que desea que el modelo gestione en el cuadro de entrada. Puede ser un problema matemático, la generación de código de programación o cualquier tarea que requiera razonamiento textual.
    • Ejemplo de entrada:计算1000阶乘的最后一位数字 tal vez 编写一个Python函数来计算斐波那契数列.
  • Presentación de mandatosHaga clic en el botón Enviar o pulse Intro para enviar su entrada. El modelo empezará a procesar su solicitud, lo que puede tardar unos segundos en función de la complejidad de la tarea.
  • Ver resultadosLos resultados se muestran en la zona de salida. El modelo dará pasos detallados o resultados directos, según la naturaleza de la tarea.

Optimice la experiencia:

  • Ajuste de los parámetros del modeloLa interfaz actual es relativamente sencilla, pero es posible que en el futuro ofrezca opciones para ajustar los parámetros, como la temperatura (para controlar la aleatoriedad del texto generado) o la longitud máxima de la respuesta.
  • inténtelo una y otra vezSi no estás satisfecho con los resultados, puedes ajustar las preguntas o probar otras formas de expresarte.

PREGUNTAS FRECUENTES:

  • ¿Qué ocurre si mi navegador no es compatible con WebGPU? - Se recomienda actualizar el navegador o utilizar un navegador compatible con WebGPU, como la última versión de Chrome.
  • ¿La respuesta del modelo es demasiado lenta? - Asegúrate de que tienes una buena conexión a Internet y de que la configuración de GPU de tu navegador no está desactivada.

Advertencias:

  • Como el modelo se ejecuta dentro del navegador, la calidad y la velocidad de salida pueden verse afectadas por el rendimiento del dispositivo y las condiciones de la red.
  • Tenga en cuenta que el uso de cualquier modelo de IA en línea está sujeto a sus condiciones de uso y a su política de privacidad.

 

 

Tutorial de despliegue de la WebGPU DeepSeek-R1

DeepSeek La WebGPU R1 se basa en la tecnología Hugging Face Transformers.js La WebGPU DeepSeek R1 es un ejemplo de modelo de aprendizaje profundo diseñado para mostrar cómo ejecutar eficientemente modelos de aprendizaje profundo en el navegador. El proyecto aprovecha la tecnología WebGPU para permitir una inferencia de modelos significativamente más rápida, hasta 100 veces más rápida que WASM. Las WebGPU DeepSeek R1 se utilizan principalmente para tareas de procesamiento del lenguaje natural y admiten una amplia gama de modelos preentrenados que pueden ejecutarse directamente en el navegador sin necesidad de un servidor.

Primeros pasos
Siga los pasos que se indican a continuación para configurar y ejecutar la aplicación.

  1. Clonación de repositorios
    Clona el repositorio de ejemplo de GitHub:
git clone https://github.com/huggingface/transformers.js-examples.git
  1. Vaya al directorio del proyecto
    Cambia el directorio de trabajo a la carpeta deepseek-r1-webgpu:
cd transformers.js-examples/deepseek-r1-webgpu
  1. Instalación de dependencias
    Utilice npm para instalar las dependencias necesarias:
npm i
  1. Ejecutar el servidor de desarrollo
    Inicie el servidor de desarrollo:
npm run dev

La aplicación debería ejecutarse ahora localmente. Abra su navegador y visite http://localhost:5173 Haz una vista.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...