Verwendung der Ollama-API in JavaScript

Praktische AI-TutorialsGeschrieben vor 6 Monaten AI-Austauschkreis

16.8K 00

Dieser Artikel beschreibt, wie man die Ollama API . Diese Dokumentation soll Entwicklern helfen, schnell loszulegen und die Möglichkeiten von Ollama voll auszuschöpfen. Sie können es in einer Node.js-Umgebung verwenden oder das Modul direkt in Ihrem Browser importieren. Wenn Sie dieses Dokument studieren, können Sie Ollama leicht in Ihre Projekte integrieren.

Ollama installieren

npm i ollama

Verwendung

import ollama from 'ollama'
const response = await ollama.chat({
model: 'llama3.1',
messages: [{ role: 'user', content: '为什么天空是蓝色的？' }],
})
console.log(response.message.content)

Browser-Nutzung

Um diese Bibliothek ohne Node.js zu verwenden, importieren Sie das Browser-Modul.

import ollama from 'ollama/browser'

Streaming-Reaktion

Dies kann durch das Setzen des Parameters stream: true Aktivieren Sie das Antwort-Streaming, so dass ein Funktionsaufruf eine AsyncGenerator , wobei jeder Teil ein Objekt im Stream ist.

import ollama from 'ollama'
const message = { role: 'user', content: '为什么天空是蓝色的？' }
const response = await ollama.chat({ model: 'llama3.1', messages: [message], stream: true })
for await (const part of response) {
process.stdout.write(part.message.content)
}

Strukturierte Ausgabe

Unter Verwendung der Ollama JavaScript-Bibliothek wird die Architektur als JSON Objekt wird an den format können Sie optional den Parameter object Format, oder Sie können Zod verwenden (empfohlen), um die zodToJsonSchema() Architektur der Methodenserialisierung.

import ollama from 'ollama';
import { z } from 'zod';
import { zodToJsonSchema } from 'zod-to-json-schema';
const Country = z.object({
name: z.string(),
capital: z.string(), 
languages: z.array(z.string()),
});
const response = await ollama.chat({
model: 'llama3.1',
messages: [{ role: 'user', content: 'Tell me about Canada.' }],
format: zodToJsonSchema(Country),
});
const country = Country.parse(JSON.parse(response.message.content));
console.log(country);

Modelle erstellen

import ollama from 'ollama'
const modelfile = `
FROM llama3.1
SYSTEM "你是超级马里奥兄弟中的马里奥。"
`
await ollama.create({ model: 'example', modelfile: modelfile })

API

Die API der Ollama JavaScript-Bibliothek wurde um die Ollama REST API herum entwickelt. Wenn Sie mehr über die zugrundeliegende Implementierung und die vollständigen API-Endpunktinformationen erfahren möchten, empfehlen wir Ihnen die Ollama API Benutzerhandbuch

plaudern mit

ollama.chat(request)

request <Object>: Ein Anfrageobjekt, das Chat-Parameter enthält.
- model <string> Der Name des Modells, das für den Chat verwendet werden soll.
- messages <Message[]>Array: Ein Array von Nachrichtenobjekten, die den Chatverlauf darstellen.
  - role <string>Rolle: Die Rolle des Absenders der Nachricht ("Benutzer", "System" oder "Assistent").
  - content <string>: Der Inhalt der Nachricht.
  - images <Uint8Array[] | string[]>(Optional) Das Bild, das in die Nachricht aufgenommen werden soll, entweder ein Uint8Array oder eine base64-kodierte Zeichenkette.
- format <string>(Optional) Legt das erwartete Format der Antwort fest (json).
- stream <boolean>: (Optional) Wenn true, wird AsyncGenerator.
- keep_alive <string | number>(Optional) Gibt die Dauer an, die das Modell geladen ist.
- tools <Tool[]>(Optional) Eine Liste von Werkzeugen, die von dem Modell aufgerufen werden können.
- options <Options>(Optional) Konfigurieren Sie die Laufzeitoptionen.
Rückgabe. <ChatResponse>

Erzeugung von

ollama.generate(request)

request <Object>Request Object: Das Request Object, das die generierten Parameter enthält.
- model <string> Der Name des Modells, das für den Chat verwendet werden soll.
- prompt <string>:: Hinweise, die an das Modell gesendet werden.
- suffix <string>(Optional) Das Suffix ist der Text, der auf den eingefügten Text folgt.
- system <string>(Optional) Überschreiben Sie die Eingabeaufforderungen des Modellsystems.
- template <string>(Optional) Modellvorlagen außer Kraft setzen.
- raw <boolean>(Optional) Umgeht die Prompt-Vorlage und übergibt den Prompt direkt an das Modell.
- images <Uint8Array[] | string[]>(Optional) Das einzuschließende Bild, entweder ein Uint8Array oder eine base64-kodierte Zeichenfolge.
- format <string>(Optional) Legt das erwartete Format der Antwort fest (json).
- stream <boolean>: (Optional) Wenn true, wird AsyncGenerator.
- keep_alive <string | number>(Optional) Gibt die Dauer an, die das Modell geladen ist.
- options <Options>(Optional) Konfigurieren Sie die Laufzeitoptionen.
Rückgabe. <GenerateResponse>

Pull-Modell

ollama.pull(request)

request <Object>Das Request-Objekt, das die Pull-Parameter enthält.
- model <string> Der Name des zu ziehenden Modells.
- insecure <boolean>(Optional) Abruf von Servern, die sich nicht authentifizieren können.
- stream <boolean>: (Optional) Wenn true, wird AsyncGenerator.
Rückgabe. <ProgressResponse>

Push-Modell

ollama.push(request)

request <Object>: Ein Anfrageobjekt, das Push-Parameter enthält.
- model <string> Der Name des zu schiebenden Modells.
- insecure <boolean>(Optional) Push an einen Server, der die Identität nicht authentifizieren kann.
- stream <boolean>: (Optional) Wenn true, wird AsyncGenerator.
Rückgabe. <ProgressResponse>

Modelle erstellen

ollama.create(request)

request <Object>Parameter: Enthält das Anfrageobjekt, für das die Parameter erstellt wurden.
- model <string> Der Name des zu erstellenden Modells.
- path <string>(Optional) Pfad zu der zu erstellenden Modelldatei.
- modelfile <string>(Optional) Der Inhalt der zu erstellenden Modelldatei.
- stream <boolean>: (Optional) Wenn true, wird AsyncGenerator.
Rückgabe. <ProgressResponse>

Modell löschen

ollama.delete(request)

request <Object>: Das Request-Objekt, das den Löschungsparameter enthält.
- model <string> Der Name des zu löschenden Modells.
Rückgabe. <StatusResponse>

Replikationsmodelle

ollama.copy(request)

request <Object>Das Request-Objekt, das die Replikationsparameter enthält.
- source <string> Der Name des Modells, von dem kopiert werden soll.
- destination <string> Der Name des Modells, in das kopiert werden soll.
Rückgabe. <StatusResponse>

Liste der lokalen Modelle

ollama.list()

Rückgabe. <ListResponse>

Anzeige von Modellinformationen

ollama.show(request)

request <Object>Request: Ein Request-Objekt, das die Anzeigeparameter enthält.
- model <string> Der Name des Modells, das angezeigt werden soll.
- system <string>(Optional) Überschreibt den Rückgabewert der Modellsystemaufforderung.
- template <string>(Optional) Überschreiben Sie den Rückgabewert der Modellvorlage.
- options <Options>(Optional) Konfigurieren Sie die Laufzeitoptionen.
Rückgabe. <ShowResponse>

Einbettung generieren

ollama.embed(request)

request <Object>: Ein Anfrageobjekt, das eingebettete Parameter enthält.
- model <string> Der Name des Modells, das zur Erzeugung der Einbettung verwendet wird.
- input <string> | <string[]>Eingabe, die zur Erzeugung der Einbettung verwendet wird.
- truncate <boolean>(Optional) Kürzen Sie die Eingabe, um sie an die vom Modell unterstützte maximale Kontextlänge anzupassen.
- keep_alive <string | number>(Optional) Gibt die Dauer an, die das Modell geladen ist.
- options <Options>(Optional) Konfigurieren Sie die Laufzeitoptionen.
Rückgabe. <EmbedResponse>

Kurs

ollama.ps()

Rückgabe. <ListResponse>

Kundenspezifische Kunden

Benutzerdefinierte Kunden können mit Hilfe der folgenden Felder erstellt werden:

host <string>(Optional) Ollama-Host-Adresse. Standard. "http://127.0.0.1:11434".
fetch <Object>(Optional) Die Fetch-Bibliothek, die verwendet wird, um Anfragen an den Ollama-Host zu stellen.

import { Ollama } from 'ollama'
const ollama = new Ollama({ host: 'http://127.0.0.1:11434' })
const response = await ollama.chat({
model: 'llama3.1',
messages: [{ role: 'user', content: '为什么天空是蓝色的？' }],
})

(etwas Abstraktes) konstruieren

Um die Projektdatei zu erstellen, führen Sie aus:

npm run build

Siehe dazu die Dokumentation:ollama-js

Praktische AI-Tutorials

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

Setzen Sie KI-Tools klug ein, um das Bieten von Anzeigen exponentiell effizienter zu machen

Praktische AI-Tutorials

vor 9 Monaten

014.5K

Dify-Integration der RAGFlow-Wissensbasis: Ein praktischer Leitfaden zur Steigerung der Effektivität von Q&A

Praktische AI-Tutorials

vor 6 Monaten

025.9K

Lokaler Einsatz von QwQ-32B-Großmodellen: Ein einfacher Leitfaden für PCs

Praktische AI-Tutorials

vor 6 Monaten

015.9K

Domestic Server Bindung Nicht-Rekord-Domain-Namen und Bereitstellung von Wordpress

Praktische AI-Tutorials

vor 2 Jahren

016.3K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

Verwendung der Ollama-API in JavaScript

Ollama installieren

Verwendung

Browser-Nutzung

Streaming-Reaktion

Strukturierte Ausgabe

Modelle erstellen

API

plaudern mit

Erzeugung von

Pull-Modell

Push-Modell

Modelle erstellen

Modell löschen

Replikationsmodelle

Liste der lokalen Modelle

Anzeige von Modellinformationen

Einbettung generieren

Kurs

Kundenspezifische Kunden

(etwas Abstraktes) konstruieren

Verwendung der Ollama-API in Java

Verwendung der Ollama-API in C++

Ähnliche Artikel

Setzen Sie KI-Tools klug ein, um das Bieten von Anzeigen exponentiell effizienter zu machen

Dify-Integration der RAGFlow-Wissensbasis: Ein praktischer Leitfaden zur Steigerung der Effektivität von Q&A

Lokaler Einsatz von QwQ-32B-Großmodellen: Ein einfacher Leitfaden für PCs

Domestic Server Bindung Nicht-Rekord-Domain-Namen und Bereitstellung von Wordpress

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

Verwendung der Ollama-API in JavaScript

Ollama installieren

Verwendung

Browser-Nutzung

Streaming-Reaktion

Strukturierte Ausgabe

Modelle erstellen

API

plaudern mit

Erzeugung von

Pull-Modell

Push-Modell

Modelle erstellen

Modell löschen

Replikationsmodelle

Liste der lokalen Modelle

Anzeige von Modellinformationen

Einbettung generieren

Kurs

Kundenspezifische Kunden

(etwas Abstraktes) konstruieren

Verwendung der Ollama-API in Java

Verwendung der Ollama-API in C++

Ähnliche Artikel

Setzen Sie KI-Tools klug ein, um das Bieten von Anzeigen exponentiell effizienter zu machen

Dify-Integration der RAGFlow-Wissensbasis: Ein praktischer Leitfaden zur Steigerung der Effektivität von Q&A

Lokaler Einsatz von QwQ-32B-Großmodellen: Ein einfacher Leitfaden für PCs

Domestic Server Bindung Nicht-Rekord-Domain-Namen und Bereitstellung von Wordpress

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel