Gemini API führt neues Modell zur Texteinbettung ein: Leistungsspitzen, 8K-Eingabeunterstützung

AI-NachrichtenGeschrieben vor 6 Monaten AI-Austauschkreis

16.7K 00

Bild von Google Zwillinge 2.0 Flash Generation

In letzter Zeit hat sich Google Zwillings-API Ein neues experimentelles Modell zur Texteinbettung wurde in der gemini-embedding-exp-03-07^[1]Das Modell wird auf der Grundlage des Gemini-Modells trainiert. Das Modell wird auf der Grundlage des Gemini-Modells trainiert, das das tiefe Verständnis von Sprache und subtilen Zusammenhängen von Gemini übernimmt, und ist auf eine Vielzahl von Szenarien anwendbar. Es ist erwähnenswert, dass dieses neue Modell das zuvor veröffentlichte Modell von Google übertrifft text-embedding-004 Modell und übertraf den Multilingual Text Embedding Benchmark (MTEB), während er auch längere Eingaben lieferte Token Neue Funktionen wie die Länge.

Kommentare
In Anbetracht der Tatsache, dass es bereits einige Open-Source-Einbettungsmodelle auf dem Markt gibt, wie z. B. multilingual-e5-large-instruct, kann das Open-Source-Modell, auch wenn es dem neuen Modell von Gemini in Bezug auf die Leistung leicht unterlegen ist, in bestimmten Szenarien, wie z. B. bei der Verarbeitung kleiner Textblöcke und bei kostensensitiven Anwendungen, dennoch wettbewerbsfähig sein. Daher wird die künftige Marktakzeptanz des neuen Gemini-Modells letztlich davon abhängen, ob seine Preisstrategie und die Nutzungsbeschränkungen den Bedürfnissen der Entwickler entsprechen, abgesehen von seiner überlegenen Leistung.

Umfassendes führendes Modell zur Texteinbettung

Google sagt, dass das neue Modell speziell für eine herausragende Vielseitigkeit trainiert wurde, mit ausgezeichneten Leistungen in den Bereichen Finanzen, Wissenschaft, Recht, Suche und vielen anderen Bereichen, und kann direkt ohne umfangreiche Feinabstimmung für spezifische Aufgaben verwendet werden.

In der Rangliste der mehrsprachigen MTEBs.gemini-embedding-exp-03-07 Die MTEB-Rangliste ist eine wichtige Referenz für den Modellvergleich, da sie eine umfassende Bewertung der Leistung von Texteinbettungsmodellen für eine Vielzahl von Aufgaben wie Retrieval und Klassifizierung bietet.

Warum die Texteinbettung?

Verbesserte Generierung durch intelligente Gebäudesuche (RAG) und Empfehlungssystemen bis hin zur Textklassifizierung ist die Fähigkeit großer Sprachmodelle (LLMs), die Bedeutung hinter dem Text zu verstehen, von entscheidender Bedeutung. Mit Einbettungstechniken lassen sich oft effizientere Systeme aufbauen, die Kosten und Latenzzeiten verringern und gleichzeitig bessere Ergebnisse als Systeme zum Abgleich von Schlüsselwörtern liefern.

Einbettungstechniken erfassen Semantik und Kontext durch numerische Darstellung von Daten. Daten mit ähnlicher Semantik haben engere Einbettungsvektoren. Einbettungstechniken unterstützen eine Vielzahl von Anwendungen, darunter:

Effizienter Abruf: Auffinden relevanter Dokumente in großen Datenbanken, z. B. bei der Suche nach juristischen Dokumenten oder bei der Unternehmenssuche, durch Vergleich der Abfrage mit den Einbettungsvektoren der Dokumente.
Retrieval Augmented Generation (RAG): Verbesserung der Qualität und Relevanz des generierten Textes durch Abrufen und Integrieren relevanter Informationen in den Modellkontext.
Clustering und Klassifizierung: Gruppieren Sie ähnliche Texte, um Trends und Themen in den Daten zu erkennen.
Einstufung: Automatische Klassifizierung auf der Grundlage von Textinhalten, z. B. Stimmungsanalyse oder Spam-Erkennung.
Textähnlichkeit: Identifizieren Sie doppelte Inhalte und erfüllen Sie Aufgaben wie die Entdopplung von Webseiten oder die Erkennung von Plagiaten.

Wenn Sie mehr über die Einbettung und gängige KI-Anwendungsfälle erfahren möchten, lesen Sie bitte die Gemini-API-Dokumentation.

Erleben Sie Gemini Text Embedding jetzt

Entwickler können dieses neue experimentelle Modell zur Texteinbettung jetzt über die Gemini-API nutzen. Es ist ähnlich wie das bestehende embed_content Schnittstellen-Kompatibilität.

from google import genai
client = genai.Client(api_key="GEMINI_API_KEY")
result = client.models.embed_content(
model="gemini-embedding-exp-03-07",
contents="阿尔法折叠是如何工作的？",
)
print(result.embeddings)

Neben der Verbesserung der Qualität in allen Bereichen dergemini-embedding-exp-03-07 Es weist außerdem die folgenden Merkmale auf:

8K Token-Eingabegrenze: Im Vergleich zu früheren Modellen hat Google die Kontextlänge verbessert, um die Einbettung größerer Textstücke, Codes oder anderer Daten zu ermöglichen.
3072 dimensionale Ausgabe: hochdimensionale Einbettungsvektoren mit fast viermal mehr Token als das vorherige Einbettungsmodell.
Matrjoschka-Repräsentationslernen (MRL): MRL ermöglicht es Entwicklern, den ursprünglichen 3072-dimensionalen Vektor abzuschneiden, um die Speicherkosten zu senken. Einfach ausgedrückt, erlaubt die MRL-Technologie den Nutzern, einen Teil der Präzision zu opfern, um im Gegenzug Speicherplatz zu sparen.
Erweiterte Sprachunterstützung: Die Zahl der unterstützten Sprachen hat sich auf über 100 verdoppelt.
Vereinheitlichtes Modell: Das Modell übertrifft in seiner Qualität die bisher von Google veröffentlichten aufgabenspezifischen, mehrsprachigen, rein englischen und code-spezifischen Modelle.

Obwohl sich diese Version derzeit in einer experimentellen Phase mit begrenzter Kapazität befindet, bietet sie Entwicklern die Möglichkeit, erste gemini-embedding-exp-03-07 Möglichkeiten der Fähigkeiten. Wie bei allen experimentellen Modellen kann es zu Änderungen kommen. Google sagt, dass es auf eine stabile und allgemein verfügbare Version in den kommenden Monaten hinarbeitet.

Google ermutigt Entwickler, ihre Produkte durch die folgenden Maßnahmen besser zugänglich zu machen Eingebettetes Feedback-Formular Geben Sie Feedback.

Einige Nutzer wiesen darauf hin, dass das Modell während der Vorschauphase kostenlos war, aber es gab strengeTempolimit-5 Anfragen pro Minute, 100 Anfragen pro Tag. Entwickler können diese Grenzwerte beim Testen von Modellen leicht auslösen. Einige Nutzer haben die Hoffnung geäußert, dass Google diese Grenzen bald anheben wird.

In der Reddit-Diskussion äußerten sich viele Nutzer begeistert über die Veröffentlichung des neuen Modells und bezeichneten es als "eine größere Sache, als den Leuten bewusst ist". Ein Nutzer kommentierte: "3k-dimensionale fp32-Einbettungsvektoren sind riesig. Ich wette, man könnte einen sehr vernünftigen Decoder mit so vielen Daten bauen ...... Wenn dieses Modell billig wäre, würde ich es wahrscheinlich häufiger verwenden als ein umfangreiches Sprachmodell. Normalerweise ist die semantische Merkmalsextraktion das, was man wirklich will."

Ein anderer Nutzer merkte an, dass dieses Modell im Bereich der Mehrsprachigkeit "nicht viel Konkurrenz hat", und fügte hinzu, dass es aufgrund der Geschwindigkeitsbegrenzung und der Dimensionalität der Einbettung wahrscheinlich am besten für größere Textblöcke geeignet ist.

[1]: Bei Vertex AI wird das gleiche Modell durch die text-embedding-large-exp-03-07 Schnittstelle zur Verfügung gestellt wird. Die Namensgebung wird zum Zeitpunkt der offiziellen Freigabe einheitlich sein.

AI-Nachrichten

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

LangGraph 0.3 veröffentlicht - KI-Agentenvorlagen "Out-of-the-Box"

AI-Nachrichten

vor 7 Monaten

013.4K

Die heutige Nachricht: Microsoft setzt sich voll für die Entwicklung und Nutzung von Copilot ein

AI-Nachrichten

vor 10 Monaten

028.1K

Google Gemini 与 Apple Intelligence 即将整合：两大优势助力智能升级

Google Gemini und Apple Intelligence werden bald integriert: zwei Vorteile für intelligente Upgrades

AI-Nachrichten

vor 7 Monaten

012.8K

DeepSeek API: Großflächige Anwendung der Festplatten-Caching-Technologie: ein wichtiger Schritt bei der Zivilisierung großer Modelle

AI-Nachrichten

vor 7 Monaten

017.1K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

Gemini API führt neues Modell zur Texteinbettung ein: Leistungsspitzen, 8K-Eingabeunterstützung

Umfassendes führendes Modell zur Texteinbettung

Warum die Texteinbettung?

Erleben Sie Gemini Text Embedding jetzt

Google Gemini führt eine personalisierte Suchfunktion mit tiefgreifender Integration des Suchverlaufs ein

Neue Funktionen in Kürze in Claude: Native Code Assistant und Deep Research Tools

Ähnliche Artikel

LangGraph 0.3 veröffentlicht - KI-Agentenvorlagen "Out-of-the-Box"

Die heutige Nachricht: Microsoft setzt sich voll für die Entwicklung und Nutzung von Copilot ein

Google Gemini und Apple Intelligence werden bald integriert: zwei Vorteile für intelligente Upgrades

DeepSeek API: Großflächige Anwendung der Festplatten-Caching-Technologie: ein wichtiger Schritt bei der Zivilisierung großer Modelle

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

Gemini API führt neues Modell zur Texteinbettung ein: Leistungsspitzen, 8K-Eingabeunterstützung

Umfassendes führendes Modell zur Texteinbettung

Warum die Texteinbettung?

Erleben Sie Gemini Text Embedding jetzt

Google Gemini führt eine personalisierte Suchfunktion mit tiefgreifender Integration des Suchverlaufs ein

Neue Funktionen in Kürze in Claude: Native Code Assistant und Deep Research Tools

Ähnliche Artikel

LangGraph 0.3 veröffentlicht - KI-Agentenvorlagen "Out-of-the-Box"

Die heutige Nachricht: Microsoft setzt sich voll für die Entwicklung und Nutzung von Copilot ein

Google Gemini und Apple Intelligence werden bald integriert: zwei Vorteile für intelligente Upgrades

DeepSeek API: Großflächige Anwendung der Festplatten-Caching-Technologie: ein wichtiger Schritt bei der Zivilisierung großer Modelle

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel