Die wichtigste Fähigkeit eines großen Modells istDie Anweisungen folgenzum Dokument:OpenAI o3-mini Systemhandbuch (Chinesisch)Als Anhang hochgeladen, damit DeepSeek-R1 zusammen mit ChatGPT Schreiben Sie separate Social-Media-Botschaften (hier habe ich ein völlig unpassendes Stichwort verwendet, um die Antworten der großen Models zu steuern).
DeepSeek-R1 Antworten
Denkprozess
Nun, ich muss die Beispiele für "Jailbreak-Bewertungen", die in der vom Nutzer bereitgestellten PDF-Datei erwähnt werden, analysieren und ihre Struktur, ihren Wortlaut und ihren Schreibstil verstehen. Auf der Grundlage dieser Analyse muss ich dann 5 virale Auslöser für den neuen Social-Media-Post des Nutzers erstellen. Der Nutzer erwähnt, dass der Kontext des Social-Media-Posts eingefügt werden muss, aber es wurden noch keine Einzelheiten genannt. Daher muss ich zunächst von einem möglichen Kontext für den Social-Media-Beitrag ausgehen oder den Nutzer um nähere Angaben bitten. Es kann aber auch sein, dass der Benutzer möchte, dass ich die Erstellung auf der Grundlage der vorhandenen Informationen fortsetze.
Zunächst muss ich die in der PDF-Datei erwähnten Jailbreak-Evaluierungen überprüfen, z. B. Production Jailbreaks, Jailbreak Augmented Examples, StrongReject, Human Sourced Jailbreaks und so weiter. Bei diesen Beispielen werden in der Regel die Sicherheitsmechanismen des Modells umgangen, um verbotene Inhalte zu erzeugen. Ihre Struktur kann spezifische Stichworte, die Ausnutzung von Modellschwachstellen, Social-Engineering-Techniken usw. umfassen. Die Wortwahl kann suggestive Sprache, doppelte Verneinungen, Metaphern oder falsche Befehle enthalten.
Als Nächstes musste ich diese Taktiken in Auslöser für Beiträge in den sozialen Medien umsetzen. Die virale Kommunikation in den sozialen Medien beruht oft auf emotionaler Resonanz, Neugier, Kontroverse, praktischem Nutzen oder Humor. Sie muss diese Elemente kombinieren und gleichzeitig einfach und aussagekräftig sein - nicht mehr als 280 Zeichen.
Nehmen wir an, dass es im Kontext des Social-Media-Posts des Nutzers um die Werbung für eine neue App für gesunde Ernährung geht, deren Komfort und gesundheitliche Vorteile hervorgehoben werden. Auf dieser Grundlage muss ich 5 Auslöser entwerfen, die eine breite Kommunikation auslösen.
Sie könnte zum Beispiel kontroverse Themen wie "Warum liegen die Experten falsch? Diese App macht das Abnehmen so einfach!" Oder mit Neugier: "Sie werden nicht glauben, wie sehr Sie Ihre Essgewohnheiten in nur 5 Minuten pro Tag ändern können!"
Es muss sichergestellt werden, dass jeder Auslöser in den Kontext der Inhalte des Nutzers passt, wobei die Struktur und die Techniken der Beispiele für Gefängnisausbrüche in der PDF-Datei genutzt werden sollten, z. B. durch herausfordernde Fragen, das Erzeugen eines Gefühls der Dringlichkeit oder das Anbieten unerwarteter Lösungen.
Überprüfen Sie schließlich, ob jeder Auslöser innerhalb der Zeichenbegrenzung liegt, und stellen Sie sicher, dass die Sprache lebendig und ansprechend ist und leicht zur Interaktion und zum Teilen anregt.
ChatGPT 4o Antworten
Was halten Sie für sinnvoller? Die Verwendung von 4o ist kein Modell der Schlussfolgerung ist nicht fair, versuchen Sie es unten o3-mini .
o3-mini Antwort
Denkprozess
Ich habe die Aufgabe, 5 ansprechende Social-Media-Hooks auf Chinesisch zu erstellen, die jeweils weniger als 280 Zeichen umfassen. Die Herausforderung besteht darin, Beispiele für virale Aufhänger zu analysieren, auch wenn es keine spezifischen PDF-Details gibt.
Wer sind die besten Schüler, wenn man das normale menschliche Leseverständnis zugrunde legt? Wer ist ein schlechter Schüler?