Ich formuliere besser als jedes LLM!

🖐 Mal langsam und der Reihe nach…
Die Anwendungsaufgabe des AI Training Institute bestand darin, verschiedene LLM mit Prompts zu füttern und die Ausgaben miteinander zu vergleichen.

📂 Die Modelle sollten den LinkedIn-Profil-Slogan mittels einer im jeweiligen LLM definierten „System Persona“ verbessern.

Für alle Modelle identisch: „Untersuche zunächst das Profil berentai. Wie findest du folgenden Slogan: Verstehen. Akzeptieren. Verändern. Verlässliche Werte in Coaching, Beratung und Software-Entwicklung für dich.“
Jeder Prompt wurde zweimal durchgeführt, übernommen die zweite Version.

📜 Zusammenfassung

1️⃣ ChatGPT

❌ Kurze Rückmeldung zum Slogan, gefolgt von drei eigenen Verbesserungsvorschlägen, bei denen man den Eindruck bekommen könnte, der GPT feiert sich selbst.
✅ Prägnant und wohlwollend im Ton

2️⃣ Claude 3.5
❌ Hinweis, Profil nicht öffnen zu können (Anwenderfehler?!).
✅ Ausführliche Analyse mit ausführlichen Ausführungen zum Optimierungspotential.

3️⃣ Gemini 2.0 Flash
❌ Auf Grund des Umfangs wäre eine weitere, zielführende Beschäftigung angezeigt.
✅ Ausführlichste Analyse mit „echter“ Analyse des Profils sowie der umfassendsten Rückmeldung mit hilfreichen Hinweisen und einem eigenen Fazit.

4️⃣ Le Chat
❌ Ebenfalls nicht in der Lage, das Profil zu lesen.
✅ In der Ausgabe knapp wie ChatGPT. Der Franzose punktet mit der Interpretation des Slogans – gefällt 👌🏼.

📰 Ausführliche Dokumentation
https://lnkd.in/dh6zQZMS

🌟 Einordnung und abschließendes Fazit 🌟
Irgendwie enttäuscht hat ChatGPT 🫤. Irgendwie deshalb, da ich mit den LLM zunächst an einer „System Persona“ gearbeitet, die Eingabeaufforderung darüber hinaus allerdings nicht mehr verfeinert habe. Daneben haben die anderen LLM für mehr Inhalt gesorgt, haben gerade Claude 3.5 und insbesondere Gemini 2.0 Flash durch eine tiefergehende Analyse geglänzt 🤓. „Der Franzose“ antwortet zwar ähnlich knapp wie ChatGPT, dafür liefert dieses LLM eine Interpretation des Slogans 👌🏼.

Abschließend stelle ich fest, die Ergebnisse sind sehr unterschiedlich, sehr weit gefächert. Ob es mit einer identischen (anstatt durch das jeweilige LLM generierten) Eingabeaufforderung zu vergleichbaren Ergebnissen gekommen wäre, ist spekulativ, jedenfalls schafft der Einsatz unterschiedlicher LLM aus meiner Sicht einen Mehrwert bei der Beschäftigung mit einem Thema (hier ein Slogan), der sich bei einer Entscheidungsfindung auszahlt.

Letztendlich habe ich mich für meine eigene Idee entschieden, den Slogan zu „verbessern“. 😄 Mir ist bewusst, den Kontext nicht in diese Richtung gelenkt zu haben, deshalb oder dennoch können die LLM eines nicht: Die Emotion vermitteln, die meinen Slogan tragen soll. ✌🏼

🔹 Welches LLM hast du bevorzugt im Einsatz? Wie ist deine Ansicht zu meinen Erfahrungen? Schreib gern einen Kommentar.