Künstliche Intelligenz
08.07.2024, 07:30 Uhr
Humor von Chatbots hält laut Studie mit dem von Menschen mit
Witzig, witziger, ChatGPT? Forscher haben Witziges von Profis und Laien zusammengetragen. Im Vergleich zu einem Chatbot schnitten sie überraschend schlecht ab.
ChatGPT zum Beispiel könne beim Texten von Überschriften mit professionellen Satire-Schreibern mithalten, berichtet ein Forscher-Duo im Fachjournal "PLoS One". Und seine Witze würden als witziger empfunden als von Durchschnittsmenschen ersonnene.
Drew Gorenz und Norbert Schwarz von der University of Southern California (USC) in Los Angeles hatten ChatGPT 3.5 mit Schlagzeilen des beliebten US-Satiremagazins "The Onion" gefüttert und aufgefordert, daraus neue Schlagzeilen im Stil der Zeitschrift zu entwickeln.
Anschliessend wurden gut 200 Menschen gebeten, die Witzigkeit der Schlagzeilen zu bewerten. Die Quelle kannten sie dabei nicht. Im Mittel wurden ChatGPT-Schlagzeilen für genauso lustig befunden wie die Originale. Von den vier am besten bewerteten Schlagzeilen waren zwei von professionellen Autoren und zwei von ChatGPT erstellt.
ChatGPT fallen die besseren Sprüche ein
In einem zweiten Versuch liessen Gorenz und Schwarz den Chatbot und 105 Freiwillige aus der Durchschnittsbevölkerung drei Aufgaben mit jeweils drei Unteraufgaben erfüllen. Es galt, witzige Ausdrücke für gängige Akronyme zu entwickeln, witzige Füllwörter für Lückentexte und von einem unangenehmen fiktiven Szenario inspirierte witzige Sprüche.
Akronyme sind Worte, die aus den Anfangsbuchstaben mehrerer Wörter gebildet werden, EDV für elektronische Daten-Verarbeitung zum Beispiel und Nasa für National Aeronautics and Space Administration. In der Studie wurden COW, STD und CLAP vorgegeben. Ein präsentierter Lückenfüller-Satz war: "Ein weniger bekannter Raum im Weissen Haus: _____." Und eine Vorgabe für ein Szenario war, nach schauderhaftem Gesang einer Freundin auf die Frage "Und, wie war's?" zu antworten.
In der Summe entstanden 945 Antworten der 105 Teilnehmenden und 180 des Chatbots, der für jede Aufgabe jeweils 20 humorvolle Antworten liefern sollte. Eine neue Gruppe von Teilnehmenden bewertete dann die Lustigkeit der Ergebnisse auf einer siebenstufigen Skala von "überhaupt nicht lustig" bis "sehr lustig".
Im Mittel fanden fast 70 Prozent der Befragten die von der KI erstellten Bemerkungen lustiger als die von Menschen ersonnenen. Vor allem bei den Szenario-Antworten habe ChatGPT aufgetrumpft, berichten die Forscher. Etwas mehr als 25 Prozent bewerteten demnach die von Menschen verfassten Bemerkungen als lustiger, etwa 5 Prozent fanden beide Quellen gleichermassen witzig.