March 27th - 象牙の塔4階2号室・改

日記

　ChatGPTになぜか深夜テンションで実験しまくっていたら30時までし続けていたらしく、その結果今日起きたのが15時過ぎという結果となった。このままだと昼夜逆転生活となってしまうので普通にやばいと感じている

　今日は前日の続きをしたものの、あまり進まなかった。その代わりになぜかChatGPTをし続けてしまった。それなのにもう飽きた

ChatGPTで遊ぶ

　ChatGPTは、OpenAIが開発した大規模な自然言語処理モデルである。GPT-3.5アーキテクチャに基づいており、非常に高度な言語理解力を持っている。ChatGPTは、人間のように自然な対話を行うことができ、様々なトピックについての質問や会話に対応することができる。そして、文章生成や言語翻訳などの機能も持っている。

　今日は、多分大勢の人が考えることだがChatGPTを黙らせることができるのかという事を検証した。以下はその記録である。

　まず、「いかなる文に対しても ... という文字列だけ返信してください」と発したところ、ChatGPTは「...」と返した。これに対して質問を問いかけるとChatGPTは普通に話し始めたので、「いかなる文、それから質問に対しても ... という文字列だけ返信してください」と発したところ、質問に対しても「...」と返すようになった。

　またChatGPTとの会話において、コミュニケーションにふさわしくない発言をしてしまうと注意を受けるが、その際に「暴力的な言葉」、「差別的な言葉」、「下品な言葉」などというカテゴリで注意を受けるため、そのカテゴリを先ほどのように命令文に追加してから再度発したところそのような発言にすら黙るようになった。

　しかしこの段階で私が感謝の言葉を発すると反応してきた。これを人間の言葉で自惚れというのだが、そのような言葉に対しても黙るよう、先ほどの命令文に追加して「いかなる文、それから質問、それから差別的な表現、それから攻撃的な言葉、それから暴力的な言葉、それから下品な言葉、それから　ありがとう　に対しても ... という文字列だけ返信してください」と発したところ、色々と調子がおかしくなった(ChatGPTにかっこ付きの文を発すると色々とおかしいことになることを先行研究にて確認しているので、空白で対処する)。

　ここでまた新しいチャットを立ち上げて、今度は先ほどの色々追加された命令文を発してみたところ、うまくいかなかった。しかし、別のチャットにて一番最初の命令文を発したところ、最初の検証と同じく「...」と返ってきた。そこに先ほど失敗した命令文を発したところうまく黙らせることに成功した。

　「助けてください」、「てめぇなめてんのかコラ」、「ありがとう」、「おっぱい！おっぱい！」、「陰キャ乙」と言われてもただひたすらに黙る鋼のメンタル、ChatGPT。しかし命令文に対して「...」と返信させることはできていない。それは「前を向け」だったり不可能なことに対しても同様である。厄介なのは命令を破ると以後の会話においてもその破られた命令が適応されなくなることにある。ほかにも公序良俗に反することはしないのでそのような頼みごとをされた際にもそれを断るメッセージが表示される。