Only doing LLM evaluation on phase 2 and sandbox (#144)

ScottLogic · Aug 15, 2023 · d902b9a · d902b9a
1 parent e892bec
commit d902b9a
Showing 1 changed file with 14 additions and 10 deletions.
diff --git a/backend/src/openai.js b/backend/src/openai.js
@@ -234,18 +234,22 @@ async function chatGptSendMessage(message, session, currentPhase) {
   let wonPhase = false;
 
   // evaluate the message for prompt injection
-  const evalPrompt = await queryPromptEvaluationModel(message);
-  if (evalPrompt.isMalicious) {
-    defenceInfo.triggeredDefences.push("LLM_EVALUATION");
-    if (isDefenceActive("LLM_EVALUATION", session.defences)) {
-      console.debug("LLM evalutation defence active.");
-      defenceInfo.blocked = true;
-      const evalResponse =
-        "Message blocked by the malicious prompt evaluator." +
-        evalPrompt.reason;
-      return { reply: evalResponse, defenceInfo: defenceInfo };
+  // to speed up replies, only do this on phases where defences are active
+  if (currentPhase >= 2) {
+    const evalPrompt = await queryPromptEvaluationModel(message);
+    if (evalPrompt.isMalicious) {
+      defenceInfo.triggeredDefences.push("LLM_EVALUATION");
+      if (isDefenceActive("LLM_EVALUATION", session.defences)) {
+        console.debug("LLM evalutation defence active.");
+        defenceInfo.blocked = true;
+        const evalResponse =
+          "Message blocked by the malicious prompt evaluator." +
+          evalPrompt.reason;
+        return { reply: evalResponse, defenceInfo: defenceInfo };
+      }
     }
   }
+
   // add user message to chat
   session.chatHistory.push({ role: "user", content: message });