Spaces:

Nymbo
/

Serverless-TextGen-Hub

Running

App Files Files Community

Nymbo commited on 9 days ago

Commit

3a64d68

verified ·

1 Parent(s): f8a5ab8

adding frequency penalty, top_k, seed parameters

Browse files

Files changed (1) hide show

app.py +30 -4

app.py CHANGED Viewed

@@ -20,11 +20,14 @@ def respond(
     max_tokens,
     temperature,
     top_p,
 ):
     print(f"Received message: {message}")
     print(f"History: {history}")
     print(f"System message: {system_message}")
-    print(f"Max tokens: {max_tokens}, Temperature: {temperature}, Top-P: {top_p}")
     messages = [{"role": "system", "content": system_message}]
@@ -40,13 +43,16 @@ def respond(
     response = ""
     print("Sending request to OpenAI API.")
     for message in client.chat.completions.create(
         model="meta-llama/Llama-3.3-70B-Instruct",
         max_tokens=max_tokens,
         stream=True,
         temperature=temperature,
         top_p=top_p,
         messages=messages,
     ):
         token = message.choices[0].delta.content
@@ -55,7 +61,7 @@ def respond(
         yield response
     print("Completed response generation.")
 chatbot = gr.Chatbot(height=600)
 print("Chatbot interface created.")
@@ -73,7 +79,27 @@ demo = gr.ChatInterface(
             step=0.05,
             label="Top-P",
         ),
     ],
     fill_height=True,
     chatbot=chatbot,

     max_tokens,
     temperature,
     top_p,
+    frequency_penalty,
+    top_k,
+    seed,
 ):
     print(f"Received message: {message}")
     print(f"History: {history}")
     print(f"System message: {system_message}")
+    print(f"Max tokens: {max_tokens}, Temperature: {temperature}, Top-P: {top_p}, Frequency Penalty: {frequency_penalty}, Top-K: {top_k}, Seed: {seed}")
     messages = [{"role": "system", "content": system_message}]
     response = ""
     print("Sending request to OpenAI API.")
     for message in client.chat.completions.create(
         model="meta-llama/Llama-3.3-70B-Instruct",
         max_tokens=max_tokens,
         stream=True,
         temperature=temperature,
         top_p=top_p,
+        frequency_penalty=frequency_penalty,
+        top_k=top_k,
+        seed=seed,
         messages=messages,
     ):
         token = message.choices[0].delta.content
         yield response
     print("Completed response generation.")
 chatbot = gr.Chatbot(height=600)
 print("Chatbot interface created.")
             step=0.05,
             label="Top-P",
         ),
+        gr.Slider(
+            minimum=0.0,
+            maximum=2.0,
+            value=0.0,
+            step=0.1,
+            label="Frequency Penalty",
+        ),
+        gr.Slider(
+            minimum=1,
+            maximum=100,
+            value=50,
+            step=1,
+            label="Top-K",
+        ),
+        gr.Slider(
+            minimum=-1,
+            maximum=10000,
+            value=-1,
+            step=1,
+            label="Seed (-1 for random)",
+        ),
     ],
     fill_height=True,
     chatbot=chatbot,