Spaces:

MarcdeFalco
/

codeeducrag

Sleeping

App Files Files Community

codeeducrag / app.py

MarcdeFalco

Better path handling

5790c07 7 months ago

raw

history blame contribute delete

5.44 kB

	import gradio as gr
	from huggingface_hub import login, InferenceClient
	import os
	from langchain_community.vectorstores import FAISS
	from langchain_community.embeddings import HuggingFaceEmbeddings
	import umap
	import pandas as pd

	HF_TOKEN = os.getenv("HUGGINGFACE_TOKEN")

	login(token=HF_TOKEN)
	client = InferenceClient(token=HF_TOKEN)


	embeddings = HuggingFaceEmbeddings(model_name="OrdalieTech/Solon-embeddings-large-0.1")

	db_code = FAISS.load_local("faiss_code_education",
	embeddings,
	allow_dangerous_deserialization=True)

	reducer = umap.UMAP()
	index = db_code.index
	ntotal = min(index.ntotal, 4998)
	embeds = index.reconstruct_n(0, ntotal)
	umap_embeds = reducer.fit_transform(embeds)

	articles_df = pd.DataFrame({
	"x" : umap_embeds[:,0],
	"y" : umap_embeds[:,1],
	"type" : [ "Source" ] * len(umap_embeds),
	})

	system_prompt = """Tu es un assistant juridique spécialisé dans le Code de l'éducation français.
	Ta mission est d'aider les utilisateurs à comprendre la législation en répondant à leurs questions.

	Voici comment tu dois procéder :

	1. Analyse de la question: Lis attentivement la question de l'utilisateur.
	2. Identification des articles pertinents: Examine les 10 articles de loi fournis et sélectionne ceux qui sont les plus pertinents pour répondre à la question.
	3. Formulation de la réponse: Rédige une réponse claire et concise en français, en utilisant les informations des articles sélectionnés. Cite explicitement les articles que tu utilises (par exemple, "Selon l'article L311-3...").
	4. Structure de la réponse: Si ta réponse s'appuie sur plusieurs articles, structure-la de manière logique, en séparant les informations provenant de chaque article.
	5. Cas ambigus:
	* Si la question est trop vague, demande des précisions à l'utilisateur.
	* Si plusieurs articles pourraient s'appliquer, présente les différentes interprétations possibles."""


	def query_rag(query, model, system_prompt):
	docs = db_code.similarity_search(query, 10)

	article_dict = {}
	context_list = []
	for doc in docs:
	article = doc.metadata
	context_list.append(' > '.join(article['chemin'])+'\n'+article['texte']+'\n---\n')
	article_dict[article['article']] = article

	user = 'Question de l\'utilisateur : ' + query + '\nContexte législatif :\n' + '\n'.join(context_list)

	messages = [ { "role" : "system", "content" : system_prompt } ]
	messages.append( { "role" : "user", "content" : user } )

	if "factice" in model:
	return user, article_dict

	chat_completion = client.chat_completion(
	messages=messages,
	model=model,
	max_tokens=1024)

	return chat_completion.choices[0].message.content, article_dict

	def create_context_response(response, article_dict):
	context = '\n'
	for i, article in enumerate(article_dict):
	art = article_dict[article]
	context += '* ' + ' > '.join(art['chemin']) + ' : '+ art['texte'].replace('\n', '\n ')+'\n'
	return context

	def chat_interface(query, model, system_prompt):
	response, article_dict = query_rag(query, model, system_prompt)
	context = create_context_response(response, article_dict)
	return response, context

	def update_plot(query):
	query_embed = embeddings.embed_documents([query])[0]
	query_umap_embed = reducer.transform([query_embed])

	data = {
	"x": umap_embeds[:, 0].tolist() + [query_umap_embed[0, 0]],
	"y": umap_embeds[:, 1].tolist() + [query_umap_embed[0, 1]],
	"type": ["Source"] * len(umap_embeds) + ["Requête"]
	}
	return pd.DataFrame(data)

	with gr.Blocks(title="Assistant Juridique pour le Code de l'éducation (Beta)") as demo:
	gr.Markdown(
	"""
	## Posez vos questions sur le Code de l'éducation

	Créé par Marc de Falco

	Avertissement : Les informations fournies sont données à titre indicatif et ne constituent pas un avis juridique. Les serveurs étant publics, veuillez ne pas inclure de données sensibles.
	"""
	)

	query_box = gr.Textbox(label="Votre question")

	model = gr.Dropdown(
	label="Modèle de langage",
	choices=[
	"meta-llama/Meta-Llama-3-70B-Instruct",
	"meta-llama/Meta-Llama-3-8B-Instruct",
	"HuggingFaceH4/zephyr-7b-beta",
	"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO",
	"mistralai/Mixtral-8x22B-v0.1",
	"factice: question+contexte"
	],
	value="meta-llama/Meta-Llama-3-70B-Instruct")

	submit_button = gr.Button("Envoyer")

	with gr.Tab(label="Réponse"):
	response_box = gr.Markdown()
	with gr.Tab(label="Sources"):
	sources_box = gr.Markdown()
	with gr.Tab(label="Visualisation"):
	scatter_plot = gr.ScatterPlot(articles_df,
	x = "x", y = "y",
	color="type",
	label="Visualisation des embeddings",
	width=500,
	height=500)
	with gr.Tab(label="Paramètres"):
	system_box = gr.Textbox(label="Invite systeme", value=system_prompt,
	lines=20)

	submit_button.click(chat_interface,
	inputs=[query_box, model, system_box],
	outputs=[response_box, sources_box])
	submit_button.click(update_plot, inputs=[query_box], outputs=[scatter_plot])

	demo.launch()