quran-finder-be

Running

App Files Files Community

Bofandra commited on Aug 24, 2024

Commit

4525d51

verified ·

1 Parent(s): e9c92d6

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -8

app.py CHANGED Viewed

@@ -5,10 +5,10 @@ import pickle
 from pathlib import Path
 import time
-print("load model start\n")
 print(time.time())
 model = SentenceTransformer('intfloat/multilingual-e5-large-instruct')
-print("load model end\n")
 print(time.time())
 def make_clickable_both(val):
@@ -30,7 +30,7 @@ def find(query):
     ]
     quran = pd.read_csv('quran-eng.csv', delimiter=",")
-    print("load quran eng\n")
     print(time.time())
     #file = open('quran-splitted.sav','rb')
@@ -44,22 +44,24 @@ def find(query):
     # pickle.dump(embeddings, open(filename, 'wb'))
     file = open('encoded_quran_text_split_multilingual-e5-large-instructs.sav','rb')
     document_embeddings = pickle.load(file)
-    print("load quran embedding\n")
     print(time.time())
     query_embeddings = model.encode(queries, convert_to_tensor=True, normalize_embeddings=True)
     scores = (query_embeddings @ document_embeddings.T) * 100
-    print("count similarities\n")
     print(time.time())
     # insert the similarity value to dataframe & sort it
     file = open('quran-splitted.sav','rb')
     quran_splitted = pickle.load(file)
-    print("load quran\n")
     print(time.time())
     quran_splitted['similarity'] = scores.tolist()[0]
     sorted_quran = quran_splitted.sort_values(by='similarity', ascending=False)
-    print("sort by similarity\n")
     print(time.time())
     #results = ""
@@ -71,7 +73,7 @@ def find(query):
         results = pd.concat([results, result_quran])
         #results = results + result_quran['text'].item()+" (Q.S "+str(result['sura']).rstrip('.0')+":"+str(result['aya']).rstrip('.0')+")\n"
         i=i+1
-    print("collect results\n")
     print(time.time())
     url = 'https://quran.com/'+results['sura'].astype(str)+':'+results['aya'].astype(str)+'/tafsirs/en-tafisr-ibn-kathir'

 from pathlib import Path
 import time
+print("load model start")
 print(time.time())
 model = SentenceTransformer('intfloat/multilingual-e5-large-instruct')
+print("load model end")
 print(time.time())
 def make_clickable_both(val):
     ]
     quran = pd.read_csv('quran-eng.csv', delimiter=",")
+    print("load quran eng")
     print(time.time())
     #file = open('quran-splitted.sav','rb')
     # pickle.dump(embeddings, open(filename, 'wb'))
     file = open('encoded_quran_text_split_multilingual-e5-large-instructs.sav','rb')
     document_embeddings = pickle.load(file)
+    print("load quran embedding")
     print(time.time())
     query_embeddings = model.encode(queries, convert_to_tensor=True, normalize_embeddings=True)
+    print("embed query")
+    print(time.time())
     scores = (query_embeddings @ document_embeddings.T) * 100
+    print("count similarities")
     print(time.time())
     # insert the similarity value to dataframe & sort it
     file = open('quran-splitted.sav','rb')
     quran_splitted = pickle.load(file)
+    print("load quran")
     print(time.time())
     quran_splitted['similarity'] = scores.tolist()[0]
     sorted_quran = quran_splitted.sort_values(by='similarity', ascending=False)
+    print("sort by similarity")
     print(time.time())
     #results = ""
         results = pd.concat([results, result_quran])
         #results = results + result_quran['text'].item()+" (Q.S "+str(result['sura']).rstrip('.0')+":"+str(result['aya']).rstrip('.0')+")\n"
         i=i+1
+    print("collect results")
     print(time.time())
     url = 'https://quran.com/'+results['sura'].astype(str)+':'+results['aya'].astype(str)+'/tafsirs/en-tafisr-ibn-kathir'