इस ट्यूटोरियल में, हम दिखाते हैं कि Google Colab में Ai-संचालित PDF इंटरैक्शन सिस्टम कैसे बनाया जाए, जिसका उपयोग Gemini Flash 1.5, PimpDF और Google Generative AI API का उपयोग करके किया जाता है। इन उपकरणों का लाभ देकर, हम पीडीएफएस, आरएसीटी, आरएसीटी को एकजुट कर सकते हैं, और Google के नवीनतम मिथुन फ्लैश 1.5 मॉडल से बुद्धिमान उत्तर प्राप्त कर सकते हैं, प्रश्न इंटरैक्टिव से पूछ सकते हैं।
!pip install -q -U google-generativeai PyMuPDF python-dotenv
सबसे पहले हम Google Colab में AI -Powered PDF Q & A सिस्टम बनाने के लिए आवश्यक निर्भरता स्थापित करते हैं। Google-jinritve, GEMINI FLASH 1.5 प्रदान करता है CESS प्रदान करता है, प्राकृतिक भाषा इंटरैक्शन को सक्षम करता है, जबकि PMUPDF (FITZ के रूप में भी जाना जाता है) PDF से कुशल पाठ निष्कर्षण की अनुमति देता है। इसके अलावा, पायथन-डोटेनोव, नोटबुक में सुरक्षित रूप से, एपीआई कीज़ जैसे पर्यावरण वेरिएंट को प्रबंधित करने में मदद करता है।
from google.colab import files
uploaded = files.upload()
हम आपके स्थानीय डिवाइस से Google Colab पर फ़ाइलें अपलोड करते हैं। निष्पादित होने पर, यह फ़ाइल चयन संवाद खोलता है, जिससे आप अपलोड फ़ाइल (जैसे, पीडीएफ) का चयन कर सकते हैं। अपलोड की गई फ़ाइल को एक शब्दकोश की तरह ऑब्जेक्ट buject (अपलोड) में संग्रहीत किया जाता है, जहां कुंजियों में फ़ाइल के द्विआधारी डेटा होते हैं जो फ़ाइल नाम और मानों का प्रतिनिधित्व करता है। यह कदम COLAB वातावरण में सीधे दस्तावेजों, डेटासेट या मॉडल वेट को संसाधित करने के लिए आवश्यक है।
import fitz
def extract_pdf_text(pdf_path):
doc = fitz.open(pdf_path)
full_text = ""
for page in doc:
full_text += page.get_text()
return full_text
pdf_file_path="/content/Paper.pdf"
document_text = extract_pdf_text(pdf_path=pdf_file_path)
print("Document text extracted!")
print(document_text(:1000))
हम Google Colab में PDF फाइल से टेक्स्ट ka rect va के लिए pimupdf (Fitz) का उपयोग करते हैं। फ़ंक्शन extract_pdf_text (PDF_P ATH TH) PDF को पढ़ता है, इसके पृष्ठों द्वारा दोहराया जाता है, और पाठ सामग्री प्राप्त करता है। Rected vow में पाठ तब document_text में संग्रहीत किया जाता है, पहले 1000 वर्ण सामग्री का पूर्वावलोकन करने के लिए मुद्रित होते हैं। यह कदम पाठ-आधारित विश्लेषण और पीडीएफ के माध्यम से एआई-आधारित प्रश्न का उत्तर देने में सक्षम है।
import os
os.environ("GOOGLE_API_KEY") = 'Use your own API key here'
हमने Google API कुंजी को Google Colab में एक पर्यावरण चर के रूप में सेट किया है। API कुंजी को AI- संचालित टेक्स्ट प्रोसेसिंग के लिए Google जनरेटिव AI, GEMINI FLASH 1.5 के अनुरोधों को प्रमाणित करने की आवश्यकता है। एक वैध कुंजी के साथ ‘अपने स्वयं के एपीआई कुंजी का उपयोग’ का उपयोग करना सुनिश्चित करता है कि मॉडल नोटबुक में सुरक्षित रूप से उत्तर का उत्पादन कर सकता है।
import google.generativeai as genai
genai.configure(api_key=os.environ("GOOGLE_API_KEY"))
model_name = "models/gemini-1.5-flash-001"
def query_gemini_flash(question, context):
model = genai.GenerativeModel(model_name=model_name)
prompt = f"""
Context: {context(:20000)}
Question: {question}
Answer:
"""
response = model.generate_content(prompt)
return response.text
pdf_text = extract_pdf_text("/content/Paper.pdf")
question = "Summarize the key findings of this document."
answer = query_gemini_flash(question, pdf_text)
print("Gemini Flash Answer:")
print(answer)
अंत में, हम AI- संचालित पाठ पीढ़ी के लिए एक पीडीएफ दस्तावेज़ का उपयोग करके मिथुन फ्लैश 1.5 को कॉन्फ़िगर और क्वेरी करते हैं। यह एपीआई कुंजी के साथ Gaini लाइब्रेरी के साथ शुरू होता है और मिथुन फ्लैश 1.5 मॉडल (GEMINI -1.5 -Flash -001) को लोड करता है। Query_jemini_flash () एक प्रश्न कार्य करता है और पीडीएफ पाठ एक इनपुट के रूप में आरसीटी है, एक संरचित प्रॉम्प्ट के लिए सूत्र देता है, और एआई-जनित प्रतिक्रिया प्राप्त करता है। यह सेटअप पीडीएफ और इंटेलिजेंट क्यू एंड ए से स्वचालित दस्तावेज़ सारांश को सक्षम करता है।
अंत में, इस ट्यूटोरियल के मद्देनजर, हमने Google Colab में एक इंटरैक्टिव PDF- आधारित इंटरैक्शन सिस्टम को सफलतापूर्वक मिथुन फ्लैश 1.5, PIMPDF और Google जेनेरिक एपीआई का उपयोग करके बनाया है। यह समाधान उपयोगकर्ताओं को पीडीएफ जानकारी और इंटरैक्टिव तरीकों से आसानी से जानकारी को कम करने में सक्षम बनाता है। Google के अत्याधुनिक एआई मॉडल और COLAB के क्लाउड-आधारित वातावरण का संयोजन भारी गिनती संसाधनों की आवश्यकता के बिना बड़े दस्तावेजों को संसाधित करने के लिए एक शक्तिशाली और सुलभ तरीका प्रदान करता है।
यहाँ है कोटिनी नोटबुक। इसके अलावा, हमें फॉलो करना न भूलें ट्विटर और हमसे जुड़ें टेलीग्राफिक मीडिया और लिंक्डइन जी.आर.सिर हिलाकर सहमति देना। हमसे जुड़ने के लिए मत भूलना 80K+ एमएल सबमिटेड।
ASIF Razzaq एक दूरदर्शी उद्यमी और इंजीनियर के रूप में मार्केटएकपोस्ट मीडिया इंक के सीईओ हैं, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की संभावना को बढ़ाने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का उद्घाटन है, जो मशीन लर्निंग की गहराई के लिए और कवरेज की गहराई के लिए गहरी सीखने की खबर के लिए है। यह तकनीकी रूप से ध्वनि है और एक बड़े दर्शकों द्वारा आसानी से समझ में आता है। प्लेटफ़ॉर्म में 2 मिलियन से अधिक मासिक दृश्य हैं, जो दर्शकों के बीच अपनी लोकप्रियता दिखाते हैं।
पार्लेंट: LLMS (B ED) के साथ एक विश्वसनीय AI ग्राहक का सामना करना