मिथुन फ्लैश 1.5, PIMPDF और Google जनरेटिव AI API Google Colab में AI-PDF इंटरैक्शन सिस्टम बनाने के लिए कोड कार्यान्वयन कोड

इस ट्यूटोरियल में, हम दिखाते हैं कि Google Colab में Ai-संचालित PDF इंटरैक्शन सिस्टम कैसे बनाया जाए, जिसका उपयोग Gemini Flash 1.5, PimpDF और Google Generative AI API का उपयोग करके किया जाता है। इन उपकरणों का लाभ देकर, हम पीडीएफएस, आरएसीटी, आरएसीटी को एकजुट कर सकते हैं, और Google के नवीनतम मिथुन फ्लैश 1.5 मॉडल से बुद्धिमान उत्तर प्राप्त कर सकते हैं, प्रश्न इंटरैक्टिव से पूछ सकते हैं।

!pip install -q -U google-generativeai PyMuPDF python-dotenv

सबसे पहले हम Google Colab में AI -Powered PDF Q & A सिस्टम बनाने के लिए आवश्यक निर्भरता स्थापित करते हैं। Google-jinritve, GEMINI FLASH 1.5 प्रदान करता है CESS प्रदान करता है, प्राकृतिक भाषा इंटरैक्शन को सक्षम करता है, जबकि PMUPDF (FITZ के रूप में भी जाना जाता है) PDF से कुशल पाठ निष्कर्षण की अनुमति देता है। इसके अलावा, पायथन-डोटेनोव, नोटबुक में सुरक्षित रूप से, एपीआई कीज़ जैसे पर्यावरण वेरिएंट को प्रबंधित करने में मदद करता है।

from google.colab import files
uploaded = files.upload()

हम आपके स्थानीय डिवाइस से Google Colab पर फ़ाइलें अपलोड करते हैं। निष्पादित होने पर, यह फ़ाइल चयन संवाद खोलता है, जिससे आप अपलोड फ़ाइल (जैसे, पीडीएफ) का चयन कर सकते हैं। अपलोड की गई फ़ाइल को एक शब्दकोश की तरह ऑब्जेक्ट buject (अपलोड) में संग्रहीत किया जाता है, जहां कुंजियों में फ़ाइल के द्विआधारी डेटा होते हैं जो फ़ाइल नाम और मानों का प्रतिनिधित्व करता है। यह कदम COLAB वातावरण में सीधे दस्तावेजों, डेटासेट या मॉडल वेट को संसाधित करने के लिए आवश्यक है।

import fitz


def extract_pdf_text(pdf_path):
    doc = fitz.open(pdf_path)
    full_text = ""
    for page in doc:
        full_text += page.get_text()
    return full_text


pdf_file_path="/content/Paper.pdf"
document_text = extract_pdf_text(pdf_path=pdf_file_path)
print("Document text extracted!")
print(document_text(:1000)) 

हम Google Colab में PDF फाइल से टेक्स्ट ka rect va के लिए pimupdf (Fitz) का उपयोग करते हैं। फ़ंक्शन extract_pdf_text (PDF_P ATH TH) PDF को पढ़ता है, इसके पृष्ठों द्वारा दोहराया जाता है, और पाठ सामग्री प्राप्त करता है। Rected vow में पाठ तब document_text में संग्रहीत किया जाता है, पहले 1000 वर्ण सामग्री का पूर्वावलोकन करने के लिए मुद्रित होते हैं। यह कदम पाठ-आधारित विश्लेषण और पीडीएफ के माध्यम से एआई-आधारित प्रश्न का उत्तर देने में सक्षम है।

import os
os.environ("GOOGLE_API_KEY") = 'Use your own API key here'

हमने Google API कुंजी को Google Colab में एक पर्यावरण चर के रूप में सेट किया है। API कुंजी को AI- संचालित टेक्स्ट प्रोसेसिंग के लिए Google जनरेटिव AI, GEMINI FLASH 1.5 के अनुरोधों को प्रमाणित करने की आवश्यकता है। एक वैध कुंजी के साथ ‘अपने स्वयं के एपीआई कुंजी का उपयोग’ का उपयोग करना सुनिश्चित करता है कि मॉडल नोटबुक में सुरक्षित रूप से उत्तर का उत्पादन कर सकता है।

import google.generativeai as genai


genai.configure(api_key=os.environ("GOOGLE_API_KEY"))


model_name = "models/gemini-1.5-flash-001"


def query_gemini_flash(question, context):
    model = genai.GenerativeModel(model_name=model_name)
    prompt = f"""
Context: {context(:20000)}


Question: {question}


Answer:
"""
    response = model.generate_content(prompt)
    return response.text


pdf_text = extract_pdf_text("/content/Paper.pdf")


question = "Summarize the key findings of this document."
answer = query_gemini_flash(question, pdf_text)
print("Gemini Flash Answer:")
print(answer)

अंत में, हम AI- संचालित पाठ पीढ़ी के लिए एक पीडीएफ दस्तावेज़ का उपयोग करके मिथुन फ्लैश 1.5 को कॉन्फ़िगर और क्वेरी करते हैं। यह एपीआई कुंजी के साथ Gaini लाइब्रेरी के साथ शुरू होता है और मिथुन फ्लैश 1.5 मॉडल (GEMINI -1.5 -Flash -001) को लोड करता है। Query_jemini_flash () एक प्रश्न कार्य करता है और पीडीएफ पाठ एक इनपुट के रूप में आरसीटी है, एक संरचित प्रॉम्प्ट के लिए सूत्र देता है, और एआई-जनित प्रतिक्रिया प्राप्त करता है। यह सेटअप पीडीएफ और इंटेलिजेंट क्यू एंड ए से स्वचालित दस्तावेज़ सारांश को सक्षम करता है।

अंत में, इस ट्यूटोरियल के मद्देनजर, हमने Google Colab में एक इंटरैक्टिव PDF- आधारित इंटरैक्शन सिस्टम को सफलतापूर्वक मिथुन फ्लैश 1.5, PIMPDF और Google जेनेरिक एपीआई का उपयोग करके बनाया है। यह समाधान उपयोगकर्ताओं को पीडीएफ जानकारी और इंटरैक्टिव तरीकों से आसानी से जानकारी को कम करने में सक्षम बनाता है। Google के अत्याधुनिक एआई मॉडल और COLAB के क्लाउड-आधारित वातावरण का संयोजन भारी गिनती संसाधनों की आवश्यकता के बिना बड़े दस्तावेजों को संसाधित करने के लिए एक शक्तिशाली और सुलभ तरीका प्रदान करता है।


यहाँ है कोटिनी नोटबुक। इसके अलावा, हमें फॉलो करना न भूलें ट्विटर और हमसे जुड़ें टेलीग्राफिक मीडिया और लिंक्डइन जी.आर.सिर हिलाकर सहमति देना। हमसे जुड़ने के लिए मत भूलना 80K+ एमएल सबमिटेड


ASIF Razzaq एक दूरदर्शी उद्यमी और इंजीनियर के रूप में मार्केटएकपोस्ट मीडिया इंक के सीईओ हैं, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की संभावना को बढ़ाने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का उद्घाटन है, जो मशीन लर्निंग की गहराई के लिए और कवरेज की गहराई के लिए गहरी सीखने की खबर के लिए है। यह तकनीकी रूप से ध्वनि है और एक बड़े दर्शकों द्वारा आसानी से समझ में आता है। प्लेटफ़ॉर्म में 2 मिलियन से अधिक मासिक दृश्य हैं, जो दर्शकों के बीच अपनी लोकप्रियता दिखाते हैं।

पार्लेंट: LLMS (B ED) के साथ एक विश्वसनीय AI ग्राहक का सामना करना

Dr. Ashish V

Dr. Ashish V

Leave a Replay

About Me

I am a Ph.D. holder and a dedicated blogger with a focus on Artificial Intelligence, technology education, and emerging tech challenges. With a strong academic foundation and extensive research experience, I am committed to delivering insightful content that bridges the gap between cutting-edge technology and practical understanding. My writing explores the latest advancements in AI, addresses critical tech issues, and provides in-depth analysis to keep readers informed and empowered in the rapidly evolving digital landscape.

Recent Posts

Scroll to Top