কৃত্রিম বুদ্ধিমত্তা (Artificial Intelligence) দ্রুত ডেটা বিশ্লেষণের পদ্ধতিকে পরিবর্তন করছে, এবং এই বিপ্লবের একেবারে সামনে রয়েছে এআই এজেন্ট (AI Agents)। এই অত্যাধুনিক সিস্টেমগুলি, লার্জ ল্যাঙ্গুয়েজ মডেল (Large Language Models - LLMs) দ্বারা চালিত, নির্দিষ্ট লক্ষ্য অর্জনের জন্য উদ্দেশ্য সম্পর্কে যুক্তি দেওয়ার এবং সেই অনুযায়ী কাজ করার অসাধারণ ক্ষমতা রাখে। প্রথাগত এআই সিস্টেমগুলি যেখানে শুধুমাত্র প্রশ্নের উত্তর দেয়, সেখানে এআই এজেন্টদের ডেটাফ্রেম (dataframes) এবং টাইম সিরিজের (time series) মতো ডেটার জটিল প্রক্রিয়াকরণ সহ একাধিক কার্যক্রম সাজানোর জন্য ডিজাইন করা হয়েছে। এই ক্ষমতা বাস্তব জগতের বিভিন্ন অ্যাপ্লিকেশনের দরজা খুলে দিয়েছে, ডেটা বিশ্লেষণে সকলের প্রবেশাধিকারকে সহজলভ্য করেছে এবং ব্যবহারকারীদের স্বয়ংক্রিয় রিপোর্টিং, নো-কোড কোয়েরি (no-code queries) সম্পাদন এবং ডেটা পরিষ্কার ও ম্যানিপুলেশনে অতুলনীয় সহায়তা প্রদানে ক্ষমতা প্রদান করছে।
এআই এজেন্টদের সাথে ডেটাফ্রেম নেভিগেট করা: দুটি ভিন্ন পদ্ধতি
এআই এজেন্টরা ডেটাফ্রেমের সাথে দুটি মৌলিকভাবে ভিন্ন পদ্ধতিতে যোগাযোগ করতে পারে, যার প্রত্যেকটির নিজস্ব শক্তি এবং দুর্বলতা রয়েছে:
স্বাভাবিক ভাষা মিথস্ক্রিয়া (Natural Language Interaction): এই পদ্ধতিতে, এলএলএম (LLM) সতর্কতার সাথে একটি স্ট্রিং হিসাবে টেবিলটি বিশ্লেষণ করে, ডেটা বুঝতে এবং অর্থপূর্ণ অন্তর্দৃষ্টি বের করতে তার বিস্তৃত জ্ঞান ব্যবহার করে। এই পদ্ধতি ডেটার মধ্যেকার প্রেক্ষাপট এবং সম্পর্কগুলি বুঝতে পারার ক্ষেত্রে খুবই উপযোগী, তবে সংখ্যাগত ডেটা (numerical data) এবং জটিল গণনা করার ক্ষেত্রে এলএলএমের সহজাত সীমাবদ্ধতা থাকতে পারে।
কোড জেনারেশন এবং এক্সিকিউশন (Code Generation and Execution): এই পদ্ধতিতে, এআই এজেন্ট একটি কাঠামোগত বস্তু হিসাবে ডেটাসেট প্রক্রিয়াকরণের জন্য বিশেষ সরঞ্জাম সক্রিয় করে। এজেন্ট ডেটাফ্রেমের উপর নির্দিষ্ট ক্রিয়াকলাপ সম্পাদনের জন্য কোড স্নিপেট তৈরি এবং কার্যকর করে, যা নির্ভুল এবং দক্ষ ডেটা ম্যানিপুলেশন করতে সক্ষম। সংখ্যাগত ডেটা এবং জটিল গণনাগুলির সাথে কাজ করার সময় এই পদ্ধতিটি বিশেষভাবে কার্যকর, তবে এটি বাস্তবায়ন এবং রক্ষণাবেক্ষণের জন্য উচ্চ স্তরের প্রযুক্তিগত দক্ষতার প্রয়োজন।
স্বাভাবিক ভাষা প্রক্রিয়াকরণের (Natural Language Processing - NLP) শক্তিকে কোড সম্পাদনের নির্ভুলতার সাথে একত্রিত করে, এআই এজেন্টরা ব্যবহারকারীদের জটিল ডেটাসেটের সাথে যোগাযোগ করতে এবং তাদের প্রযুক্তিগত দক্ষতা নির্বিশেষে মূল্যবান অন্তর্দৃষ্টি পেতে সহায়তা করে।
হাতে-কলমে প্রশিক্ষণ: এআই এজেন্টদের সাথে ডেটাফ্রেম এবং টাইম সিরিজ প্রক্রিয়াকরণ
এই বিস্তৃত টিউটোরিয়ালে, আমরা ডেটাফ্রেম এবং টাইম সিরিজ প্রক্রিয়াকরণে এআই এজেন্টদের ব্যবহারিক প্রয়োগগুলি অন্বেষণ করার জন্য একটি যাত্রা শুরু করব। আমরা কিছু দরকারি পাইথন (Python) কোড স্নিপেটের (code snippets) একটি সংগ্রহ দেখব যা সহজেই অনেক ধরনের পরিস্থিতিতে ব্যবহার করা যেতে পারে। কোডের প্রতিটি লাইন বিস্তারিতভাবে ব্যাখ্যা করা হবে, যাতে আপনি সহজেই উদাহরণগুলি পুনরায় তৈরি করতে পারেন এবং আপনার নির্দিষ্ট প্রয়োজন অনুসারে সেগুলিকে পরিবর্তন করতে পারেন।
প্রস্তুতি: ওলামার (Ollama) সাথে পরিচিতি
আমাদের অনুসন্ধান শুরু হবে ওলামা (Ollama) সেটআপ করার মাধ্যমে, এটি একটি শক্তিশালী লাইব্রেরি যা ব্যবহারকারীদের ক্লাউড-ভিত্তিক পরিষেবার প্রয়োজন ছাড়াই স্থানীয়ভাবে ওপেন-সোর্স এলএলএম (open-source LLMs) চালাতে সক্ষম করে। ওলামা ডেটা গোপনীয়তা এবং কর্মক্ষমতার উপর অতুলনীয় নিয়ন্ত্রণ প্রদান করে, আপনার সংবেদনশীল ডেটা নিরাপদে আপনার ডিভাইসে থাকে তা নিশ্চিত করে।
শুরু করতে, নিম্নলিখিত কমান্ড ব্যবহার করে ওলামা ইনস্টল করুন:
1 | curl -fsSL https://ollama.com/install.sh | sh |
এই কমান্ডটি ওলামা ডাউনলোড এবং ইনস্টল করার প্রক্রিয়া শুরু করবে। একবার ইনস্টল হয়ে গেলে, আপনি নিম্নলিখিত কমান্ডটি ব্যবহার করে আপনার পছন্দের এলএলএম ডাউনলোড করতে পারেন:
1 | ollama run llama3 |
এই কমান্ডটি লামা ৩ (llama3) মডেলটি ডাউনলোড এবং রান করবে। আপনি আপনার প্রয়োজন অনুসারে অন্যান্য মডেলও ব্যবহার করতে পারেন।
ডেটাফ্রেমের সাথে মিথস্ক্রিয়া: Pandas AI
এআই এজেন্টদের সাথে ডেটাফ্রেমের সাথে মিথস্ক্রিয়া করার জন্য, আমরা পান্ডাস এআই (Pandas AI) লাইব্রেরি ব্যবহার করব। পান্ডাস এআই পান্ডাসের (Pandas) সাথে এলএলএমের শক্তিকে একত্রিত করে, যা ব্যবহারকারীদের স্বাভাবিক ভাষা ব্যবহার করে ডেটাফ্রেমের সাথে যোগাযোগ করতে সক্ষম করে।
পান্ডাস এআই ইনস্টল করতে, নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
1 | pip install pandasai |
একবার ইনস্টল হয়ে গেলে, আপনি নিম্নলিখিত কোডটি ব্যবহার করে পান্ডাস এআই শুরু করতে পারেন:
1 | import pandas as pd |
এই কোডটি পান্ডাস এআই লাইব্রেরি ইম্পোর্ট (import) করে, আপনার ওপেনএআই (OpenAI) এপিআই (API) কী ব্যবহার করে একটি পান্ডাসএআই অবজেক্ট (PandasAI object) তৈরি করে এবং তিনটি কলাম (column) সহ একটি ডেটাফ্রেম তৈরি করে: নাম, বয়স এবং শহর। এরপর এটি এআইকে জিজ্ঞাসা করে “সবচেয়ে বয়স্ক কে?” পান্ডাস এআই ডেটাফ্রেমটি প্রক্রিয়া করবে এবং সবচেয়ে বয়স্ক ব্যক্তির নাম ফেরত দেবে।
টাইম সিরিজ বিশ্লেষণ: StatsForecast
টাইম সিরিজ বিশ্লেষণের (Time series analysis) জন্য, আমরা স্ট্যাটসফোরকাস্ট (StatsForecast) লাইব্রেরি ব্যবহার করব। স্ট্যাটসফোরকাস্ট একটি পাইথন লাইব্রেরি যা টাইম সিরিজ মডেলিং এবং পূর্বাভাসের জন্য দ্রুত এবং সঠিক অ্যালগরিদম সরবরাহ করে।
স্ট্যাটসফোরকাস্ট ইনস্টল করতে, নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
1 | pip install statsforecast |
একবার ইনস্টল হয়ে গেলে, আপনি নিম্নলিখিত কোডটি ব্যবহার করে স্ট্যাটসফোরকাস্ট ব্যবহার করতে পারেন:
1 | from statsforecast import StatsForecast |
এই কোডটি স্ট্যাটসফোরকাস্ট লাইব্রেরি ইম্পোর্ট করে, তারিখ এবং সংশ্লিষ্ট মান সহ একটি ডেটাফ্রেম তৈরি করে। এরপর এটি একটি অটোআরআইএমএ (AutoARIMA) মডেল তৈরি করে, ডেটা ব্যবহার করে মডেলটিকে প্রশিক্ষণ দেয় এবং আগামী ৭ দিনের জন্য পূর্বাভাস তৈরি করে। পরিশেষে, এটি পূর্বাভাসের ফলাফল প্রিন্ট করে।
এআই এজেন্টদের সাথে ডেটা পরিষ্কার করা
ডেটা পরিষ্কার করা ডেটা বিশ্লেষণের একটি গুরুত্বপূর্ণ অংশ। এআই এজেন্টরা স্বয়ংক্রিয়ভাবে ডেটা পরিষ্কার করার প্রক্রিয়াটিকে সহজ করতে পারে। উদাহরণস্বরূপ, তারা অনুপস্থিত মানগুলি পূরণ করতে পারে, ভুল ডেটা সনাক্ত করতে পারে এবং ডেটা ফর্ম্যাটটিকে সামঞ্জস্য করতে পারে।
নিচে একটি উদাহরণ দেওয়া হল কিভাবে পান্ডাস এআই ব্যবহার করে ডেটা পরিষ্কার করা যায়:
1 | import pandas as pd |
এই কোডটি পান্ডাস এআই লাইব্রেরি ইম্পোর্ট করে, আপনার ওপেনএআই এপিআই কী ব্যবহার করে একটি পান্ডাসএআই অবজেক্ট তৈরি করে এবং কিছু অনুপস্থিত মান সহ একটি ডেটাফ্রেম তৈরি করে। এরপর এটি এআইকে “কলামের গড় মান দিয়ে অনুপস্থিত মানগুলি পূরণ করুন” এই কথাটি বলে। পান্ডাস এআই ডেটাফ্রেমটি প্রক্রিয়া করবে এবং অনুপস্থিত মানগুলি কলামের গড় মান দিয়ে পূরণ করবে। পরিশেষে, এটি পরিষ্কার করা ডেটাফ্রেমটি প্রিন্ট করে।
এআই এজেন্টদের সাথে স্বয়ংক্রিয় রিপোর্টিং
এআই এজেন্টরা স্বয়ংক্রিয়ভাবে ডেটা থেকে রিপোর্ট তৈরি করতে পারে। উদাহরণস্বরূপ, তারা ডেটা থেকে মূল অন্তর্দৃষ্টিগুলি বের করতে পারে, ডেটা ভিজ্যুয়ালাইজেশন তৈরি করতে পারে এবং রিপোর্ট তৈরি করতে পারে।
নিচে একটি উদাহরণ দেওয়া হল কিভাবে পান্ডাস এআই ব্যবহার করে একটি রিপোর্ট তৈরি করা যায়:
1 | import pandas as pd |
এই কোডটি পান্ডাস এআই লাইব্রেরি ইম্পোর্ট করে, আপনার ওপেনএআই এপিআই কী ব্যবহার করে একটি পান্ডাসএআই অবজেক্ট তৈরি করে এবং তিনটি কলাম সহ একটি ডেটাফ্রেম তৈরি করে: নাম, বয়স এবং শহর। এরপর এটি এআইকে “ডেটা সংক্ষিপ্ত করে একটি রিপোর্ট তৈরি করুন” এই কথাটি বলে। পান্ডাস এআই ডেটাফ্রেমটি প্রক্রিয়া করবে এবং ডেটার একটি সংক্ষিপ্তসার তৈরি করবে। পরিশেষে, এটি রিপোর্টটি প্রিন্ট করে।
উপসংহার
এআই এজেন্টরা ডেটা বিশ্লেষণ এবং প্রক্রিয়াকরণের ক্ষেত্রে একটি নতুন দিগন্ত উন্মোচন করেছে। এই টিউটোরিয়ালে, আমরা দেখেছি কিভাবে এআই এজেন্টরা ডেটাফ্রেমের সাথে যোগাযোগ করতে, টাইম সিরিজ বিশ্লেষণ করতে, ডেটা পরিষ্কার করতে এবং স্বয়ংক্রিয়ভাবে রিপোর্ট তৈরি করতে পারে। এই ক্ষমতাগুলি ডেটা বিশ্লেষণকে আরও সহজলভ্য এবং দক্ষ করে তুলবে, যা বিভিন্ন শিল্প এবং গবেষণায় নতুন সুযোগ সৃষ্টি করবে। এআই এজেন্টদের আরও উন্নত ব্যবহারের মাধ্যমে, আমরা ডেটা থেকে আরও মূল্যবান অন্তর্দৃষ্টি পেতে এবং আরও ভালো সিদ্ধান্ত নিতে পারব। এই প্রযুক্তির সম্ভাবনা অসীম, এবং আমরা এর আরও উন্নয়নের দিকে তাকিয়ে আছি।