বিভিন্ন AI-ভিত্তিক ফিচার নিয়ে আসতে চলেছে Google Gemini
Photo Credit: Google
জেমিনি ২.৫ প্রো এবং ফ্ল্যাশ এখন জেমিনি এপিআই এবং ভার্টেক্স এআই-তে চিন্তার সারাংশ অন্তর্ভুক্ত করবে।
বিগত মঙ্গলবার Google I/O 2025-তে তাদের Gemini 2.5 ফ্যামিলির AI সম্পন্ন মডেলগুলোর জন্য DeepThink-নামক একটি নতুন উন্নতমানের রিজনিং-মোড নিয়ে এসেছে,যেগুলি Gemini 2.5 প্রো-মডেলগুলির সাহায্যে চলে।এছাড়াও এটি ন্যাটিভ অডিও আউটপুট নামক একটি নতুন ফিচার এনেছে। এছাড়াও কোম্পানি ডেভেলপারদের জন্য নতুন জেমিনি মডেলগুলিতে thought summarise এবং থিঙ্কিং বাজেটের সুবিধা নিয়ে আসবে।LMArena Leaderboard-এ সবার উপরে র্যাংক করেছে Gemini 2.5 Pro,কোম্পানী আসন্ন মাসে Gemini 2.5 AI-মডেল সিরিজগুলিতে নতুন কার্যক্ষমতা এবং ফিচারগুলো কিভাবে চালনা করবে সেই বিস্তারিতভাবে জানিয়েছে। চলতি মাসের শুরুতে উন্নতমানের কোডিং ক্ষমতার সাথে গুগল Gemini 2.5 Pro-এর একটি আপডেট সংস্করণ রিলিজ করেছে। আপডেট করা মডেলটি WebDev Arena এবং LMArena-র সবচেয়ে উপরের র্যাংক করেছে।
Google তাদের AI-মডেলকে নতুন Deep Think-মোডের মাধ্যমে আরও উন্নত করছে।এই নতুন রিজনিং-মোড Gemini 2.5 Pro-কে উত্তর দেওয়ার আগে সম্ভাব্য ব্যাখ্যা বিবেচনা করার সুযোগ দেয়।অভ্যন্তরীণ পরীক্ষার মাধ্যমে কোম্পানি বিভিন্ন প্যারামিটার অনুযায়ী Gemini 2.5 Pro Deep Think, 2025-এর UAMO তে 49.4% স্কোর করেছে।এছাড়াও এটি LiveCodeBench v6 এবং MMMU-তে ভালো স্কোর করেছে।
Deep-Think বর্তমানে পরীক্ষা করা হচ্ছে। বর্তমানে রিজেনিং মোডটি শুধুমাত্র Gemini API-এর মাধ্যমে বিশ্বস্ত পরীক্ষকদের দেওয়া হবে। তবে এটি রিলিজের তারিখ ঘোষণা করা হয়নি।
কোম্পানির মতে, একমাস আগে প্রকাশিত Gemini 2.5 Flash-মডেলে নতুন কিছু ক্ষমতা যোগকরা হয়েছে। কোম্পানির তরফে বলা হয়েছে যে, এই AI-মডেলটির যুক্তি বিশ্লেষণ,মাল্টিমোডাল-দক্ষতা, কোডিং এবং দীর্ঘ প্রসঙ্গ বোঝার ক্ষেত্রে গুরুত্বপূর্ণ উন্নতি করা হয়েছে।
বর্তমানে Gemini 2.5-ফ্ল্যাশের নতুন সংস্করণটি Google AI Studio-তে প্রিভিউ হিসাবে এন্টারপ্রাইজরা Vertex AI-প্ল্যাটফর্মে পাবে এবং সাধারণ ব্যবহারকারীরা Gemini অ্যাপ থেকে পাবে। উল্লেখযোগ্যভাবে জুন মাস থেকে এটি বিস্তৃত পরিসর জুড়ে ব্যবহৃত হবে।যেসব ডেভেলপাররা লাইভ API-ব্যবহার করেন তারা Gemini 2.5-সিরিজের AI-মডেলগুলির সাথে ন্যটিভ-অডিও আউটপুটের একটি প্রিভিউ-সংস্করণ এনেছে,যেটি মানুষের মতো কথা বলে।এই ফিচারটি ব্যবহারকারীদের কথার-টোন,শব্দ উচ্চারণ,স্পিচ তৈরির স্টাইল নিয়ন্ত্রণ করতে দেয়।
আগের সংস্করণটি তিনটি ফিচারের সাথে এসেছে যার প্রথমটি হলো Affective Dialogue, যেখানে AI-মডেলটির ব্যবহারকারীর ভয়েস এবং প্রতিক্রিয়া অনুযায়ী কথা বলার আবেগ শনাক্ত করে।দ্বিতীয়টি হলো Proactive Audio, পিছনের কথাবার্তাকে এড়াতে পারে এবং শুধুমাত্র জিজ্ঞাসা করলেই প্রতিক্রিয়া দেয়।তৃতীয়টি হলো Thinking, যেটি Gemini চিন্তাভাবনার ক্ষমতাকে ব্যবহার করে, স্পিচ-জেনারেশনে জটিল প্রশ্নের উত্তর দিতে সাহায্য করে।
এছাড়াও Gemini API-এ এবং Vertex AI-এ থাকা 2.5 প্রো এবং ফ্ল্যাশ-মডেলগুলিতে Thought Summarise দেখানো হবে। যেটি মডেলটির সঠিন চিন্তাভাবনার প্রক্রিয়া, এবং এটি আগে শুধুমাত্র জেমিনির রিজিনিং মডেলগুলিতে দেখা গিয়েছিল।আসন্ন সপ্তাহে ডেভেলপাররা Gemini 2.5 Pro-এর সাথে থিঙ্কিং বাজেট ব্যবহার করতে পারে।এটি তাদের উত্তরের একটি মডেল কয়টি টোকেন গ্রহণ করতে পারবে সেই সম্পর্কে জানাবে এবং সবশেষে খুব শীঘ্রই API এবং Vertex AI-এতে Project Mariner-এর Computer Use Agentic function-টিও যুক্ত করা হবে।
প্রযুক্তির সাম্প্রতিক খবর আর রিভিউস জানতে লাইক করুন আমাদের Facebook পেজ অথবা ফলো করুন Twitter আর সাবস্ক্রাইব করুন YouTube.
বিজ্ঞাপন
বিজ্ঞাপন
Carnegie Mellon’s AI Drones Can Build Mid-Air Structures With 90 Percent Success Rate
Baai Tuzyapayi OTT Release Date: When and Where to Watch Marathi Romantic Drama Online?
Maxton Hall Season 2 OTT Release Date: When and Where to Watch it Online?
Shakti Thirumagan Now Streaming on JioHotstar: Everything You Need to Know About Vijay Antony’s Political Thriller