Photo Credit: Google
জেমিনি ২.৫ প্রো এবং ফ্ল্যাশ এখন জেমিনি এপিআই এবং ভার্টেক্স এআই-তে চিন্তার সারাংশ অন্তর্ভুক্ত করবে।
বিগত মঙ্গলবার Google I/O 2025-তে তাদের Gemini 2.5 ফ্যামিলির AI সম্পন্ন মডেলগুলোর জন্য DeepThink-নামক একটি নতুন উন্নতমানের রিজনিং-মোড নিয়ে এসেছে,যেগুলি Gemini 2.5 প্রো-মডেলগুলির সাহায্যে চলে।এছাড়াও এটি ন্যাটিভ অডিও আউটপুট নামক একটি নতুন ফিচার এনেছে। এছাড়াও কোম্পানি ডেভেলপারদের জন্য নতুন জেমিনি মডেলগুলিতে thought summarise এবং থিঙ্কিং বাজেটের সুবিধা নিয়ে আসবে।LMArena Leaderboard-এ সবার উপরে র্যাংক করেছে Gemini 2.5 Pro,কোম্পানী আসন্ন মাসে Gemini 2.5 AI-মডেল সিরিজগুলিতে নতুন কার্যক্ষমতা এবং ফিচারগুলো কিভাবে চালনা করবে সেই বিস্তারিতভাবে জানিয়েছে। চলতি মাসের শুরুতে উন্নতমানের কোডিং ক্ষমতার সাথে গুগল Gemini 2.5 Pro-এর একটি আপডেট সংস্করণ রিলিজ করেছে। আপডেট করা মডেলটি WebDev Arena এবং LMArena-র সবচেয়ে উপরের র্যাংক করেছে।
Google তাদের AI-মডেলকে নতুন Deep Think-মোডের মাধ্যমে আরও উন্নত করছে।এই নতুন রিজনিং-মোড Gemini 2.5 Pro-কে উত্তর দেওয়ার আগে সম্ভাব্য ব্যাখ্যা বিবেচনা করার সুযোগ দেয়।অভ্যন্তরীণ পরীক্ষার মাধ্যমে কোম্পানি বিভিন্ন প্যারামিটার অনুযায়ী Gemini 2.5 Pro Deep Think, 2025-এর UAMO তে 49.4% স্কোর করেছে।এছাড়াও এটি LiveCodeBench v6 এবং MMMU-তে ভালো স্কোর করেছে।
Deep-Think বর্তমানে পরীক্ষা করা হচ্ছে। বর্তমানে রিজেনিং মোডটি শুধুমাত্র Gemini API-এর মাধ্যমে বিশ্বস্ত পরীক্ষকদের দেওয়া হবে। তবে এটি রিলিজের তারিখ ঘোষণা করা হয়নি।
কোম্পানির মতে, একমাস আগে প্রকাশিত Gemini 2.5 Flash-মডেলে নতুন কিছু ক্ষমতা যোগকরা হয়েছে। কোম্পানির তরফে বলা হয়েছে যে, এই AI-মডেলটির যুক্তি বিশ্লেষণ,মাল্টিমোডাল-দক্ষতা, কোডিং এবং দীর্ঘ প্রসঙ্গ বোঝার ক্ষেত্রে গুরুত্বপূর্ণ উন্নতি করা হয়েছে।
বর্তমানে Gemini 2.5-ফ্ল্যাশের নতুন সংস্করণটি Google AI Studio-তে প্রিভিউ হিসাবে এন্টারপ্রাইজরা Vertex AI-প্ল্যাটফর্মে পাবে এবং সাধারণ ব্যবহারকারীরা Gemini অ্যাপ থেকে পাবে। উল্লেখযোগ্যভাবে জুন মাস থেকে এটি বিস্তৃত পরিসর জুড়ে ব্যবহৃত হবে।যেসব ডেভেলপাররা লাইভ API-ব্যবহার করেন তারা Gemini 2.5-সিরিজের AI-মডেলগুলির সাথে ন্যটিভ-অডিও আউটপুটের একটি প্রিভিউ-সংস্করণ এনেছে,যেটি মানুষের মতো কথা বলে।এই ফিচারটি ব্যবহারকারীদের কথার-টোন,শব্দ উচ্চারণ,স্পিচ তৈরির স্টাইল নিয়ন্ত্রণ করতে দেয়।
আগের সংস্করণটি তিনটি ফিচারের সাথে এসেছে যার প্রথমটি হলো Affective Dialogue, যেখানে AI-মডেলটির ব্যবহারকারীর ভয়েস এবং প্রতিক্রিয়া অনুযায়ী কথা বলার আবেগ শনাক্ত করে।দ্বিতীয়টি হলো Proactive Audio, পিছনের কথাবার্তাকে এড়াতে পারে এবং শুধুমাত্র জিজ্ঞাসা করলেই প্রতিক্রিয়া দেয়।তৃতীয়টি হলো Thinking, যেটি Gemini চিন্তাভাবনার ক্ষমতাকে ব্যবহার করে, স্পিচ-জেনারেশনে জটিল প্রশ্নের উত্তর দিতে সাহায্য করে।
এছাড়াও Gemini API-এ এবং Vertex AI-এ থাকা 2.5 প্রো এবং ফ্ল্যাশ-মডেলগুলিতে Thought Summarise দেখানো হবে। যেটি মডেলটির সঠিন চিন্তাভাবনার প্রক্রিয়া, এবং এটি আগে শুধুমাত্র জেমিনির রিজিনিং মডেলগুলিতে দেখা গিয়েছিল।আসন্ন সপ্তাহে ডেভেলপাররা Gemini 2.5 Pro-এর সাথে থিঙ্কিং বাজেট ব্যবহার করতে পারে।এটি তাদের উত্তরের একটি মডেল কয়টি টোকেন গ্রহণ করতে পারবে সেই সম্পর্কে জানাবে এবং সবশেষে খুব শীঘ্রই API এবং Vertex AI-এতে Project Mariner-এর Computer Use Agentic function-টিও যুক্ত করা হবে।
প্রযুক্তির সাম্প্রতিক খবর আর রিভিউস জানতে লাইক করুন আমাদের Facebook পেজ অথবা ফলো করুন Twitter আর সাবস্ক্রাইব করুন YouTube.
বিজ্ঞাপন
বিজ্ঞাপন