বিভিন্ন AI-ভিত্তিক ফিচার নিয়ে আসতে চলেছে Google Gemini
Photo Credit: Google
জেমিনি ২.৫ প্রো এবং ফ্ল্যাশ এখন জেমিনি এপিআই এবং ভার্টেক্স এআই-তে চিন্তার সারাংশ অন্তর্ভুক্ত করবে।
বিগত মঙ্গলবার Google I/O 2025-তে তাদের Gemini 2.5 ফ্যামিলির AI সম্পন্ন মডেলগুলোর জন্য DeepThink-নামক একটি নতুন উন্নতমানের রিজনিং-মোড নিয়ে এসেছে,যেগুলি Gemini 2.5 প্রো-মডেলগুলির সাহায্যে চলে।এছাড়াও এটি ন্যাটিভ অডিও আউটপুট নামক একটি নতুন ফিচার এনেছে। এছাড়াও কোম্পানি ডেভেলপারদের জন্য নতুন জেমিনি মডেলগুলিতে thought summarise এবং থিঙ্কিং বাজেটের সুবিধা নিয়ে আসবে।LMArena Leaderboard-এ সবার উপরে র্যাংক করেছে Gemini 2.5 Pro,কোম্পানী আসন্ন মাসে Gemini 2.5 AI-মডেল সিরিজগুলিতে নতুন কার্যক্ষমতা এবং ফিচারগুলো কিভাবে চালনা করবে সেই বিস্তারিতভাবে জানিয়েছে। চলতি মাসের শুরুতে উন্নতমানের কোডিং ক্ষমতার সাথে গুগল Gemini 2.5 Pro-এর একটি আপডেট সংস্করণ রিলিজ করেছে। আপডেট করা মডেলটি WebDev Arena এবং LMArena-র সবচেয়ে উপরের র্যাংক করেছে।
Google তাদের AI-মডেলকে নতুন Deep Think-মোডের মাধ্যমে আরও উন্নত করছে।এই নতুন রিজনিং-মোড Gemini 2.5 Pro-কে উত্তর দেওয়ার আগে সম্ভাব্য ব্যাখ্যা বিবেচনা করার সুযোগ দেয়।অভ্যন্তরীণ পরীক্ষার মাধ্যমে কোম্পানি বিভিন্ন প্যারামিটার অনুযায়ী Gemini 2.5 Pro Deep Think, 2025-এর UAMO তে 49.4% স্কোর করেছে।এছাড়াও এটি LiveCodeBench v6 এবং MMMU-তে ভালো স্কোর করেছে।
Deep-Think বর্তমানে পরীক্ষা করা হচ্ছে। বর্তমানে রিজেনিং মোডটি শুধুমাত্র Gemini API-এর মাধ্যমে বিশ্বস্ত পরীক্ষকদের দেওয়া হবে। তবে এটি রিলিজের তারিখ ঘোষণা করা হয়নি।
কোম্পানির মতে, একমাস আগে প্রকাশিত Gemini 2.5 Flash-মডেলে নতুন কিছু ক্ষমতা যোগকরা হয়েছে। কোম্পানির তরফে বলা হয়েছে যে, এই AI-মডেলটির যুক্তি বিশ্লেষণ,মাল্টিমোডাল-দক্ষতা, কোডিং এবং দীর্ঘ প্রসঙ্গ বোঝার ক্ষেত্রে গুরুত্বপূর্ণ উন্নতি করা হয়েছে।
বর্তমানে Gemini 2.5-ফ্ল্যাশের নতুন সংস্করণটি Google AI Studio-তে প্রিভিউ হিসাবে এন্টারপ্রাইজরা Vertex AI-প্ল্যাটফর্মে পাবে এবং সাধারণ ব্যবহারকারীরা Gemini অ্যাপ থেকে পাবে। উল্লেখযোগ্যভাবে জুন মাস থেকে এটি বিস্তৃত পরিসর জুড়ে ব্যবহৃত হবে।যেসব ডেভেলপাররা লাইভ API-ব্যবহার করেন তারা Gemini 2.5-সিরিজের AI-মডেলগুলির সাথে ন্যটিভ-অডিও আউটপুটের একটি প্রিভিউ-সংস্করণ এনেছে,যেটি মানুষের মতো কথা বলে।এই ফিচারটি ব্যবহারকারীদের কথার-টোন,শব্দ উচ্চারণ,স্পিচ তৈরির স্টাইল নিয়ন্ত্রণ করতে দেয়।
আগের সংস্করণটি তিনটি ফিচারের সাথে এসেছে যার প্রথমটি হলো Affective Dialogue, যেখানে AI-মডেলটির ব্যবহারকারীর ভয়েস এবং প্রতিক্রিয়া অনুযায়ী কথা বলার আবেগ শনাক্ত করে।দ্বিতীয়টি হলো Proactive Audio, পিছনের কথাবার্তাকে এড়াতে পারে এবং শুধুমাত্র জিজ্ঞাসা করলেই প্রতিক্রিয়া দেয়।তৃতীয়টি হলো Thinking, যেটি Gemini চিন্তাভাবনার ক্ষমতাকে ব্যবহার করে, স্পিচ-জেনারেশনে জটিল প্রশ্নের উত্তর দিতে সাহায্য করে।
এছাড়াও Gemini API-এ এবং Vertex AI-এ থাকা 2.5 প্রো এবং ফ্ল্যাশ-মডেলগুলিতে Thought Summarise দেখানো হবে। যেটি মডেলটির সঠিন চিন্তাভাবনার প্রক্রিয়া, এবং এটি আগে শুধুমাত্র জেমিনির রিজিনিং মডেলগুলিতে দেখা গিয়েছিল।আসন্ন সপ্তাহে ডেভেলপাররা Gemini 2.5 Pro-এর সাথে থিঙ্কিং বাজেট ব্যবহার করতে পারে।এটি তাদের উত্তরের একটি মডেল কয়টি টোকেন গ্রহণ করতে পারবে সেই সম্পর্কে জানাবে এবং সবশেষে খুব শীঘ্রই API এবং Vertex AI-এতে Project Mariner-এর Computer Use Agentic function-টিও যুক্ত করা হবে।
প্রযুক্তির সাম্প্রতিক খবর আর রিভিউস জানতে লাইক করুন আমাদের Facebook পেজ অথবা ফলো করুন Twitter আর সাবস্ক্রাইব করুন YouTube.
বিজ্ঞাপন
বিজ্ঞাপন
Neutrino Detectors May Unlock the Search for Light Dark Matter, Physicists Say
Uranus and Neptune May Be Rocky Worlds Not Ice Giants, New Research Shows
Steal OTT Release Date: When and Where to Watch Sophie Turner Starrer Movie Online?
Murder Report (2025): A Dark Korean Crime Thriller Now Streaming on Prime Video