বিভিন্ন AI-ভিত্তিক ফিচার নিয়ে আসতে চলেছে Google Gemini
Photo Credit: Google
জেমিনি ২.৫ প্রো এবং ফ্ল্যাশ এখন জেমিনি এপিআই এবং ভার্টেক্স এআই-তে চিন্তার সারাংশ অন্তর্ভুক্ত করবে।
বিগত মঙ্গলবার Google I/O 2025-তে তাদের Gemini 2.5 ফ্যামিলির AI সম্পন্ন মডেলগুলোর জন্য DeepThink-নামক একটি নতুন উন্নতমানের রিজনিং-মোড নিয়ে এসেছে,যেগুলি Gemini 2.5 প্রো-মডেলগুলির সাহায্যে চলে।এছাড়াও এটি ন্যাটিভ অডিও আউটপুট নামক একটি নতুন ফিচার এনেছে। এছাড়াও কোম্পানি ডেভেলপারদের জন্য নতুন জেমিনি মডেলগুলিতে thought summarise এবং থিঙ্কিং বাজেটের সুবিধা নিয়ে আসবে।LMArena Leaderboard-এ সবার উপরে র্যাংক করেছে Gemini 2.5 Pro,কোম্পানী আসন্ন মাসে Gemini 2.5 AI-মডেল সিরিজগুলিতে নতুন কার্যক্ষমতা এবং ফিচারগুলো কিভাবে চালনা করবে সেই বিস্তারিতভাবে জানিয়েছে। চলতি মাসের শুরুতে উন্নতমানের কোডিং ক্ষমতার সাথে গুগল Gemini 2.5 Pro-এর একটি আপডেট সংস্করণ রিলিজ করেছে। আপডেট করা মডেলটি WebDev Arena এবং LMArena-র সবচেয়ে উপরের র্যাংক করেছে।
Google তাদের AI-মডেলকে নতুন Deep Think-মোডের মাধ্যমে আরও উন্নত করছে।এই নতুন রিজনিং-মোড Gemini 2.5 Pro-কে উত্তর দেওয়ার আগে সম্ভাব্য ব্যাখ্যা বিবেচনা করার সুযোগ দেয়।অভ্যন্তরীণ পরীক্ষার মাধ্যমে কোম্পানি বিভিন্ন প্যারামিটার অনুযায়ী Gemini 2.5 Pro Deep Think, 2025-এর UAMO তে 49.4% স্কোর করেছে।এছাড়াও এটি LiveCodeBench v6 এবং MMMU-তে ভালো স্কোর করেছে।
Deep-Think বর্তমানে পরীক্ষা করা হচ্ছে। বর্তমানে রিজেনিং মোডটি শুধুমাত্র Gemini API-এর মাধ্যমে বিশ্বস্ত পরীক্ষকদের দেওয়া হবে। তবে এটি রিলিজের তারিখ ঘোষণা করা হয়নি।
কোম্পানির মতে, একমাস আগে প্রকাশিত Gemini 2.5 Flash-মডেলে নতুন কিছু ক্ষমতা যোগকরা হয়েছে। কোম্পানির তরফে বলা হয়েছে যে, এই AI-মডেলটির যুক্তি বিশ্লেষণ,মাল্টিমোডাল-দক্ষতা, কোডিং এবং দীর্ঘ প্রসঙ্গ বোঝার ক্ষেত্রে গুরুত্বপূর্ণ উন্নতি করা হয়েছে।
বর্তমানে Gemini 2.5-ফ্ল্যাশের নতুন সংস্করণটি Google AI Studio-তে প্রিভিউ হিসাবে এন্টারপ্রাইজরা Vertex AI-প্ল্যাটফর্মে পাবে এবং সাধারণ ব্যবহারকারীরা Gemini অ্যাপ থেকে পাবে। উল্লেখযোগ্যভাবে জুন মাস থেকে এটি বিস্তৃত পরিসর জুড়ে ব্যবহৃত হবে।যেসব ডেভেলপাররা লাইভ API-ব্যবহার করেন তারা Gemini 2.5-সিরিজের AI-মডেলগুলির সাথে ন্যটিভ-অডিও আউটপুটের একটি প্রিভিউ-সংস্করণ এনেছে,যেটি মানুষের মতো কথা বলে।এই ফিচারটি ব্যবহারকারীদের কথার-টোন,শব্দ উচ্চারণ,স্পিচ তৈরির স্টাইল নিয়ন্ত্রণ করতে দেয়।
আগের সংস্করণটি তিনটি ফিচারের সাথে এসেছে যার প্রথমটি হলো Affective Dialogue, যেখানে AI-মডেলটির ব্যবহারকারীর ভয়েস এবং প্রতিক্রিয়া অনুযায়ী কথা বলার আবেগ শনাক্ত করে।দ্বিতীয়টি হলো Proactive Audio, পিছনের কথাবার্তাকে এড়াতে পারে এবং শুধুমাত্র জিজ্ঞাসা করলেই প্রতিক্রিয়া দেয়।তৃতীয়টি হলো Thinking, যেটি Gemini চিন্তাভাবনার ক্ষমতাকে ব্যবহার করে, স্পিচ-জেনারেশনে জটিল প্রশ্নের উত্তর দিতে সাহায্য করে।
এছাড়াও Gemini API-এ এবং Vertex AI-এ থাকা 2.5 প্রো এবং ফ্ল্যাশ-মডেলগুলিতে Thought Summarise দেখানো হবে। যেটি মডেলটির সঠিন চিন্তাভাবনার প্রক্রিয়া, এবং এটি আগে শুধুমাত্র জেমিনির রিজিনিং মডেলগুলিতে দেখা গিয়েছিল।আসন্ন সপ্তাহে ডেভেলপাররা Gemini 2.5 Pro-এর সাথে থিঙ্কিং বাজেট ব্যবহার করতে পারে।এটি তাদের উত্তরের একটি মডেল কয়টি টোকেন গ্রহণ করতে পারবে সেই সম্পর্কে জানাবে এবং সবশেষে খুব শীঘ্রই API এবং Vertex AI-এতে Project Mariner-এর Computer Use Agentic function-টিও যুক্ত করা হবে।
প্রযুক্তির সাম্প্রতিক খবর আর রিভিউস জানতে লাইক করুন আমাদের Facebook পেজ অথবা ফলো করুন Twitter আর সাবস্ক্রাইব করুন YouTube.
বিজ্ঞাপন
বিজ্ঞাপন
Xiaomi 17T Leak Hints at 6,500mAh Battery, OmniVision OV50E Camera Sensor
Apple CEO Tim Cook Highlights Adoption of Apple Intelligence, Reveals Most Popular AI-Powered Feature
Vivo V70, V70 Elite Confirmed to Launch in India With Snapdragon Chipsets