বিভিন্ন AI-ভিত্তিক ফিচার নিয়ে আসতে চলেছে Google Gemini
Photo Credit: Google
জেমিনি ২.৫ প্রো এবং ফ্ল্যাশ এখন জেমিনি এপিআই এবং ভার্টেক্স এআই-তে চিন্তার সারাংশ অন্তর্ভুক্ত করবে।
বিগত মঙ্গলবার Google I/O 2025-তে তাদের Gemini 2.5 ফ্যামিলির AI সম্পন্ন মডেলগুলোর জন্য DeepThink-নামক একটি নতুন উন্নতমানের রিজনিং-মোড নিয়ে এসেছে,যেগুলি Gemini 2.5 প্রো-মডেলগুলির সাহায্যে চলে।এছাড়াও এটি ন্যাটিভ অডিও আউটপুট নামক একটি নতুন ফিচার এনেছে। এছাড়াও কোম্পানি ডেভেলপারদের জন্য নতুন জেমিনি মডেলগুলিতে thought summarise এবং থিঙ্কিং বাজেটের সুবিধা নিয়ে আসবে।LMArena Leaderboard-এ সবার উপরে র্যাংক করেছে Gemini 2.5 Pro,কোম্পানী আসন্ন মাসে Gemini 2.5 AI-মডেল সিরিজগুলিতে নতুন কার্যক্ষমতা এবং ফিচারগুলো কিভাবে চালনা করবে সেই বিস্তারিতভাবে জানিয়েছে। চলতি মাসের শুরুতে উন্নতমানের কোডিং ক্ষমতার সাথে গুগল Gemini 2.5 Pro-এর একটি আপডেট সংস্করণ রিলিজ করেছে। আপডেট করা মডেলটি WebDev Arena এবং LMArena-র সবচেয়ে উপরের র্যাংক করেছে।
Google তাদের AI-মডেলকে নতুন Deep Think-মোডের মাধ্যমে আরও উন্নত করছে।এই নতুন রিজনিং-মোড Gemini 2.5 Pro-কে উত্তর দেওয়ার আগে সম্ভাব্য ব্যাখ্যা বিবেচনা করার সুযোগ দেয়।অভ্যন্তরীণ পরীক্ষার মাধ্যমে কোম্পানি বিভিন্ন প্যারামিটার অনুযায়ী Gemini 2.5 Pro Deep Think, 2025-এর UAMO তে 49.4% স্কোর করেছে।এছাড়াও এটি LiveCodeBench v6 এবং MMMU-তে ভালো স্কোর করেছে।
Deep-Think বর্তমানে পরীক্ষা করা হচ্ছে। বর্তমানে রিজেনিং মোডটি শুধুমাত্র Gemini API-এর মাধ্যমে বিশ্বস্ত পরীক্ষকদের দেওয়া হবে। তবে এটি রিলিজের তারিখ ঘোষণা করা হয়নি।
কোম্পানির মতে, একমাস আগে প্রকাশিত Gemini 2.5 Flash-মডেলে নতুন কিছু ক্ষমতা যোগকরা হয়েছে। কোম্পানির তরফে বলা হয়েছে যে, এই AI-মডেলটির যুক্তি বিশ্লেষণ,মাল্টিমোডাল-দক্ষতা, কোডিং এবং দীর্ঘ প্রসঙ্গ বোঝার ক্ষেত্রে গুরুত্বপূর্ণ উন্নতি করা হয়েছে।
বর্তমানে Gemini 2.5-ফ্ল্যাশের নতুন সংস্করণটি Google AI Studio-তে প্রিভিউ হিসাবে এন্টারপ্রাইজরা Vertex AI-প্ল্যাটফর্মে পাবে এবং সাধারণ ব্যবহারকারীরা Gemini অ্যাপ থেকে পাবে। উল্লেখযোগ্যভাবে জুন মাস থেকে এটি বিস্তৃত পরিসর জুড়ে ব্যবহৃত হবে।যেসব ডেভেলপাররা লাইভ API-ব্যবহার করেন তারা Gemini 2.5-সিরিজের AI-মডেলগুলির সাথে ন্যটিভ-অডিও আউটপুটের একটি প্রিভিউ-সংস্করণ এনেছে,যেটি মানুষের মতো কথা বলে।এই ফিচারটি ব্যবহারকারীদের কথার-টোন,শব্দ উচ্চারণ,স্পিচ তৈরির স্টাইল নিয়ন্ত্রণ করতে দেয়।
আগের সংস্করণটি তিনটি ফিচারের সাথে এসেছে যার প্রথমটি হলো Affective Dialogue, যেখানে AI-মডেলটির ব্যবহারকারীর ভয়েস এবং প্রতিক্রিয়া অনুযায়ী কথা বলার আবেগ শনাক্ত করে।দ্বিতীয়টি হলো Proactive Audio, পিছনের কথাবার্তাকে এড়াতে পারে এবং শুধুমাত্র জিজ্ঞাসা করলেই প্রতিক্রিয়া দেয়।তৃতীয়টি হলো Thinking, যেটি Gemini চিন্তাভাবনার ক্ষমতাকে ব্যবহার করে, স্পিচ-জেনারেশনে জটিল প্রশ্নের উত্তর দিতে সাহায্য করে।
এছাড়াও Gemini API-এ এবং Vertex AI-এ থাকা 2.5 প্রো এবং ফ্ল্যাশ-মডেলগুলিতে Thought Summarise দেখানো হবে। যেটি মডেলটির সঠিন চিন্তাভাবনার প্রক্রিয়া, এবং এটি আগে শুধুমাত্র জেমিনির রিজিনিং মডেলগুলিতে দেখা গিয়েছিল।আসন্ন সপ্তাহে ডেভেলপাররা Gemini 2.5 Pro-এর সাথে থিঙ্কিং বাজেট ব্যবহার করতে পারে।এটি তাদের উত্তরের একটি মডেল কয়টি টোকেন গ্রহণ করতে পারবে সেই সম্পর্কে জানাবে এবং সবশেষে খুব শীঘ্রই API এবং Vertex AI-এতে Project Mariner-এর Computer Use Agentic function-টিও যুক্ত করা হবে।
প্রযুক্তির সাম্প্রতিক খবর আর রিভিউস জানতে লাইক করুন আমাদের Facebook পেজ অথবা ফলো করুন Twitter আর সাবস্ক্রাইব করুন YouTube.
বিজ্ঞাপন
বিজ্ঞাপন
Control Ultimate Edition Arrives on iPhone and iPad With Touch Controls, Universal Purchase
Qualcomm CEO Reportedly Visits Samsung Foundry in Korea to Discuss Producing 2nm Chips