Sarvam Edge AI runs on phones and laptops without internet
Photo Credit: Unsplash/Steve Johnson
Sarvam Edge: এখন ইন্টারনেট ছাড়া আর্টিফিশিয়াল ইন্টেলিজেন্স ভাবা মুশকিল। চ্যাটজিপিটি (ChatGPT) কিংবা জেমিনাই (Gemini)-এর মতো বহুল ব্যবহৃত AI মডেল ইন্টারনেট ছাড়া অকেজো। ফলে মোবাইল ডেটা এবং ওয়াই-ফাই ছাড়া এই ধরনের ক্লাউড এআই কাজ করে না। আর এখানেই মুশকিল আসান করতে এগিয়ে এল Sarvam AI (সর্বম এআই)। ভারতীয় সংস্থাটি Sarvam Edge (সর্বম এজ) নামে একটি নতুন অন-ডিভাইস কৃত্রিম বুদ্ধিমত্তা প্ল্যাটফর্ম নিয়ে এসেছে। এটি ইন্টারনেট বা ক্লাউড সার্ভার ছাড়াই স্মার্টফোন, PC, এবং ল্যাপটপে চলবে। সম্প্রতি বেঙ্গালুরুর স্টার্টআপটি Sarvam Vision ও Bulbul V3 মডেলের সৌজন্যে সাড়া ফেলেছে।
সংস্থা দাবি করেছে, সর্বম এজ এমন এক ধারণার উপর ভিত্তি করে তৈরি, যেখানে আধুনিক ডিভাইসগুলোর নিজস্ব কম্পিউটিং শক্তি উন্নত এআই মডেল লোকালি চালানোর জন্য যথেষ্ট। অন-ডিভাইস এআই ক্লাউড সার্ভারে ডেটা না পাঠানোর কারণে কাজ খুব দ্রুত হয়। কৃত্রিম বুদ্ধিমত্তার যাবতীয় প্রসেসিং ডিভাইসেই সম্পন্ন হবে।
সর্বম এজ ব্যবহারকারীদের ডেটা দূরের সার্ভারে যায় না৷ ডিভাইসের ভিতর সীমাবদ্ধ থাকার ফলে ক্লাউড এআই মডেলগুলোর তুলনায় তথ্য ফাঁসের ঝুকি নেই। এর ফলে ইউজারদের প্রাইভেসি নিয়ে চিন্তা করতে হবে না। আবার ইন্টারনেটের প্রয়োজন না থাকার কারণে রেপপন্স টাইম বা ল্যাটেন্সি খুব কম।
Sarvam Edge মডেলে রয়েছে টেক্সট টু স্পিচ, মাল্টিলিঙ্গুয়াল স্পিচ রিকগনিশন, ও ট্রান্সলেশন করার ক্ষমতা। এগুলো বিনা ইন্টারনেটে ডিভাইসে কাজ করতে সক্ষম। মডেলটি 110টি জোড়া ভাষার মধ্যে দ্বিমুখী অনুবাদ করতে সক্ষম। স্পিচ রিকগনিশন ব্যবস্থা 10টি প্রধান ভারতীয় ভাষা সমর্থন করে। স্বয়ংক্রিয় ভাষা সনাক্তকরণ প্রযুক্তি থাকায় ব্যবহারকারীকে আলাদা করে ভাষা বেছে নিতে হয় না।
জানিয়ে রাখি, অন-ডিভাইস এআই এর ক্ষমতা সীমিত। কারণ জটিল ক্যালকুলেশন বা বিশাল ডেটাসেট নিয়ে কাজ করার জন্য বড় সার্ভারের কম্পিউটিং পাওয়ারের দরকার হয়। বড় ল্যাঙ্গুয়েজ মডেল চালানোর জন্য প্রচুর মেমোরির প্রয়োজন হয়, যা সাধারণ ডিভাইসে পাওয়া যায় না। এই কারণে জেমিনাই ও চ্যাটজিপিটি ইন্টারনেট ছাড়া সম্পূর্ণরূপে চালানো অসম্ভব।
সর্বম এআই তাদের সর্বম ভিশন ও বুলবুল ভি3 মডেলের সৌজন্যে বিশ্বজুড়ে শোরগোল ফেলেছে। দাবি করা হচ্ছে, অপটিক্যাল ক্যারেক্টর রিকগনশন (OCR) এর বেশ কিছু গুরুত্বপূর্ণ মানদন্ডের নিরিখে জেমিনাই ও চ্যাটজিপিটি-কে ছাপিয়ে গিয়েছে। সর্বম ভিশন ওমনিডকবেঞ্চ বেঞ্চমার্কে 84.3 শতাংশ নির্ভুলতা অর্জন করেছে৷ এটি ডকুমেন্ট ভিত্তিক ওসিআর পারফরম্যান্সে 93.2 শতাংশ নির্ভুল।
বুলবুল ভি3 বলার ক্ষেত্রে বাজিমাত করেছে। সংস্থার টেক্সট-টু-স্পিচ মডেলটি 35টি ভিন্ন ভয়েস সাপোর্ট করে, যার মধ্যে 22টি সরকারি ভাষা রয়েছে। তাদের দাবি, এটি বর্তমানে ভারতীয় ভাষাগুলোর জন্য তৈরি অন্যতম উন্নত টেক্সট-টু-স্পিচ মডেল।
প্রযুক্তির সাম্প্রতিক খবর আর রিভিউস জানতে লাইক করুন আমাদের Facebook পেজ অথবা ফলো করুন Twitter আর সাবস্ক্রাইব করুন YouTube.