সর্বম ভিশন ওমনিডকবেঞ্চ বেঞ্চমার্কে 84.3 শতাংশ নির্ভুলতা অর্জন করেছে, যা জেমিনাই ও ডিপসিকের থেকেও বেশি।
Photo Credit: Unsplash/Igor Omilaev
Sarvam AI's Bulbul V3 supports 35 plus voices across 11 Indian languages.
ভারতীয় AI সংস্থাদের কি Google, Anthropic, এবং OpenAI-এর মতো গ্লোবাল জায়েন্টদের টেক্কা দেওয়ার মতো ক্ষমতা আছে? লেখালেখি থেকে প্রোগ্রামিং এবং কৃত্রিম বুদ্ধিমত্তার সাহায্যে ছবি, অডিও, বা ভিডিও বানানোর মডেল — প্রতিটি ক্ষেত্রে বিশ্বকে নেতৃত্ব দিচ্ছে আমেরিকা ও চীন। অগ্রণী ভূমিকা নিচ্ছে Gemini, ChatGPT, ও Claude। তবে পিছিয়ে নেও ভারতও। বেঙ্গালুরুর সংস্থা Sarvam AI তাদের Sarvam Vision এবং Bulbul V3 মডেলের সৌজন্যে বিশ্বজুড়ে সাড়া ফেলে দিয়েছে। স্টার্টআপটির দাবি, তাদের নয়া AI মডেল অপটিক্যাল ক্যারেক্টর রিকগনশন (OCR) এর কিছু গুরুত্বপূর্ণ মানদন্ডের দিক থেকে Gemini এবং ChatGPT-কেও ছাপিয়ে গিয়েছে।
সর্বম এআই সংস্থার সহ প্রতিষ্ঠাতা প্রত্যুষ কুমার X (আগের নাম টুইটার) প্ল্যাটফর্মে তাদের নিজস্ব AI মডেলের সাফল্যের কথা তুলে ধরেছেন। সর্বম ভিশন ওমনিডকবেঞ্চ বেঞ্চমার্কে 84.3 শতাংশ নির্ভুলতা অর্জন করেছে, যা জেমিনাই এবং চীনের ডিপসিকের মতো জনপ্রিয় এআই মডেলের থেকেও বেশি। এছাড়াও, এটি ডকুমেন্ট ভিত্তিক ওসিআর পারফরম্যান্সেও 93.2 শতাংশ নির্ভুল।
প্রত্যুষ জানান, মডেলটি ভারতীয় ভাষা বোঝা ও পড়ার ক্ষেত্রে সমস্ত AI মডেলের চেয়ে এগিয়ে আছে। শুধু ছবি থেকে লেখা পড়াই নয়, সেই তথ্যের গঠন এবং অর্থও বুঝতে সক্ষম সর্বম ভিশন। কোম্পানি একে একটি তিন বিলিয়নযুক্ত প্যারামিটার যুক্ত ভিশন-ল্যাঙ্গুয়েজ মডেল হিসেবে তুলে ধরছে। এটি ইমেজ ক্যাপশন লেখা, চার্ট ও গ্রাফ বোঝা, এবং জটিল অঙ্ক সমাধানের ক্ষেত্রেও দক্ষতার পরিচয় দিয়েছে।
সর্বম এআই এর টেক্সট-টু-স্পিচ মডেল বুলবুল ভি3 বলার ক্ষেত্রেও বাজিমাত করেছে। এটি 35টি ভিন্ন ভয়েস সাপোর্ট করে, যার মধ্যে 22টি সরকারি ভাষা রয়েছে। প্রত্যুষের দাবি, এটি বর্তমানে ভারতীয় ভাষার জন্য তৈরি সবচেয়ে উন্নত ও শক্তিশালী টেক্সট-টু-স্পিচ মডেলগুলির মধ্যে একটি। সংস্থার তরফে আরও জানানো হয়েছে, শুধু আধুনিক উচ্চারণই নয়, এতে 1800-এর দশক থেকে বর্তমান সময় পর্যন্ত বিভিন্ন ভাষার টোন ও স্টাইলিং অর্ন্তভুক্ত।
বিশেষজ্ঞদের মতে, Bulbul V3 ভবিষ্যতে অডিওবুক, ভয়েস অ্যাসিস্ট্যান্ট, শিক্ষা প্ল্যাটফর্ম, এবং সরকারি ডিজিটাল পরিষেবার মতো ক্ষেত্রে বড় ভূমিকা নিতে পারে। সর্বম এর ওয়েবসাইট অনুযায়ী, সংস্থার প্রধান লক্ষ্য হল ভারতে কৃত্রিম বুদ্ধিমত্তাকে আরও সহজলভ্য করে তোলা। তারা এমন ফাউন্ডেশনাল AI কম্পোনেন্ট তৈরি করতে চায়, যা দেশের প্রেক্ষাপট ও ভারতীয়দের চাহিদার কথা মাথায় রাখবে।
স্টার্টআপটির বিশ্বাস, আর্টিফিশিয়াল ইন্টেলিজেন্স ভবিষ্যতে প্রযুক্তিগত রূপান্তরের প্রধান চালিকাশক্তি হয়ে উঠবে। তাই ভারতের উচিত এই প্রযুক্তিকে বিশ্বাস এবং নিয়ন্ত্রণের সাথে গ্রহণ করা।
প্রযুক্তির সাম্প্রতিক খবর আর রিভিউস জানতে লাইক করুন আমাদের Facebook পেজ অথবা ফলো করুন Twitter আর সাবস্ক্রাইব করুন YouTube.
বিজ্ঞাপন
বিজ্ঞাপন
Itel A100 4G Launched in India With 90Hz IPS Display, 5,000mAh Battery: Price, Specifications