Sarvam AI's Bulbul V3 supports 35 plus voices across 11 Indian languages.
Photo Credit: Unsplash/Igor Omilaev
ভারতীয় AI সংস্থাদের কি Google, Anthropic, এবং OpenAI-এর মতো গ্লোবাল জায়েন্টদের টেক্কা দেওয়ার মতো ক্ষমতা আছে? লেখালেখি থেকে প্রোগ্রামিং এবং কৃত্রিম বুদ্ধিমত্তার সাহায্যে ছবি, অডিও, বা ভিডিও বানানোর মডেল — প্রতিটি ক্ষেত্রে বিশ্বকে নেতৃত্ব দিচ্ছে আমেরিকা ও চীন। অগ্রণী ভূমিকা নিচ্ছে Gemini, ChatGPT, ও Claude। তবে পিছিয়ে নেও ভারতও। বেঙ্গালুরুর সংস্থা Sarvam AI তাদের Sarvam Vision এবং Bulbul V3 মডেলের সৌজন্যে বিশ্বজুড়ে সাড়া ফেলে দিয়েছে। স্টার্টআপটির দাবি, তাদের নয়া AI মডেল অপটিক্যাল ক্যারেক্টর রিকগনশন (OCR) এর কিছু গুরুত্বপূর্ণ মানদন্ডের দিক থেকে Gemini এবং ChatGPT-কেও ছাপিয়ে গিয়েছে।
সর্বম এআই সংস্থার সহ প্রতিষ্ঠাতা প্রত্যুষ কুমার X (আগের নাম টুইটার) প্ল্যাটফর্মে তাদের নিজস্ব AI মডেলের সাফল্যের কথা তুলে ধরেছেন। সর্বম ভিশন ওমনিডকবেঞ্চ বেঞ্চমার্কে 84.3 শতাংশ নির্ভুলতা অর্জন করেছে, যা জেমিনাই এবং চীনের ডিপসিকের মতো জনপ্রিয় এআই মডেলের থেকেও বেশি। এছাড়াও, এটি ডকুমেন্ট ভিত্তিক ওসিআর পারফরম্যান্সেও 93.2 শতাংশ নির্ভুল।
প্রত্যুষ জানান, মডেলটি ভারতীয় ভাষা বোঝা ও পড়ার ক্ষেত্রে সমস্ত AI মডেলের চেয়ে এগিয়ে আছে। শুধু ছবি থেকে লেখা পড়াই নয়, সেই তথ্যের গঠন এবং অর্থও বুঝতে সক্ষম সর্বম ভিশন। কোম্পানি একে একটি তিন বিলিয়নযুক্ত প্যারামিটার যুক্ত ভিশন-ল্যাঙ্গুয়েজ মডেল হিসেবে তুলে ধরছে। এটি ইমেজ ক্যাপশন লেখা, চার্ট ও গ্রাফ বোঝা, এবং জটিল অঙ্ক সমাধানের ক্ষেত্রেও দক্ষতার পরিচয় দিয়েছে।
সর্বম এআই এর টেক্সট-টু-স্পিচ মডেল বুলবুল ভি3 বলার ক্ষেত্রেও বাজিমাত করেছে। এটি 35টি ভিন্ন ভয়েস সাপোর্ট করে, যার মধ্যে 22টি সরকারি ভাষা রয়েছে। প্রত্যুষের দাবি, এটি বর্তমানে ভারতীয় ভাষার জন্য তৈরি সবচেয়ে উন্নত ও শক্তিশালী টেক্সট-টু-স্পিচ মডেলগুলির মধ্যে একটি। সংস্থার তরফে আরও জানানো হয়েছে, শুধু আধুনিক উচ্চারণই নয়, এতে 1800-এর দশক থেকে বর্তমান সময় পর্যন্ত বিভিন্ন ভাষার টোন ও স্টাইলিং অর্ন্তভুক্ত।
বিশেষজ্ঞদের মতে, Bulbul V3 ভবিষ্যতে অডিওবুক, ভয়েস অ্যাসিস্ট্যান্ট, শিক্ষা প্ল্যাটফর্ম, এবং সরকারি ডিজিটাল পরিষেবার মতো ক্ষেত্রে বড় ভূমিকা নিতে পারে। সর্বম এর ওয়েবসাইট অনুযায়ী, সংস্থার প্রধান লক্ষ্য হল ভারতে কৃত্রিম বুদ্ধিমত্তাকে আরও সহজলভ্য করে তোলা। তারা এমন ফাউন্ডেশনাল AI কম্পোনেন্ট তৈরি করতে চায়, যা দেশের প্রেক্ষাপট ও ভারতীয়দের চাহিদার কথা মাথায় রাখবে।
স্টার্টআপটির বিশ্বাস, আর্টিফিশিয়াল ইন্টেলিজেন্স ভবিষ্যতে প্রযুক্তিগত রূপান্তরের প্রধান চালিকাশক্তি হয়ে উঠবে। তাই ভারতের উচিত এই প্রযুক্তিকে বিশ্বাস এবং নিয়ন্ত্রণের সাথে গ্রহণ করা।
প্রযুক্তির সাম্প্রতিক খবর আর রিভিউস জানতে লাইক করুন আমাদের Facebook পেজ অথবা ফলো করুন Twitter আর সাবস্ক্রাইব করুন YouTube.