বাংলাদেশে উপজাতির সংখ্যা ত্রিশের অধিক। তাদের বাস প্রধানত রাজশাহী, চট্টগ্রাম, পার্বত্য চট্টগ্রাম, বৃহত্তর ময়মনসিংহ, সিলেট, পটুয়াখালী ও বরগুনা অঞ্চলে। কিছু ব্যতিক্রম ছাড়া ২০-৩০ লক্ষ উপজাতীয় লোক স্ব-স্ব ভাষায় কথা বলে। উপজাতীয় ভাষাগুলির মধ্যে ওরাওঁ, খাসিয়া, গারো, চাকমা, মগ, মণিপুরী, মুন্ডা ও সাঁওতাল উল্লেখযোগ্য। এ ছাড়া রয়েছে কাছাড়ি, কুকি, টিপরা, মালপাহাড়ি, মিকির, শাদ্রি, হাজং ইত্যাদি।
বাংলাদেশের উত্তরাঞ্চল ও সিলেটের চা-বাগান এলাকায় প্রায় লক্ষাধিক লোকের মাতৃভাষা ওরাওঁ। ওরাওঁভাষীদের সর্বোচ্চ সংখ্যা রংপুরে এবং সর্বনিম্ন সিলেটে। খাসিয়ারা ওয়ার নামক ভাষায় কথা বলে। সিলেট বিভাগের বিভিন্ন জেলার পার্বত্য ও অরণ্য অঞ্চলে তাদের বসবাস। এসব অঞ্চলে স্বল্পসংখ্যক সিন্টেং ও লালং উপজাতিও বাস করে এবং তারা স্ব-স্ব ভাষায় কথা বলে।
‘আচিক কতা’ অর্থাৎ পার্বত্য গারোভাষা বৃহত্তর ময়মনসিংহ এবং ভারতের মেঘালয় সীমান্তে পার্বত্য গারো অঞ্চলে প্রচলিত। রংপুর, সুনামগঞ্জ এবং ঢাকা জেলার শ্রীপুরেও কিছুসংখ্যক গারোভাষী লোক আছে। পার্বত্য চট্টগ্রামে তিন লক্ষাধিক লোক চাকমা ভাষায় কথা বলে। মগভাষার আদি স্থান আরাকান। বাংলাদেশে দু লক্ষাধিক লোক মগভাষা বলে। প্রায় ২৫০ বছর পূর্বে সিলেটের শ্রীমঙ্গলে মণিপুরী ভাষার প্রচলন হয়। ঢাকার তেজগাঁও, দুর্গাপুর এবং কুমিল্লার কসবা অঞ্চলেও এক সময় এ ভাষার প্রচলন ছিল। বর্তমানে সিলেট বিভাগের হবিগঞ্জ, মৌলভীবাজার, সিলেট ও সুনামগঞ্জ জেলার প্রায় অর্ধলক্ষ মানুষ মণিপুরী ভাষায় কথা বলে।
বাংলাদেশে মুন্ডাভাষীর সংখ্যা ১৫-২০ হাজার। দেশের উত্তরাঞ্চলে সাঁওতালভাষীর সংখ্যা সর্বোচ্চ। উত্তর ময়মনসিংহ এবং টাঙ্গাইলে অর্ধলক্ষাধিক হাজং এবং কিছুসংখ্যক কাছাড়িও স্বকীয় ভাষায় কথা বলে। চট্টগ্রাম এবং পার্বত্য চট্টগ্রামে কুকি, টিপরা ও মগভাষীরা সর্বপ্রাচীন। পার্বত্য চট্টগ্রামে প্রায় দুহাজার মুরং ও রিয়াং উপজাতীয় টিপরা ভাষায় কথা বলে। কুমিল্লার লালমাই পাহাড়েও একসময় প্রচুর টিপরাভাষী বাস করত। বাংলাদেশে প্রায় নয় হাজার লোকের মাতৃভাষা মালপাহাড়ি। সিলেটের কিছুসংখ্যক লোকের ভাষা মিকির। মালো, মাহাতো, গঞ্জু, কোলকামার এবং কিছু ওরাওঁ উপজাতীয় মিলে প্রায় অর্ধলক্ষাধিক লোকের ভাষা শাদ্রি।
বাংলাদেশে বেশ কিছু উপজাতি এখন নিজস্ব ভাষা বিস্মৃত হয়ে বাংলা ভাষায় কথা বলে। যেমন, পার্বত্য চট্টগ্রাম ও চট্টগ্রামের টিপরাদের অনেকের ভাষা বাংলা। এ ছাড়া অন্যান্য অঞ্চলের হাড়ি, পাতোর, কোচ, রাজবংশী এবং বেদেরাও বাংলা বলে। সব মিলে প্রায় তিন লক্ষাধিক উপজাতীয় স্বচ্ছন্দে বাংলায় কথা বলে। বাগ্দি, বিন্দি ইত্যাদি অন্ত্যজ শ্রেণির লোকেরা স্ব-স্ব ভাষা ব্যবহার করলেও সেসব প্রায় বাংলার কাছাকাছি।
উপজাতীয় ভাষাগুলির আদর্শ রূপের অভাব, শিক্ষার্থীর স্বল্পতা ইত্যাদি কারণে বাংলাদেশে কোনো উপজাতীয় ভাষাই শিক্ষাপ্রতিষ্ঠানের পাঠ্যসূচির অন্তর্ভুক্ত হয়নি। দু-একটি ছাড়া সব উপজাতীয় ভাষাই অলিখিত, অর্থাৎ সেসবের কোনো লিখিত রূপ নেই। চাকমা ও মগ ভাষা ছাড়া অন্য কোনো ভাষার নিজস্ব বর্ণমালাও নেই। শিক্ষিত উপজাতীয়রা নিজেদের মধ্যে স্ব-স্ব ভাষায় বঙ্গাক্ষরে পত্রালাপ করে।
উপজাতীয় ভাষাগুলি লোকসাহিত্যে সমৃদ্ধ, ছড়া-রূপকথা-উপকথায় ভরপুর এবং যাযাবর জীবনের ইতিহাস আশ্রিত তাদের অতীত। উপজাতীয় গান খুবই বৈচিত্র্যময়। মৈমনসিংহ-গীতিকার ন্যায় পালাগান মগ, চাকমা, খাসিয়া, গারো ইত্যাদি ভাষায় প্রচুর পাওয়া যায়। উপজাতীয় ও বাংলা উপকথায় যথেষ্ট মিল আছে। কোনো কোনো গারো উপকথা ও মৈমনসিংহ-গীতিকার পালা প্রায় একই রকম। হিমালয়ের পাদদেশের দু-একটি পাহাড়িয়া ভাষার পালাগান বাংলা লোকসাহিত্যে প্রচলিত, যার ভাষা প্রথম যুগের বাংলা বলে অনুমিত হয়। বাংলা ও উপজাতীয় ছড়া বিষয়, ছন্দ ও শব্দসম্ভারে অনুরূপ। ওরাওঁ ও বাংলা ধাঁধা আকৃতি-প্রকৃতি ও শব্দে-ছন্দে খুবই নিকটবর্তী। ওরাওঁ ও বাংলা ঘুমপাড়ানি গানেও অদ্ভুত মিল রয়েছে।
অনেক উপজাতি আছে বহুভাষী। গারো ও খাসিয়ারা দ্বিভাষী। বাংলা ও নিজেদের ভাষায় তারা যুগপৎ কথা বলতে পারে। তবে যে উপজাতীয়রা পরস্পরের ভাষা বোঝে না তাদের ক্ষেত্রে বাংলা ভাষা লিঙ্গুয়া ফ্রাংকা হিসেবে কাজ করে। মুন্ডা, সাঁওতাল, খাসিয়া, গারো, ওরাওঁ ও মণিপুরী ভাষা সুবিন্যস্ত ও সুশৃঙ্খল, উন্নত অতীতের নিদর্শনবাহী। গারো ও চাকমা ভাষায় চীনা ভাষার ন্যায় টান (tone) আছে, যদিও তা প্রকট নয়। গারো ও মগ ভাষার মধ্যে মৌলিক মিল রয়েছে, কারণ উভয় উপজাতি একই স্থান থেকে আগত। মুন্ডা, সাঁওতাল, কোল, খাসিয়া, গারো, কুরুখ ইত্যাদিও পরস্পর সম্বন্ধযুক্ত ভাষা। মুন্ডা ও ওরাওঁ ভাষাকে সমসাময়িক এমনকি একই ভাষা মনে করা হয়, কারণ উভয় ভাষায় পদক্রম ও ক্রিয়াপদ প্রায় এক। মুন্ডা, সাঁওতাল ও কোল ভাষা প্রাচীন ভারতীয় আর্যভাষা থেকেও প্রাচীনতর। বাংলায় যে-সব শব্দ তদ্ভব নামে পরিচিত তার সবগুলিই তদ্ভব নয়; বেশ কয়েকটি মুন্ডা উপজাতীয় ভাষা থেকে আগত। বাংলা ভাষার ওপর মুন্ডা ভাষার প্রভাব অনেকখানি। উপজাতীয় ভাষাসমূহ অস্ট্রো-এশীয়, ইন্দো-চীন, চীনা-তিববতি, তিববতি-বর্মন ও দ্রাবিড়ীয় ভাষা পরিবারের কোনো-না-কোনোটির অন্তর্ভুক্ত। এসব ভাষার সংমিশ্রণে প্রাচীন বঙ্গ-মগধে একটা Pidgin ভাষার সৃষ্টি হয়েছিল, যার মূল ছিল মুন্ডা ভাষা। এটাই বাংলা তথা পূর্বভারতীয় ভাষাসমূহের প্রাথমিক ভিত রচনা করে। বাংলা ভাষার গঠনের যুগে উপজাতীয় ভাষাসমূহের অবদান অপরিসীম। নিম্নে কয়েকটি প্রধান উপজাতীয় ভাষার সংক্ষিপ্ত বর্ণনা দেওয়া হলো।
ওরাওঁ ভাষা কুরুখ নামে পরিচিত। এ ভাষার কোনো লিখিত রূপ নেই, তবে তা লোকসাহিত্যসমৃদ্ধ। এতে অসংখ্য উপকথা, রূপকথা, গীত, ছড়া, ধাঁধা, প্রবাদ ইত্যাদি রয়েছে। শিক্ষিত ওরাওঁরা বাংলা অথবা ইংরেজি অক্ষরে তাদের ভাষা লিখে থাকে। এ ভাষায় বিভিন্ন ঋতু ও পার্বণভিত্তিক গান আছে।
লোকসাহিত্য ওরাওঁদের ইতিহাস, ঐতিহ্য ও হাসিকান্নার বাহক। প্রেম, প্রকৃতি, জীবিকা, আচার-অনুষ্ঠান, জন্মমৃত্যু ইত্যাদি বিষয় নিয়ে রচিত ওরাওঁ লোকসঙ্গীত যথেষ্ট কাব্যময় এবং একটি শক্তিশালী ভাষার পরিচায়ক। এ ভাষায় অগণিত ছেলেভুলানো ছড়া ও ঘুমপাড়ানি গান রয়েছে। কোনো কোনো ধাঁধা ওরাওঁ ও বাংলা ভাষায় একই রকম। কিছু কিছু ওরাওঁ উপকথা বাংলা ও অন্যান্য উপজাতীয় উপকথার সঙ্গে সাদৃশ্যপূর্ণ; এমনকি, চীনা উপকথার সঙ্গেও সেগুলির মিল দেখা যায়।
সমকালীন মুন্ডা ভাষার সঙ্গে ক্রিয়াপদ ও পদক্রমে ওরাওঁ ভাষার মিল রয়েছে। মুহম্মদ শহীদুল্লাহ্র মতে, মুন্ডা ও ওরাওঁ ভাষা একই। গৃহস্থালী সম্বন্ধীয় কিছু শব্দে ওরাওঁ ও আঞ্চলিক বাংলা ভাষায় মিল রয়েছে। মাটির হাঁড়িপাতিলকে ওরাওঁরা বলে তাওয়া। আঞ্চলিক বাংলায় শব্দটি বহুল প্রচলিত, যদিও এর অর্থসংকোচন ঘটেছে। ওরাওঁ ও বাংলা ভাষায় কিছু গহনার নাম এক, যথা: টিকলি, বালা, পায়রা, বালি, কানপাশা ইত্যাদি। সম্বন্ধসূচক অনেক ওরাওঁ এবং বাংলা শব্দও এক, যথা: মা, বাবা, মামা, ভাগিনা ইত্যাদি। কিছূ গাছগাছড়া ও ফলের নাম দু ভাষায় ব্যুৎপত্তিগত দিক থেকে এক, যথা: আম্বা আম, কাঠা কাঁঠাল, সিম শিমুল, সাক শাক, দালি ডাল ইত্যাদি। এ ছাড়া আরও কিছু শব্দের মধ্যে মিল দেখা যায়, যথা: ওরাওঁ ভাগোয়ান, বাংলা ভগবান, ওরাওঁ ভগতি, বাংলা ভকতি/ভক্তি, ওরাওঁ ভূত, বাংলা ভূত ইত্যাদি। ধ্বনিলোপ ওরাওঁ ভাষার একটি লক্ষণীয় বৈশিষ্ট্য।
খাসিয়া ভাষা অস্ট্রো-এশিয়াটিক ভাষাগোষ্ঠীর অন্তর্ভুক্ত। এ ভাষায় স-এর হ উচ্চারণপ্রবণতা আছে, যা বাংলা উপভাষায় পরিলক্ষিত হয়। এটি অক্ষরহীন ও অলিখিত ভাষা। এ ভাষায় গ্রামকে ‘পুঞ্জি’ বলে। খাসিয়াদের কুঁড়েঘরগুলি পুঞ্জীভূত বলে সম্ভবত এরূপ নাম হয়েছে। এর অনেকগুলি উপভাষার মধ্যে প্রধান পাঁড়, লিংগাম ও ওয়ার। পাঁড় মানে পার্বত্য; খাসিয়া-জৈন্তিয়া পাহাড়ের পূর্বাংশের বিস্তীর্ণ অঞ্চলে প্রচলিত ভাষাই পাঁড়। লিংগাম শব্দে গারো পাহাড়কে বোঝায়, তাই গারো পাহাড়ের সন্নিকটস্থ অঞ্চলের ভাষাই লিংগাম নামে পরিচিত। ওয়ার মানে উপত্যকা।
এক সময় খাসিয়া ভাষা বাংলা হরফে লিখিত হতো। বাংলা অক্ষরে বাইবেল-এর কিয়দংশ খাসিয়া ভাষায় প্রথম অনূদিত হয়েছিল। বর্তমানে ভারতের মেঘালয়ের খ্রিস্টান মিশনারিদের প্রচেষ্টায় রোমান অক্ষরে চেরাপুঞ্জি ও তদঞ্চলের খাসিয়া ভাষা লিখিত হচ্ছে। মেঘালয়ে এ ভাষাকে মাধ্যমিক পর্যায় পর্যন্ত শিক্ষার মাধ্যম করা হয়েছে। বাংলাদেশে খাসিয়াদের সংখ্যাল্পতা, বসতির বিচ্ছিন্নতা ও আদর্শ রূপের অভাবে তা সম্ভব হয়নি।
গারো ভাষা চীনা-তিববতি ভাষাগোষ্ঠীর অন্তর্ভুক্ত এবং অক্ষরহীন ও অলিখিত একটি প্রাচীন অনার্য ভাষা। চীনা ভাষার সঙ্গে এ ভাষার শব্দ, ব্যাকরণ ও ভাষাতত্ত্বগত প্রচুর মিল রয়েছে। এ ভাষা প্রবাদ-প্রবচন, শ্লোক, গান, ছড়া, কিংবদন্তি, উপকথা, পালাগান ইত্যাদিতে সমৃদ্ধ। এতে নৃতত্ত্ব ও ধর্মের কথাও আছে। বহু ভাষার শব্দ দ্বারা গারো ভাষার শব্দকোষ পুষ্ট। এ ভাষায় বাক্যগঠন, পদবিন্যাস, বিভক্তি-প্রত্যয়ের অবস্থান, ক্রিয়া ও শব্দের রূপান্তর উন্নত ভাষার মতো সুশৃঙ্খল। এ থেকে অনুমান করা হয়, ভাষাটির অতীত ঐতিহ্য ছিল। বাংলা ও অসমিয়া ভাষার সঙ্গে সাদৃশ্যের কারণে গারো ভাষাকে কেউ কেউ এ দু ভাষার মিশ্ররূপ বলে মনে করেন। আসলে এটি একটি মৌলিক ভাষা।
গারোরা বিভিন্ন জেলায় বিক্ষিপ্তভাবে বসবাস করে বলে এ ভাষায় বিভিন্ন আঞ্চলিক রূপ দেখা যায়। খ্রিস্টান মিশনারিরা গারো ভাষায় রোমান অক্ষর প্রচলন করেন। পরে তাঁরা চীনা চিত্রলিপির ন্যায় এক ধরনের লিপিমালাও আবিষ্কার ও প্রয়োগ করার চেষ্টা করেন, কিন্তু কোনোটাই স্থায়ী হয়নি। বাংলা হরফে গারো ভাষা স্বচ্ছন্দে লেখা যায়। বর্তমানে গারোদের পারিবারিক ভাষা গারো, কিন্তু পোশাকি ভাষা বাংলা।
চাকমা ভাষা উপজাতীয় ভাষাসমূহের মধ্যে উন্নততর। এ ভাষায় কিছু প্রাচীন পুথি ছিল। সেসবের মধ্যে তালপাতায় লিখিত চাদিগাং চারা পালা একটি। এ থেকে জানা যায়, চাকমারা নেপাল থেকে দক্ষিণপূর্ব এশিয়ার নানাদেশ পরিক্রম করে ব্রহ্মদেশ ও আরাকানের ভেতর দিয়ে পার্বত্য চট্টগ্রামে এসে পৌঁছে। প্রাচীনকাল থেকেই এখানে তাদের আনাগোনা থাকলেও মাত্র তিনশ বছর পূর্বে পার্বত্য চট্টগ্রামে তারা স্থায়িভাবে বসতি শুরু করে। তাদের আদি নাম ‘শাক’ (Tsak), আরাকানি ভাষায় ‘চাক’, চাটগেঁয়ে ভাষায় ‘চামউয়া’ এবং চাকমা ভাষায় ‘চাকমা’।
চাকমা ভাষার বর্ণমালা থাইল্যান্ডের ক্ষ্মের, আন্নাম লাওস, কম্বোডিয়া, শ্যাম ও দক্ষিণ ব্রহ্মের লিপির সঙ্গে সাদৃশ্যপূর্ণ। চাকমাদের ধর্মশাস্ত্র তারা ব্রহ্মদেশীয় লিপিতে লিখিত। চাকমা বর্ণমালার উচ্চারণ কোমল, সাধারণত জিহবামূল থেকে উচ্চারিত। স্বরপ্রধান এ ভাষার বর্ণমালা আ-কারান্ত। শব্দে স্বরাগম ও স্বরলোপ ঘটে। চাকমা ভাষায় চীনা ভাষার মতো টান (tone) আছে, যে কারণে একই শব্দের অর্থপার্থক্য ঘটে; তবে তা তেমন প্রকট নয়। শব্দতত্ত্ব, ছন্দপ্রকরণ, লোকসাহিত্য, বাগ্বিন্যাস ও ধ্বনিতত্ত্বের দিক দিয়ে চাকমা ভাষা বাংলা ভাষার খুব কাছাকাছি। বাংলা ভাষার সব ধ্বনিই চাকমা ভাষায় রয়েছে। বর্তমানে চাকমা ভাষায় ব্রহ্মদেশীয় লিপি ব্যবহারের চেষ্টা চলছে। রাঙ্গামাটি থেকে চাকমা প্রথম পাঠ নামে একটি গ্রন্থও প্রকাশিত হয়েছে; প্রণেতা নয়নরাম চাকমা।
চাকমা ভাষায় অনেক গীত আছে, যেগুলি চাকমা কথ্য ভাষায় রচিত। ১৭৭৭ খ্রিস্টাব্দে চাকমা কবি শিবচরণ রচিত গোজেল লামা-র ভাষা প্রায় বাংলা। এতে পূর্ববঙ্গ-গীতিকার মতো বন্দনাগীতি রয়েছে। রাধামন ধানাপাদি ও চাদিগাং চারা পালা দুটি উল্লেখযোগ্য পালা। চাকমা ও বাংলা ছড়ার ছন্দ প্রায় অভিন্ন। চাকমা ও বাংলা ভাষার পদবিন্যাসও একই রকম। সংখ্যাবাচক চাকমা শব্দগুলি সামান্য উচ্চারণগত পার্থক্য ছাড়া বাংলার মতোই। বিয়োগ চিহ্নকে (-) তারা ‘ফারাক’ এবং পূরণ চিহ্নকে (×) ‘দুনা’ বলে। অন্যান্য চিহ্নের নাম একই। চাকমা ভাষায় ং-কে ‘এক ফুদা’ (ফোটা),ঃ-কে ‘দ্বিফুদা’ এবংঁ-কে ‘চানফুদা’ বলা হয়।
চাকমা লোকসাহিত্য বেশ সমৃদ্ধ। বহু লোকগাথা ও কিংবদন্তি রয়েছে এ ভাষায়। ‘উভাগীত’ চাকমাদের প্রিয় ঐতিহাসিক গান। প্রবাদ-প্রবচন চাকমা ভাষার এক অনন্য দৃষ্টান্ত। এতে প্রধানত কৃষি, পশুপাখি, প্রকৃতি, সমাজ, ধর্ম, দেহতত্ত্ব ইত্যাদি বিষয় বিধৃত হয়েছে। চাকমা ভাষায় প্রবাদ-প্রবচনকে বলে ‘দাগঅ কধা’। বর্তমান চাকমা ভাষা রূপগতভাবে বাংলা, অসমিয়া, রাজবংশী, গারো, সাঙ্ঘমা ও চাটগেঁয়ে ভাষার কাছাকাছি। এ ভাষার ছয়টি আঞ্চলিক রূপ রয়েছে। এমনকি, চাকমা গোত্রে-গোত্রেও এর পৃথক কথ্যরূপ দেখা যায়।
মগ ভাষা আরাকানি ভাষার কথ্যরূপ এবং একটি সংকর ভাষা। তিববতি-বর্মন গোষ্ঠীভুক্ত এ ভাষায় অস্ট্রো-এশীয় ভাষার প্রচুর উপাদান রয়েছে। চীনা, প্রাচীন বর্মি এবং মিজো ভাষার সঙ্গে এর সম্বন্ধ আছে। তবে বর্মি ভাষার সঙ্গে রয়েছে ঘনিষ্ঠ সম্পর্ক।
মগ ভাষা আরাকানি ও বাংলা ভাষার সংমিশ্রিত ভাষা। এক সময় ব্রহ্মদেশীয় রাজার অত্যাচারে দু-তৃতীয়াংশ আরাকানি বাংলাদেশের চট্টগ্রাম অঞ্চলে অনুপ্রবেশ করেছিল। ফলে তাদের ভাষার সঙ্গে বাংলা ভাষার সংমিশ্রণে মগভাষার উৎপত্তি হয়। এ ভাষার উৎপত্তিতে বর্মি ভাষারও প্রভাব রয়েছে, কারণ এক সময় হরফসহ প্রাচীন বর্মি ভাষা আরাকানে লিঙ্গুয়া ফ্রাংকা হিসেবে চালু ছিল। তাই মগভাষার প্রকৃত উৎস প্রাচীন বর্মি ভাষা বলে অনুমিত। মগবর্ণমালার নাম ‘ঝা’। বর্ণগুলি মানুষের কোনো-না-কোনো অঙ্গ-প্রত্যঙ্গের নামে উচ্চারিত হয়। এর আকৃতিতে চীনা চিত্রলিপির ছাপ লক্ষণীয়।
আরাকান ও বাংলাদেশে এক শ্রেণির মগ আছে, যাদের ভাষা বাংলা। বড়ুয়ারা মূলত মগ, কিন্তু বাংলাভাষী। পালি মগদের ধর্মীয় ভাষা। এ কারণে বহু পালি শব্দ কিছুটা বিকৃত কিংবা অবিকৃতভাবেই মগভাষায় প্রবেশ করেছে, যেমন: ভিক্ষু, নিববান, বিহার, ভাবনা (ধ্যান), দুক্খ, বস্সা (বর্ষা) ইত্যাদি।
বাংলা ও মগ ভাষার কিছু কিছু শব্দ উচ্চারণ ও অর্থে এক, যথা: আদ্য, মধ্য, উপাধি, আপত্তি ইত্যাদি। মগ ভাষায় এগুলি পালি ভাষা শিক্ষা-সংক্রান্ত শব্দ। কিছু কিছু শব্দ উভয় ভাষায়ই ব্যবহূত হয়, কিন্তু তাদের উচ্চারণ ও অর্থ ভিন্ন। যথা: মগভাষায় বড় ছেলেমেয়েকে বলে ‘চোগরি’, কিন্তু বাংলায় কিশোর-কিশোরীকে বলা হয় যথাক্রমে ছোকরা ও ছোকরি। আত্মীয়সূচক কিছু মগশব্দ বাংলায় ব্যবহূত হয়, যা উচ্চারণ ও অর্থে এক; আবার কোনো কোনো টিতে অর্থের কিছু তারতম্য ঘটেছে। যথা: বাবা, বাজী, মা। আঞ্চলিক বাংলায় বাবা, বাজী সমার্থক, কিন্তু মগভাষায় বাজী মানে জেঠা। মগরা ছোট মেয়েকে বলে ‘মা’, কিন্তু আঞ্চলিক বাংলায় মেয়েকে আদর করে বলা হয় ‘মা’।
মগ ভাষায় সম্বন্ধসূচক শব্দ সীমিত। ফলে, একই শব্দ প্রত্যয়-বিভক্তিযোগে বিভিন্ন সম্বন্ধ বুঝায়। সমাজ, সংস্থা, কৃষি, গৃহস্থালি ইত্যাদি সংক্রান্ত বহু শব্দ মগ, বাংলা ও বাংলাদেশের অনেক উপজাতীয় ভাষায়, এমনকি দক্ষিণপূর্ব এশিয়ার অন্যান্য ভাষায়ও এক কিংবা প্রায় এক। যথা: পিড়া, তুরুং (বাক্স), লঙ্গি, ধুতি, চেরুট ইত্যাদি মগশব্দের বাংলা উচ্চারণ যথাক্রমে পিড়া/পিড়ি, তুরং, লঙ্গি/লুঙ্গি, ধুতি, চুরুট ইত্যাদি। বর্মি ও মগ ভাষায় বার ও মাসের নাম এবং সংখ্যাগণনা অভিন্ন। মগরা আরাকানে থাকতেই বাংলা ভাষা ও সংস্কৃতির সঙ্গে পরিচিত ছিল, কারণ মধ্যযুগে আরাকানে বাংলা ভাষা ও সাহিত্যের চর্চা হতো। মগরা বাংলা, বিশেষত চাটগেঁয়ে বাংলা, আরাকানি ও বর্মি ভাষায় সমান দক্ষতায় বাক্যালাপ করতে পারে। চট্টগ্রাম, নোয়াখালী, ফেনী, কুমিল্লা, ফরিদপুর ও বরিশালের আঞ্চলিক ভাষা ও মগভাষার মধ্যে পারস্পরিক প্রভাব লক্ষণীয়। ব্রহ্মদেশীয় বৌদ্ধ মতবাদ ও মগদের ধর্মীয় মতবাদ এক বলে বর্মি ভাষার প্রতি মগদের আকর্ষণ বেশি। তারা মঠে-বিহারে পালি ভাষা শেখে এবং ধর্মশিক্ষা গ্রহণ করে, কিন্তু তাদের শিক্ষার মাধ্যম বর্মি ভাষা।
মগ ভাষায় সৃজনশীল সাহিত্য না থাকলেও লোকসাহিত্যের উপাদান আছে প্রচুর। এতে রয়েছে প্রবাদ, ধাঁধা, উপকথা, গীত, ভূতের গল্প, জাতকের গল্প, বৌদ্ধ রাজা-রানীদের কাহিনী ইত্যাদি। গল্পগীতিপ্রিয় মগরা অবকাশ মৌসুমে রাতভর গল্প শোনে, বাদ্যসহ নাচগান করে এবং বাংলা যাত্রা গানের মতো ‘পাওয়ে’ নামক এক ধরনের অভিনয়ে অংশগ্রহণ করে। কোনো কোনো গল্প আবার বর্মি অক্ষরে লিখিত।
মণিপুরী ভাষা মোঙ্গলীয় ভাষা-পরিবারের তিববতি-বর্মি শাখার কুকি-চীন গোষ্ঠীভুক্ত প্রায় ৩,৫০০ বছরের প্রাচীন ভাষা। মৈতৈ জাতির নামানুসারে উনিশ শতকের পূর্বার্ধ পর্যন্ত এ ভাষার নাম ছিল মৈতৈ; অতঃপর মণিপুরী নামে অভিহিত হয়। মূল মৈতৈ বর্ণমালায় বর্ণ ছিল ১৮টি, পরে আরও সংযোজিত হয়। বর্মি-আরাকানি বর্ণমালার মতো মৈতৈ বর্ণমালাও মানুষের অঙ্গ-প্রত্যঙ্গের নাম ও বৈশিষ্ট্য অনুযায়ী উচ্চারিত হয়। এর বর্ণগুলি তিববতি বর্ণমালার অনুরূপ। আঠারো শতকে মহারাজা গরীব নেওয়াজের সময় বৈষ্ণবধর্ম রাষ্ট্রীয় ধর্মের রূপ নিলে মৈতৈ তথা মণিপুরী ভাষা বঙ্গাক্ষরে লেখা শুরু হয়, যা আজও অব্যাহত। উভয় ভাষায় ধ্বনিতাত্ত্বিক মিল আছে বলেই তা সম্ভব হয়েছে।
মণিপুরী ভাষা ও সাহিত্যের উদ্ভবযুগের প্রথম নিদর্শন গীতিকবিতা ‘ঔগ্রী’। তৎপূর্বে বিচিত্র প্রেমগীত, প্রবাদ-প্রবচন, পালাগান, ছড়া ইত্যাদির প্রচলন ছিল। প্রেমগীতগুলি বেশ কাব্যময়। এগুলি যুবক-যুবতীরা বাদ্যনৃত্যযোগে দলবদ্ধভাবে পরিবেশন করে। মণিপুরী ভাষায় প্রচুর সামরিক সঙ্গীত এবং কতিপয় নাটক, উপন্যাস, ছোটগল্প, কাব্য, এমনকি মহাকাব্যও রচিত হয়েছে। এ ভাষায় বাংলা ও পাশ্চাত্যের বিশেষ বিশেষ গ্রন্থ এবং রামায়ণ, মহাভারত অনূদিত হয়েছে। ভারতের মণিপুরে এ ভাষা রাষ্ট্রভাষা এবং অন্যতম ভারতীয় জাতীয় ভাষা। উনিশ শতকের মধ্যভাগে প্রকাশিত George Gordon-এর A Dictionary of English, Bengali and Manipuri মণিপুরী ভাষার প্রথম মুদ্রিত গ্রন্থ।
মণিপুরী একটি সংকর ভাষা। বাংলাদেশ, ত্রিপুরা, আসাম ও ব্রহ্মদেশে ২০-২৫ লক্ষ লোক এ ভাষায় কথা বলে। বর্তমানে বৃহত্তর সিলেটে মণিপুরীভাষীর সংখ্যা প্রায় অর্ধ লক্ষ। বিক্ষিপ্ত বসতির কারণে বাংলাদেশের শিক্ষাপ্রতিষ্ঠানে মণিপুরী ভাষা পড়ানো সম্ভব নয়।
মুন্ডা ভাষা অস্ট্রো-এশীয় ভাষা পরিবারের অন্তর্ভুক্ত এবং ভারতীয় আর্যভাষা থেকেও প্রাচীনতর। এ ভাষা উড়িয়া, অসমিয়া ও বাংলা ভাষার প্রাথমিক ভিত রচনা করেছে। খাসিয়া, গারো, সাঁওতাল, কোল ইত্যাদি উপজাতীয় ভাষার সঙ্গে মুন্ডা ভাষার সম্পর্ক লক্ষণীয়। অসংখ্য মুন্ডা শব্দ বাংলা ভাষায়, বিশেষত আঞ্চলিক ভাষায় বিদ্যমান। বাংলা বাগ্ভঙ্গির ওপর মুন্ডা ভাষার প্রভাব আছে। কৃষি, গৃহস্থালী, বসতি, গণনা, আত্মীয়তা, ওজন, ভূমি, পশুপাখি, গাছগাছড়া ইত্যাদি সংক্রান্ত শব্দ মুন্ডা তথা অস্ট্রো-এশীয় ভাষা থেকে আগত।
মুন্ডা ভাষা ব্যাপক অঞ্চল জুড়ে চালু ছিল বলে এর আঞ্চলিক রূপও ছিল। দক্ষিণ বিহার ও উড়িষ্যার সংলগ্ন অঞ্চলে, মধ্য প্রদেশ ও পশ্চিমবঙ্গে প্রায় এক কোটি লোক মুন্ডা ভাষায় কথা বলে। বাংলাদেশে এদের সংখ্যা ১৫-২০ হাজার। তিন-চার হাজার বছর পূর্বে মুন্ডারা Pidgin ভাষা হিসেবে পেশা ও জীবিকার প্রয়োজনে প্রথম মুন্ডা ভাষা ব্যবহার করে। পরে তা কৃষি ও উন্নত শিকারপদ্ধতি প্রবর্তনের মাধ্যমে দক্ষিণপূর্ব এশিয়ায় ছড়িয়ে পড়ে। পরবর্তী পর্যায়ে ওই Pidgin ভাষা প্রতিষ্ঠিত রূপ নেয় এবং আরও পরে স্বীকৃত আঞ্চলিক, লিখিত ও সাহিত্যের ভাষা হয়ে ওঠে।
অনার্য মুন্ডা ভাষার সঙ্গে বাংলার ধ্বনিতত্ত্ব, রূপতত্ত্ব ও পদক্রমের ব্যাপক সাদৃশ্য রয়েছে। মুন্ডা ভাষায় দ্বিস্বরধ্বনির (dipthong) আধিক্য আছে; স্বরধ্বনিও অনুনাসিক হতে পারে। স্বরসঙ্গতি আছে। যুক্ত ব্যঞ্জন এবং ণ, ড়, ঢ় ধ্বনি শব্দের আদিতে নেই। মুন্ডায় শব্দদ্বৈতের বাহুল্য আছে, স্ত্রী-পুরুষবাচক শব্দ বসিয়ে লিঙ্গান্তর করা হয়। একই শব্দকে দ্বিত্ব উচ্চারণ করে বহুবচন করার প্রবণতা আছে। অনুরূপ ভাষাগত বৈশিষ্ট্য বাংলাতেও লক্ষণীয়। মুন্ডা ও বাংলায় কারক-বিভক্তির ব্যবহার অনেকটা অনুরূপ। মুন্ডা ও বাংলায় ১০ পর্যন্ত সংখ্যাগুলির ব্যুৎপত্তি এক। ‘হালি’ এবং ‘কুড়ি’ বাংলার মতো মুন্ডায়ও গণনার একক। বাংলার মতো মুন্ডা ভাষায়ও সর্বনামের লিঙ্গান্তর নেই। খ্রিস্টান মিশনারিদের প্রকাশিত Mundari-English Dictionary-র মাধ্যমে মুন্ডা ভাষার ব্যাপক পরিচয় পাওয়া যায়।
সাঁওতালী ভাষা অস্ট্রো-এশীয় ভাষাগোষ্ঠীর প্রাচ্য শাখার অন্তর্ভুক্ত। প্রায় দশ হাজার বছর আগে অস্ট্রেলিয়া থেকে ইন্দোনেশিয়া হয়ে ব্রহ্মদেশ ও আসামের ভেতর দিয়ে অস্ট্রো-এশীয় জনগোষ্ঠী ভারত উপমহাদেশে ছড়িয়ে পড়ে। বিহারের সাঁওতাল পরগনায় সাঁওতালভাষী জনসংখ্যা প্রায় এক কোটি। পশ্চিমবঙ্গের বিহার-সীমান্তবর্তী জেলাগুলিতে এবং বাংলাদেশের উত্তর-পশ্চিম অঞ্চলে, দিনাজপুর, রাজশাহী ও রংপুরে বিক্ষিপ্তভাবে প্রায় সোয়া লক্ষ সাঁওতালভাষী লোকের বাস আছে। তারা বাংলায় সাবলীলভাবে কথা বলতে পারে এবং নিজেদের ভাষায়ও বহু বাংলা শব্দ ব্যবহার করে। সাঁওতাল ও মুন্ডা ভাষার মূল এক ও পরস্পর সম্বন্ধযুক্ত। সাঁওতাল ভাষার দুটি উপভাষা আছে নাহিলি ও করকু। এটি অক্ষরহীন ভাষা। ভারতে এখন সাঁওতালী ভাষা দেবনাগরী অক্ষরে লিখিত হয় এবং বহু হিন্দি উপাদান এতে অনুপ্রবিষ্ট হয়েছে। ইংরেজ আমলে সাঁওতালীতে রোমান হরফ চালু হয়েছিল। বাংলাদেশে সাঁওতালী বই-পুস্তক নেই। খ্রিস্টান মিশনারিরা দু-একটি সাঁওতাল বিদ্যালয় স্থাপন করে ইংরেজি বর্ণমালায় সাঁওতালী ভাষা শিক্ষা দিচ্ছে। শিক্ষিত সাঁওতালরা বাংলা ও ইংরেজি অক্ষরে সাঁওতালী লেখে; তবে ধ্বনিগত মিলের কারণে তারা বাংলা অক্ষরে লিখতেই স্বাচ্ছন্দ্য বোধ করে।
সাঁওতালী ভাষার প্রায় সব ধ্বনিই বাংলায় রয়েছে। অন্যান্য ব্যাকরণিক মিলও আছে। মুন্ডার মতো সাঁওতালীতেও স্বরবর্ণ অনুনাসিক হতে পারে। পুংলিঙ্গ ও স্ত্রীলিঙ্গ বোঝানোর জন্য ভিন্ন শব্দ ব্যবহূত হয়। স্ত্রী প্রত্যয় (ই/ঈ) যোগেও সাঁওতালীতে লিঙ্গান্তর হয়, কিন্তু তা আর্যপ্রভাবের ফল। মূল সাঁওতালী ভাষায় শব্দান্তে প্রত্যয় যোগের কোনো প্রক্রিয়া নেই। সাঁওতালীতে প্রাণী ও অপ্রাণিবাচক সর্বনাম ভিন্ন ভিন্ন। সাঁওতালী, কোল, মুন্ডা ইত্যাদি ভাষা বাংলা থেকে তো বটেই, ভারতীয় আর্যভাষা থেকেও প্রাচীনতর। আর্যভাষায় অনার্য ভাষার বহু শব্দ সংস্কারের মাধ্যমে অনুপ্রবিষ্ট হয়েছে। মানবাংলায় ও আঞ্চলিক উপভাষায় বহু সাঁওতালী শব্দ রূপান্তরিত অবস্থায় আজও বিদ্যমান। খ্রিস্টান মিশনারিদের An Introduciton to the Santal Language (১৮৫২), A Grammar of the Santal Language (১৮৭৩) এবং পি.ও বডিং-এর দুখন্ডে Materials of the Santal Grammar (১৯২৯) গ্রন্থে সাঁওতালী ভাষার উৎস, শব্দকোষ ও ব্যাকরণ আলোচিত হয়েছে।
বাংলাদেশের উত্তরাঞ্চল ও সিলেটের চা-বাগান এলাকায় প্রায় লক্ষাধিক লোকের মাতৃভাষা ওরাওঁ। ওরাওঁভাষীদের সর্বোচ্চ সংখ্যা রংপুরে এবং সর্বনিম্ন সিলেটে। খাসিয়ারা ওয়ার নামক ভাষায় কথা বলে। সিলেট বিভাগের বিভিন্ন জেলার পার্বত্য ও অরণ্য অঞ্চলে তাদের বসবাস। এসব অঞ্চলে স্বল্পসংখ্যক সিন্টেং ও লালং উপজাতিও বাস করে এবং তারা স্ব-স্ব ভাষায় কথা বলে।
‘আচিক কতা’ অর্থাৎ পার্বত্য গারোভাষা বৃহত্তর ময়মনসিংহ এবং ভারতের মেঘালয় সীমান্তে পার্বত্য গারো অঞ্চলে প্রচলিত। রংপুর, সুনামগঞ্জ এবং ঢাকা জেলার শ্রীপুরেও কিছুসংখ্যক গারোভাষী লোক আছে। পার্বত্য চট্টগ্রামে তিন লক্ষাধিক লোক চাকমা ভাষায় কথা বলে। মগভাষার আদি স্থান আরাকান। বাংলাদেশে দু লক্ষাধিক লোক মগভাষা বলে। প্রায় ২৫০ বছর পূর্বে সিলেটের শ্রীমঙ্গলে মণিপুরী ভাষার প্রচলন হয়। ঢাকার তেজগাঁও, দুর্গাপুর এবং কুমিল্লার কসবা অঞ্চলেও এক সময় এ ভাষার প্রচলন ছিল। বর্তমানে সিলেট বিভাগের হবিগঞ্জ, মৌলভীবাজার, সিলেট ও সুনামগঞ্জ জেলার প্রায় অর্ধলক্ষ মানুষ মণিপুরী ভাষায় কথা বলে।
বাংলাদেশে বেশ কিছু উপজাতি এখন নিজস্ব ভাষা বিস্মৃত হয়ে বাংলা ভাষায় কথা বলে। যেমন, পার্বত্য চট্টগ্রাম ও চট্টগ্রামের টিপরাদের অনেকের ভাষা বাংলা। এ ছাড়া অন্যান্য অঞ্চলের হাড়ি, পাতোর, কোচ, রাজবংশী এবং বেদেরাও বাংলা বলে। সব মিলে প্রায় তিন লক্ষাধিক উপজাতীয় স্বচ্ছন্দে বাংলায় কথা বলে। বাগ্দি, বিন্দি ইত্যাদি অন্ত্যজ শ্রেণির লোকেরা স্ব-স্ব ভাষা ব্যবহার করলেও সেসব প্রায় বাংলার কাছাকাছি।
উপজাতীয় ভাষাগুলির আদর্শ রূপের অভাব, শিক্ষার্থীর স্বল্পতা ইত্যাদি কারণে বাংলাদেশে কোনো উপজাতীয় ভাষাই শিক্ষাপ্রতিষ্ঠানের পাঠ্যসূচির অন্তর্ভুক্ত হয়নি। দু-একটি ছাড়া সব উপজাতীয় ভাষাই অলিখিত, অর্থাৎ সেসবের কোনো লিখিত রূপ নেই। চাকমা ও মগ ভাষা ছাড়া অন্য কোনো ভাষার নিজস্ব বর্ণমালাও নেই। শিক্ষিত উপজাতীয়রা নিজেদের মধ্যে স্ব-স্ব ভাষায় বঙ্গাক্ষরে পত্রালাপ করে।
উপজাতীয় ভাষাগুলি লোকসাহিত্যে সমৃদ্ধ, ছড়া-রূপকথা-উপকথায় ভরপুর এবং যাযাবর জীবনের ইতিহাস আশ্রিত তাদের অতীত। উপজাতীয় গান খুবই বৈচিত্র্যময়। মৈমনসিংহ-গীতিকার ন্যায় পালাগান মগ, চাকমা, খাসিয়া, গারো ইত্যাদি ভাষায় প্রচুর পাওয়া যায়। উপজাতীয় ও বাংলা উপকথায় যথেষ্ট মিল আছে। কোনো কোনো গারো উপকথা ও মৈমনসিংহ-গীতিকার পালা প্রায় একই রকম। হিমালয়ের পাদদেশের দু-একটি পাহাড়িয়া ভাষার পালাগান বাংলা লোকসাহিত্যে প্রচলিত, যার ভাষা প্রথম যুগের বাংলা বলে অনুমিত হয়। বাংলা ও উপজাতীয় ছড়া বিষয়, ছন্দ ও শব্দসম্ভারে অনুরূপ। ওরাওঁ ও বাংলা ধাঁধা আকৃতি-প্রকৃতি ও শব্দে-ছন্দে খুবই নিকটবর্তী। ওরাওঁ ও বাংলা ঘুমপাড়ানি গানেও অদ্ভুত মিল রয়েছে।
অনেক উপজাতি আছে বহুভাষী। গারো ও খাসিয়ারা দ্বিভাষী। বাংলা ও নিজেদের ভাষায় তারা যুগপৎ কথা বলতে পারে। তবে যে উপজাতীয়রা পরস্পরের ভাষা বোঝে না তাদের ক্ষেত্রে বাংলা ভাষা লিঙ্গুয়া ফ্রাংকা হিসেবে কাজ করে। মুন্ডা, সাঁওতাল, খাসিয়া, গারো, ওরাওঁ ও মণিপুরী ভাষা সুবিন্যস্ত ও সুশৃঙ্খল, উন্নত অতীতের নিদর্শনবাহী। গারো ও চাকমা ভাষায় চীনা ভাষার ন্যায় টান (tone) আছে, যদিও তা প্রকট নয়। গারো ও মগ ভাষার মধ্যে মৌলিক মিল রয়েছে, কারণ উভয় উপজাতি একই স্থান থেকে আগত। মুন্ডা, সাঁওতাল, কোল, খাসিয়া, গারো, কুরুখ ইত্যাদিও পরস্পর সম্বন্ধযুক্ত ভাষা। মুন্ডা ও ওরাওঁ ভাষাকে সমসাময়িক এমনকি একই ভাষা মনে করা হয়, কারণ উভয় ভাষায় পদক্রম ও ক্রিয়াপদ প্রায় এক। মুন্ডা, সাঁওতাল ও কোল ভাষা প্রাচীন ভারতীয় আর্যভাষা থেকেও প্রাচীনতর। বাংলায় যে-সব শব্দ তদ্ভব নামে পরিচিত তার সবগুলিই তদ্ভব নয়; বেশ কয়েকটি মুন্ডা উপজাতীয় ভাষা থেকে আগত। বাংলা ভাষার ওপর মুন্ডা ভাষার প্রভাব অনেকখানি। উপজাতীয় ভাষাসমূহ অস্ট্রো-এশীয়, ইন্দো-চীন, চীনা-তিববতি, তিববতি-বর্মন ও দ্রাবিড়ীয় ভাষা পরিবারের কোনো-না-কোনোটির অন্তর্ভুক্ত। এসব ভাষার সংমিশ্রণে প্রাচীন বঙ্গ-মগধে একটা Pidgin ভাষার সৃষ্টি হয়েছিল, যার মূল ছিল মুন্ডা ভাষা। এটাই বাংলা তথা পূর্বভারতীয় ভাষাসমূহের প্রাথমিক ভিত রচনা করে। বাংলা ভাষার গঠনের যুগে উপজাতীয় ভাষাসমূহের অবদান অপরিসীম। নিম্নে কয়েকটি প্রধান উপজাতীয় ভাষার সংক্ষিপ্ত বর্ণনা দেওয়া হলো।
ওরাওঁ ভাষা কুরুখ নামে পরিচিত। এ ভাষার কোনো লিখিত রূপ নেই, তবে তা লোকসাহিত্যসমৃদ্ধ। এতে অসংখ্য উপকথা, রূপকথা, গীত, ছড়া, ধাঁধা, প্রবাদ ইত্যাদি রয়েছে। শিক্ষিত ওরাওঁরা বাংলা অথবা ইংরেজি অক্ষরে তাদের ভাষা লিখে থাকে। এ ভাষায় বিভিন্ন ঋতু ও পার্বণভিত্তিক গান আছে।
লোকসাহিত্য ওরাওঁদের ইতিহাস, ঐতিহ্য ও হাসিকান্নার বাহক। প্রেম, প্রকৃতি, জীবিকা, আচার-অনুষ্ঠান, জন্মমৃত্যু ইত্যাদি বিষয় নিয়ে রচিত ওরাওঁ লোকসঙ্গীত যথেষ্ট কাব্যময় এবং একটি শক্তিশালী ভাষার পরিচায়ক। এ ভাষায় অগণিত ছেলেভুলানো ছড়া ও ঘুমপাড়ানি গান রয়েছে। কোনো কোনো ধাঁধা ওরাওঁ ও বাংলা ভাষায় একই রকম। কিছু কিছু ওরাওঁ উপকথা বাংলা ও অন্যান্য উপজাতীয় উপকথার সঙ্গে সাদৃশ্যপূর্ণ; এমনকি, চীনা উপকথার সঙ্গেও সেগুলির মিল দেখা যায়।
সমকালীন মুন্ডা ভাষার সঙ্গে ক্রিয়াপদ ও পদক্রমে ওরাওঁ ভাষার মিল রয়েছে। মুহম্মদ শহীদুল্লাহ্র মতে, মুন্ডা ও ওরাওঁ ভাষা একই। গৃহস্থালী সম্বন্ধীয় কিছু শব্দে ওরাওঁ ও আঞ্চলিক বাংলা ভাষায় মিল রয়েছে। মাটির হাঁড়িপাতিলকে ওরাওঁরা বলে তাওয়া। আঞ্চলিক বাংলায় শব্দটি বহুল প্রচলিত, যদিও এর অর্থসংকোচন ঘটেছে। ওরাওঁ ও বাংলা ভাষায় কিছু গহনার নাম এক, যথা: টিকলি, বালা, পায়রা, বালি, কানপাশা ইত্যাদি। সম্বন্ধসূচক অনেক ওরাওঁ এবং বাংলা শব্দও এক, যথা: মা, বাবা, মামা, ভাগিনা ইত্যাদি। কিছূ গাছগাছড়া ও ফলের নাম দু ভাষায় ব্যুৎপত্তিগত দিক থেকে এক, যথা: আম্বা আম, কাঠা কাঁঠাল, সিম শিমুল, সাক শাক, দালি ডাল ইত্যাদি। এ ছাড়া আরও কিছু শব্দের মধ্যে মিল দেখা যায়, যথা: ওরাওঁ ভাগোয়ান, বাংলা ভগবান, ওরাওঁ ভগতি, বাংলা ভকতি/ভক্তি, ওরাওঁ ভূত, বাংলা ভূত ইত্যাদি। ধ্বনিলোপ ওরাওঁ ভাষার একটি লক্ষণীয় বৈশিষ্ট্য।
খাসিয়া ভাষা অস্ট্রো-এশিয়াটিক ভাষাগোষ্ঠীর অন্তর্ভুক্ত। এ ভাষায় স-এর হ উচ্চারণপ্রবণতা আছে, যা বাংলা উপভাষায় পরিলক্ষিত হয়। এটি অক্ষরহীন ও অলিখিত ভাষা। এ ভাষায় গ্রামকে ‘পুঞ্জি’ বলে। খাসিয়াদের কুঁড়েঘরগুলি পুঞ্জীভূত বলে সম্ভবত এরূপ নাম হয়েছে। এর অনেকগুলি উপভাষার মধ্যে প্রধান পাঁড়, লিংগাম ও ওয়ার। পাঁড় মানে পার্বত্য; খাসিয়া-জৈন্তিয়া পাহাড়ের পূর্বাংশের বিস্তীর্ণ অঞ্চলে প্রচলিত ভাষাই পাঁড়। লিংগাম শব্দে গারো পাহাড়কে বোঝায়, তাই গারো পাহাড়ের সন্নিকটস্থ অঞ্চলের ভাষাই লিংগাম নামে পরিচিত। ওয়ার মানে উপত্যকা।
এক সময় খাসিয়া ভাষা বাংলা হরফে লিখিত হতো। বাংলা অক্ষরে বাইবেল-এর কিয়দংশ খাসিয়া ভাষায় প্রথম অনূদিত হয়েছিল। বর্তমানে ভারতের মেঘালয়ের খ্রিস্টান মিশনারিদের প্রচেষ্টায় রোমান অক্ষরে চেরাপুঞ্জি ও তদঞ্চলের খাসিয়া ভাষা লিখিত হচ্ছে। মেঘালয়ে এ ভাষাকে মাধ্যমিক পর্যায় পর্যন্ত শিক্ষার মাধ্যম করা হয়েছে। বাংলাদেশে খাসিয়াদের সংখ্যাল্পতা, বসতির বিচ্ছিন্নতা ও আদর্শ রূপের অভাবে তা সম্ভব হয়নি।
গারো ভাষা চীনা-তিববতি ভাষাগোষ্ঠীর অন্তর্ভুক্ত এবং অক্ষরহীন ও অলিখিত একটি প্রাচীন অনার্য ভাষা। চীনা ভাষার সঙ্গে এ ভাষার শব্দ, ব্যাকরণ ও ভাষাতত্ত্বগত প্রচুর মিল রয়েছে। এ ভাষা প্রবাদ-প্রবচন, শ্লোক, গান, ছড়া, কিংবদন্তি, উপকথা, পালাগান ইত্যাদিতে সমৃদ্ধ। এতে নৃতত্ত্ব ও ধর্মের কথাও আছে। বহু ভাষার শব্দ দ্বারা গারো ভাষার শব্দকোষ পুষ্ট। এ ভাষায় বাক্যগঠন, পদবিন্যাস, বিভক্তি-প্রত্যয়ের অবস্থান, ক্রিয়া ও শব্দের রূপান্তর উন্নত ভাষার মতো সুশৃঙ্খল। এ থেকে অনুমান করা হয়, ভাষাটির অতীত ঐতিহ্য ছিল। বাংলা ও অসমিয়া ভাষার সঙ্গে সাদৃশ্যের কারণে গারো ভাষাকে কেউ কেউ এ দু ভাষার মিশ্ররূপ বলে মনে করেন। আসলে এটি একটি মৌলিক ভাষা।
গারোরা বিভিন্ন জেলায় বিক্ষিপ্তভাবে বসবাস করে বলে এ ভাষায় বিভিন্ন আঞ্চলিক রূপ দেখা যায়। খ্রিস্টান মিশনারিরা গারো ভাষায় রোমান অক্ষর প্রচলন করেন। পরে তাঁরা চীনা চিত্রলিপির ন্যায় এক ধরনের লিপিমালাও আবিষ্কার ও প্রয়োগ করার চেষ্টা করেন, কিন্তু কোনোটাই স্থায়ী হয়নি। বাংলা হরফে গারো ভাষা স্বচ্ছন্দে লেখা যায়। বর্তমানে গারোদের পারিবারিক ভাষা গারো, কিন্তু পোশাকি ভাষা বাংলা।
চাকমা ভাষা উপজাতীয় ভাষাসমূহের মধ্যে উন্নততর। এ ভাষায় কিছু প্রাচীন পুথি ছিল। সেসবের মধ্যে তালপাতায় লিখিত চাদিগাং চারা পালা একটি। এ থেকে জানা যায়, চাকমারা নেপাল থেকে দক্ষিণপূর্ব এশিয়ার নানাদেশ পরিক্রম করে ব্রহ্মদেশ ও আরাকানের ভেতর দিয়ে পার্বত্য চট্টগ্রামে এসে পৌঁছে। প্রাচীনকাল থেকেই এখানে তাদের আনাগোনা থাকলেও মাত্র তিনশ বছর পূর্বে পার্বত্য চট্টগ্রামে তারা স্থায়িভাবে বসতি শুরু করে। তাদের আদি নাম ‘শাক’ (Tsak), আরাকানি ভাষায় ‘চাক’, চাটগেঁয়ে ভাষায় ‘চামউয়া’ এবং চাকমা ভাষায় ‘চাকমা’।
চাকমা ভাষার বর্ণমালা থাইল্যান্ডের ক্ষ্মের, আন্নাম লাওস, কম্বোডিয়া, শ্যাম ও দক্ষিণ ব্রহ্মের লিপির সঙ্গে সাদৃশ্যপূর্ণ। চাকমাদের ধর্মশাস্ত্র তারা ব্রহ্মদেশীয় লিপিতে লিখিত। চাকমা বর্ণমালার উচ্চারণ কোমল, সাধারণত জিহবামূল থেকে উচ্চারিত। স্বরপ্রধান এ ভাষার বর্ণমালা আ-কারান্ত। শব্দে স্বরাগম ও স্বরলোপ ঘটে। চাকমা ভাষায় চীনা ভাষার মতো টান (tone) আছে, যে কারণে একই শব্দের অর্থপার্থক্য ঘটে; তবে তা তেমন প্রকট নয়। শব্দতত্ত্ব, ছন্দপ্রকরণ, লোকসাহিত্য, বাগ্বিন্যাস ও ধ্বনিতত্ত্বের দিক দিয়ে চাকমা ভাষা বাংলা ভাষার খুব কাছাকাছি। বাংলা ভাষার সব ধ্বনিই চাকমা ভাষায় রয়েছে। বর্তমানে চাকমা ভাষায় ব্রহ্মদেশীয় লিপি ব্যবহারের চেষ্টা চলছে। রাঙ্গামাটি থেকে চাকমা প্রথম পাঠ নামে একটি গ্রন্থও প্রকাশিত হয়েছে; প্রণেতা নয়নরাম চাকমা।
চাকমা ভাষায় অনেক গীত আছে, যেগুলি চাকমা কথ্য ভাষায় রচিত। ১৭৭৭ খ্রিস্টাব্দে চাকমা কবি শিবচরণ রচিত গোজেল লামা-র ভাষা প্রায় বাংলা। এতে পূর্ববঙ্গ-গীতিকার মতো বন্দনাগীতি রয়েছে। রাধামন ধানাপাদি ও চাদিগাং চারা পালা দুটি উল্লেখযোগ্য পালা। চাকমা ও বাংলা ছড়ার ছন্দ প্রায় অভিন্ন। চাকমা ও বাংলা ভাষার পদবিন্যাসও একই রকম। সংখ্যাবাচক চাকমা শব্দগুলি সামান্য উচ্চারণগত পার্থক্য ছাড়া বাংলার মতোই। বিয়োগ চিহ্নকে (-) তারা ‘ফারাক’ এবং পূরণ চিহ্নকে (×) ‘দুনা’ বলে। অন্যান্য চিহ্নের নাম একই। চাকমা ভাষায় ং-কে ‘এক ফুদা’ (ফোটা),ঃ-কে ‘দ্বিফুদা’ এবংঁ-কে ‘চানফুদা’ বলা হয়।
চাকমা লোকসাহিত্য বেশ সমৃদ্ধ। বহু লোকগাথা ও কিংবদন্তি রয়েছে এ ভাষায়। ‘উভাগীত’ চাকমাদের প্রিয় ঐতিহাসিক গান। প্রবাদ-প্রবচন চাকমা ভাষার এক অনন্য দৃষ্টান্ত। এতে প্রধানত কৃষি, পশুপাখি, প্রকৃতি, সমাজ, ধর্ম, দেহতত্ত্ব ইত্যাদি বিষয় বিধৃত হয়েছে। চাকমা ভাষায় প্রবাদ-প্রবচনকে বলে ‘দাগঅ কধা’। বর্তমান চাকমা ভাষা রূপগতভাবে বাংলা, অসমিয়া, রাজবংশী, গারো, সাঙ্ঘমা ও চাটগেঁয়ে ভাষার কাছাকাছি। এ ভাষার ছয়টি আঞ্চলিক রূপ রয়েছে। এমনকি, চাকমা গোত্রে-গোত্রেও এর পৃথক কথ্যরূপ দেখা যায়।
মগ ভাষা আরাকানি ভাষার কথ্যরূপ এবং একটি সংকর ভাষা। তিববতি-বর্মন গোষ্ঠীভুক্ত এ ভাষায় অস্ট্রো-এশীয় ভাষার প্রচুর উপাদান রয়েছে। চীনা, প্রাচীন বর্মি এবং মিজো ভাষার সঙ্গে এর সম্বন্ধ আছে। তবে বর্মি ভাষার সঙ্গে রয়েছে ঘনিষ্ঠ সম্পর্ক।
মগ ভাষা আরাকানি ও বাংলা ভাষার সংমিশ্রিত ভাষা। এক সময় ব্রহ্মদেশীয় রাজার অত্যাচারে দু-তৃতীয়াংশ আরাকানি বাংলাদেশের চট্টগ্রাম অঞ্চলে অনুপ্রবেশ করেছিল। ফলে তাদের ভাষার সঙ্গে বাংলা ভাষার সংমিশ্রণে মগভাষার উৎপত্তি হয়। এ ভাষার উৎপত্তিতে বর্মি ভাষারও প্রভাব রয়েছে, কারণ এক সময় হরফসহ প্রাচীন বর্মি ভাষা আরাকানে লিঙ্গুয়া ফ্রাংকা হিসেবে চালু ছিল। তাই মগভাষার প্রকৃত উৎস প্রাচীন বর্মি ভাষা বলে অনুমিত। মগবর্ণমালার নাম ‘ঝা’। বর্ণগুলি মানুষের কোনো-না-কোনো অঙ্গ-প্রত্যঙ্গের নামে উচ্চারিত হয়। এর আকৃতিতে চীনা চিত্রলিপির ছাপ লক্ষণীয়।
আরাকান ও বাংলাদেশে এক শ্রেণির মগ আছে, যাদের ভাষা বাংলা। বড়ুয়ারা মূলত মগ, কিন্তু বাংলাভাষী। পালি মগদের ধর্মীয় ভাষা। এ কারণে বহু পালি শব্দ কিছুটা বিকৃত কিংবা অবিকৃতভাবেই মগভাষায় প্রবেশ করেছে, যেমন: ভিক্ষু, নিববান, বিহার, ভাবনা (ধ্যান), দুক্খ, বস্সা (বর্ষা) ইত্যাদি।
বাংলা ও মগ ভাষার কিছু কিছু শব্দ উচ্চারণ ও অর্থে এক, যথা: আদ্য, মধ্য, উপাধি, আপত্তি ইত্যাদি। মগ ভাষায় এগুলি পালি ভাষা শিক্ষা-সংক্রান্ত শব্দ। কিছু কিছু শব্দ উভয় ভাষায়ই ব্যবহূত হয়, কিন্তু তাদের উচ্চারণ ও অর্থ ভিন্ন। যথা: মগভাষায় বড় ছেলেমেয়েকে বলে ‘চোগরি’, কিন্তু বাংলায় কিশোর-কিশোরীকে বলা হয় যথাক্রমে ছোকরা ও ছোকরি। আত্মীয়সূচক কিছু মগশব্দ বাংলায় ব্যবহূত হয়, যা উচ্চারণ ও অর্থে এক; আবার কোনো কোনো টিতে অর্থের কিছু তারতম্য ঘটেছে। যথা: বাবা, বাজী, মা। আঞ্চলিক বাংলায় বাবা, বাজী সমার্থক, কিন্তু মগভাষায় বাজী মানে জেঠা। মগরা ছোট মেয়েকে বলে ‘মা’, কিন্তু আঞ্চলিক বাংলায় মেয়েকে আদর করে বলা হয় ‘মা’।
মগ ভাষায় সম্বন্ধসূচক শব্দ সীমিত। ফলে, একই শব্দ প্রত্যয়-বিভক্তিযোগে বিভিন্ন সম্বন্ধ বুঝায়। সমাজ, সংস্থা, কৃষি, গৃহস্থালি ইত্যাদি সংক্রান্ত বহু শব্দ মগ, বাংলা ও বাংলাদেশের অনেক উপজাতীয় ভাষায়, এমনকি দক্ষিণপূর্ব এশিয়ার অন্যান্য ভাষায়ও এক কিংবা প্রায় এক। যথা: পিড়া, তুরুং (বাক্স), লঙ্গি, ধুতি, চেরুট ইত্যাদি মগশব্দের বাংলা উচ্চারণ যথাক্রমে পিড়া/পিড়ি, তুরং, লঙ্গি/লুঙ্গি, ধুতি, চুরুট ইত্যাদি। বর্মি ও মগ ভাষায় বার ও মাসের নাম এবং সংখ্যাগণনা অভিন্ন। মগরা আরাকানে থাকতেই বাংলা ভাষা ও সংস্কৃতির সঙ্গে পরিচিত ছিল, কারণ মধ্যযুগে আরাকানে বাংলা ভাষা ও সাহিত্যের চর্চা হতো। মগরা বাংলা, বিশেষত চাটগেঁয়ে বাংলা, আরাকানি ও বর্মি ভাষায় সমান দক্ষতায় বাক্যালাপ করতে পারে। চট্টগ্রাম, নোয়াখালী, ফেনী, কুমিল্লা, ফরিদপুর ও বরিশালের আঞ্চলিক ভাষা ও মগভাষার মধ্যে পারস্পরিক প্রভাব লক্ষণীয়। ব্রহ্মদেশীয় বৌদ্ধ মতবাদ ও মগদের ধর্মীয় মতবাদ এক বলে বর্মি ভাষার প্রতি মগদের আকর্ষণ বেশি। তারা মঠে-বিহারে পালি ভাষা শেখে এবং ধর্মশিক্ষা গ্রহণ করে, কিন্তু তাদের শিক্ষার মাধ্যম বর্মি ভাষা।
মগ ভাষায় সৃজনশীল সাহিত্য না থাকলেও লোকসাহিত্যের উপাদান আছে প্রচুর। এতে রয়েছে প্রবাদ, ধাঁধা, উপকথা, গীত, ভূতের গল্প, জাতকের গল্প, বৌদ্ধ রাজা-রানীদের কাহিনী ইত্যাদি। গল্পগীতিপ্রিয় মগরা অবকাশ মৌসুমে রাতভর গল্প শোনে, বাদ্যসহ নাচগান করে এবং বাংলা যাত্রা গানের মতো ‘পাওয়ে’ নামক এক ধরনের অভিনয়ে অংশগ্রহণ করে। কোনো কোনো গল্প আবার বর্মি অক্ষরে লিখিত।
মণিপুরী ভাষা মোঙ্গলীয় ভাষা-পরিবারের তিববতি-বর্মি শাখার কুকি-চীন গোষ্ঠীভুক্ত প্রায় ৩,৫০০ বছরের প্রাচীন ভাষা। মৈতৈ জাতির নামানুসারে উনিশ শতকের পূর্বার্ধ পর্যন্ত এ ভাষার নাম ছিল মৈতৈ; অতঃপর মণিপুরী নামে অভিহিত হয়। মূল মৈতৈ বর্ণমালায় বর্ণ ছিল ১৮টি, পরে আরও সংযোজিত হয়। বর্মি-আরাকানি বর্ণমালার মতো মৈতৈ বর্ণমালাও মানুষের অঙ্গ-প্রত্যঙ্গের নাম ও বৈশিষ্ট্য অনুযায়ী উচ্চারিত হয়। এর বর্ণগুলি তিববতি বর্ণমালার অনুরূপ। আঠারো শতকে মহারাজা গরীব নেওয়াজের সময় বৈষ্ণবধর্ম রাষ্ট্রীয় ধর্মের রূপ নিলে মৈতৈ তথা মণিপুরী ভাষা বঙ্গাক্ষরে লেখা শুরু হয়, যা আজও অব্যাহত। উভয় ভাষায় ধ্বনিতাত্ত্বিক মিল আছে বলেই তা সম্ভব হয়েছে।
মণিপুরী ভাষা ও সাহিত্যের উদ্ভবযুগের প্রথম নিদর্শন গীতিকবিতা ‘ঔগ্রী’। তৎপূর্বে বিচিত্র প্রেমগীত, প্রবাদ-প্রবচন, পালাগান, ছড়া ইত্যাদির প্রচলন ছিল। প্রেমগীতগুলি বেশ কাব্যময়। এগুলি যুবক-যুবতীরা বাদ্যনৃত্যযোগে দলবদ্ধভাবে পরিবেশন করে। মণিপুরী ভাষায় প্রচুর সামরিক সঙ্গীত এবং কতিপয় নাটক, উপন্যাস, ছোটগল্প, কাব্য, এমনকি মহাকাব্যও রচিত হয়েছে। এ ভাষায় বাংলা ও পাশ্চাত্যের বিশেষ বিশেষ গ্রন্থ এবং রামায়ণ, মহাভারত অনূদিত হয়েছে। ভারতের মণিপুরে এ ভাষা রাষ্ট্রভাষা এবং অন্যতম ভারতীয় জাতীয় ভাষা। উনিশ শতকের মধ্যভাগে প্রকাশিত George Gordon-এর A Dictionary of English, Bengali and Manipuri মণিপুরী ভাষার প্রথম মুদ্রিত গ্রন্থ।
মণিপুরী একটি সংকর ভাষা। বাংলাদেশ, ত্রিপুরা, আসাম ও ব্রহ্মদেশে ২০-২৫ লক্ষ লোক এ ভাষায় কথা বলে। বর্তমানে বৃহত্তর সিলেটে মণিপুরীভাষীর সংখ্যা প্রায় অর্ধ লক্ষ। বিক্ষিপ্ত বসতির কারণে বাংলাদেশের শিক্ষাপ্রতিষ্ঠানে মণিপুরী ভাষা পড়ানো সম্ভব নয়।
মুন্ডা ভাষা অস্ট্রো-এশীয় ভাষা পরিবারের অন্তর্ভুক্ত এবং ভারতীয় আর্যভাষা থেকেও প্রাচীনতর। এ ভাষা উড়িয়া, অসমিয়া ও বাংলা ভাষার প্রাথমিক ভিত রচনা করেছে। খাসিয়া, গারো, সাঁওতাল, কোল ইত্যাদি উপজাতীয় ভাষার সঙ্গে মুন্ডা ভাষার সম্পর্ক লক্ষণীয়। অসংখ্য মুন্ডা শব্দ বাংলা ভাষায়, বিশেষত আঞ্চলিক ভাষায় বিদ্যমান। বাংলা বাগ্ভঙ্গির ওপর মুন্ডা ভাষার প্রভাব আছে। কৃষি, গৃহস্থালী, বসতি, গণনা, আত্মীয়তা, ওজন, ভূমি, পশুপাখি, গাছগাছড়া ইত্যাদি সংক্রান্ত শব্দ মুন্ডা তথা অস্ট্রো-এশীয় ভাষা থেকে আগত।
মুন্ডা ভাষা ব্যাপক অঞ্চল জুড়ে চালু ছিল বলে এর আঞ্চলিক রূপও ছিল। দক্ষিণ বিহার ও উড়িষ্যার সংলগ্ন অঞ্চলে, মধ্য প্রদেশ ও পশ্চিমবঙ্গে প্রায় এক কোটি লোক মুন্ডা ভাষায় কথা বলে। বাংলাদেশে এদের সংখ্যা ১৫-২০ হাজার। তিন-চার হাজার বছর পূর্বে মুন্ডারা Pidgin ভাষা হিসেবে পেশা ও জীবিকার প্রয়োজনে প্রথম মুন্ডা ভাষা ব্যবহার করে। পরে তা কৃষি ও উন্নত শিকারপদ্ধতি প্রবর্তনের মাধ্যমে দক্ষিণপূর্ব এশিয়ায় ছড়িয়ে পড়ে। পরবর্তী পর্যায়ে ওই Pidgin ভাষা প্রতিষ্ঠিত রূপ নেয় এবং আরও পরে স্বীকৃত আঞ্চলিক, লিখিত ও সাহিত্যের ভাষা হয়ে ওঠে।
অনার্য মুন্ডা ভাষার সঙ্গে বাংলার ধ্বনিতত্ত্ব, রূপতত্ত্ব ও পদক্রমের ব্যাপক সাদৃশ্য রয়েছে। মুন্ডা ভাষায় দ্বিস্বরধ্বনির (dipthong) আধিক্য আছে; স্বরধ্বনিও অনুনাসিক হতে পারে। স্বরসঙ্গতি আছে। যুক্ত ব্যঞ্জন এবং ণ, ড়, ঢ় ধ্বনি শব্দের আদিতে নেই। মুন্ডায় শব্দদ্বৈতের বাহুল্য আছে, স্ত্রী-পুরুষবাচক শব্দ বসিয়ে লিঙ্গান্তর করা হয়। একই শব্দকে দ্বিত্ব উচ্চারণ করে বহুবচন করার প্রবণতা আছে। অনুরূপ ভাষাগত বৈশিষ্ট্য বাংলাতেও লক্ষণীয়। মুন্ডা ও বাংলায় কারক-বিভক্তির ব্যবহার অনেকটা অনুরূপ। মুন্ডা ও বাংলায় ১০ পর্যন্ত সংখ্যাগুলির ব্যুৎপত্তি এক। ‘হালি’ এবং ‘কুড়ি’ বাংলার মতো মুন্ডায়ও গণনার একক। বাংলার মতো মুন্ডা ভাষায়ও সর্বনামের লিঙ্গান্তর নেই। খ্রিস্টান মিশনারিদের প্রকাশিত Mundari-English Dictionary-র মাধ্যমে মুন্ডা ভাষার ব্যাপক পরিচয় পাওয়া যায়।
সাঁওতালী ভাষা অস্ট্রো-এশীয় ভাষাগোষ্ঠীর প্রাচ্য শাখার অন্তর্ভুক্ত। প্রায় দশ হাজার বছর আগে অস্ট্রেলিয়া থেকে ইন্দোনেশিয়া হয়ে ব্রহ্মদেশ ও আসামের ভেতর দিয়ে অস্ট্রো-এশীয় জনগোষ্ঠী ভারত উপমহাদেশে ছড়িয়ে পড়ে। বিহারের সাঁওতাল পরগনায় সাঁওতালভাষী জনসংখ্যা প্রায় এক কোটি। পশ্চিমবঙ্গের বিহার-সীমান্তবর্তী জেলাগুলিতে এবং বাংলাদেশের উত্তর-পশ্চিম অঞ্চলে, দিনাজপুর, রাজশাহী ও রংপুরে বিক্ষিপ্তভাবে প্রায় সোয়া লক্ষ সাঁওতালভাষী লোকের বাস আছে। তারা বাংলায় সাবলীলভাবে কথা বলতে পারে এবং নিজেদের ভাষায়ও বহু বাংলা শব্দ ব্যবহার করে। সাঁওতাল ও মুন্ডা ভাষার মূল এক ও পরস্পর সম্বন্ধযুক্ত। সাঁওতাল ভাষার দুটি উপভাষা আছে নাহিলি ও করকু। এটি অক্ষরহীন ভাষা। ভারতে এখন সাঁওতালী ভাষা দেবনাগরী অক্ষরে লিখিত হয় এবং বহু হিন্দি উপাদান এতে অনুপ্রবিষ্ট হয়েছে। ইংরেজ আমলে সাঁওতালীতে রোমান হরফ চালু হয়েছিল। বাংলাদেশে সাঁওতালী বই-পুস্তক নেই। খ্রিস্টান মিশনারিরা দু-একটি সাঁওতাল বিদ্যালয় স্থাপন করে ইংরেজি বর্ণমালায় সাঁওতালী ভাষা শিক্ষা দিচ্ছে। শিক্ষিত সাঁওতালরা বাংলা ও ইংরেজি অক্ষরে সাঁওতালী লেখে; তবে ধ্বনিগত মিলের কারণে তারা বাংলা অক্ষরে লিখতেই স্বাচ্ছন্দ্য বোধ করে।
সাঁওতালী ভাষার প্রায় সব ধ্বনিই বাংলায় রয়েছে। অন্যান্য ব্যাকরণিক মিলও আছে। মুন্ডার মতো সাঁওতালীতেও স্বরবর্ণ অনুনাসিক হতে পারে। পুংলিঙ্গ ও স্ত্রীলিঙ্গ বোঝানোর জন্য ভিন্ন শব্দ ব্যবহূত হয়। স্ত্রী প্রত্যয় (ই/ঈ) যোগেও সাঁওতালীতে লিঙ্গান্তর হয়, কিন্তু তা আর্যপ্রভাবের ফল। মূল সাঁওতালী ভাষায় শব্দান্তে প্রত্যয় যোগের কোনো প্রক্রিয়া নেই। সাঁওতালীতে প্রাণী ও অপ্রাণিবাচক সর্বনাম ভিন্ন ভিন্ন। সাঁওতালী, কোল, মুন্ডা ইত্যাদি ভাষা বাংলা থেকে তো বটেই, ভারতীয় আর্যভাষা থেকেও প্রাচীনতর। আর্যভাষায় অনার্য ভাষার বহু শব্দ সংস্কারের মাধ্যমে অনুপ্রবিষ্ট হয়েছে। মানবাংলায় ও আঞ্চলিক উপভাষায় বহু সাঁওতালী শব্দ রূপান্তরিত অবস্থায় আজও বিদ্যমান। খ্রিস্টান মিশনারিদের An Introduciton to the Santal Language (১৮৫২), A Grammar of the Santal Language (১৮৭৩) এবং পি.ও বডিং-এর দুখন্ডে Materials of the Santal Grammar (১৯২৯) গ্রন্থে সাঁওতালী ভাষার উৎস, শব্দকোষ ও ব্যাকরণ আলোচিত হয়েছে।
তথ্যসূত্র: বাংলাপিডিয়া